阿里云机器学习PAI基本概念

本文将为您介绍机器学习PAI中的基本概念,各概念标题的括号中注明了该概念属于哪一个子产品版块。

PAI-Studio

项目

PAI Studio依赖于项目,在PAI-Studio的一个Region中,用户可以创建多个项目,用于实现资源、权限、实验的隔离与管理(主账号可对子账号进行项目授权)。如何创建项目可参考创建PAI-STUDIO项目 。

实验

在一个机器学习项目中,用户可以创建多个实验,用以构建算法模型。离线调度以实验为单位。

机器学习中的表是存储在MaxCompute中的,即MaxCompute的数据存储单元。它在逻辑上也是由行和列组成的二维结构,每行代表一条记录,每列表示相同数据类型的一个字段,一条记录可以包含一个或多个列,各个列的名称和类型构成这张表的Schema。
您可以在机器学习平台上创建、收藏表并导入数据,该表会自动存储在MaxCompute平台上。需要进入MaxCompute平台删除所创建的表。

PAI-DSW

实例

实例是DSW用户进行开发(如数据读取、算法开发、模型训练)的基本操作空间单元,也是资源以及存储的关联基本单元。用户在开始代码编辑之前,需要先创建DSW实例。

PAI-EAS

资源组

在EAS中,集群资源会被分为不同的资源组进行隔离,在新建模型服务的时候,用户可以选择部署在默认的公共资源组还是部署在用户自行购买创建的专属资源组中。

模型服务

模型文件+在线预测逻辑部署成的常驻服务,用户可以对模型服务进行创建、更新、停止、启动、扩缩容等操作。

模型文件

指您通过离线训练得到的离线模型,基于不同的框架会得到不同的模型格式,通常和Processor一起部署得到模型服务。

Processor

Processor是包含在线预测逻辑的程序包,通常和模型文件一起部署得到模型服务,EAS已经针对常用的PMML、TensorFlow(SavedModel)、Caffe模型提供了内置的官方Processor。

自定义processor

EAS内置Processor无法覆盖到用户所有的服务部署需求,可通过自定义processor进行更灵活的拓展,EAS支持通过C++/Java/Python开发自定义processor进行部署。

服务实例

每个服务可以部署多个服务实例以提升服务可支持的并发请求,如果资源组中有多台机器资源,EAS会自动将不同实例分布到不同机器上以更好的保障服务高可用性。

VPC高速直连

在用户的专属资源组和用户自有VPC打通之后,用户可以在自有VPC中通过客户端高速直连访问服务的每个单独的实例。

原创文章,作者:网友投稿,如若转载,请注明出处:https://www.cloudads.cn/archives/33585.html

发表评论

登录后才能评论