AI开发
更新时间:2024-02-19 15:11:04- 开发流程
- 快速开始(QuickStart)
- 智能标注(iTAG)
- 特征平台(FeatureStore)
- 可视化建模(Designer)
- 交互式建模(DSW)
- 分布式训练(DLC)
- 自动机器学习(AutoML)
- 模型在线服务(EAS)
- 场景化解决方案
- AI开源项目
开发流程
更新时间:2024-02-19 15:11:04 进入工作空间后,您可以使用PAI子产品进行AI开发。本文介绍如何快速上手并使用PAI及常用的AI开发流程,您可以结合实际情况选择。快速开始
您可以通过快速开始快速上手并体验PAI的训练和部署流程,详情请参见快速开始概述。 如果您想更详细地了解并使用PAI的子产品(Designer、DSW、DLC、EAS等),详情请参见AI开发流程。AI开发流程
进入工作空间后,在左侧导航栏可以看到PAI的全部子产品模块。您需要根据实际开发场景进行机器学习全生命周期的开发和管理。常见的使用场景如下所示,您可以按照流程引导,使用子产品模块:- 云原生开发场景
区域 | 描述 | 相关文档 |
---|---|---|
① | 高质量的数据集是高精度模型的基础,也是数据准备的核心目标。您可以通过数据集管理模块将本地数据、阿里云存储中的数据以及公共数据集进行注册,也可以通过扫描OSS文件夹生成索引数据集,从而统一管理PAI的相关数据,为数据标注及模型训练环节做好准备。 | 创建及管理数据集 |
② | DSW是为AI开发者量身定制的云端机器学习交互式开发IDE,可以随时随地开启Notebook快速读取数据、开发算法、训练及部署模型。 | DSW概述 |
③ | 镜像管理模块为您展示PAI提供的官方公开镜像以及自定义镜像关联功能,从而在PAI中统一管理应用的镜像。 | 自定义镜像 |
④ | 云原生一站式的深度学习训练平台,提供灵活、稳定、易用和高性能的机器学习训练环境。支持多种算法框架,超大规模分布式深度学习任务的运行以及自定义算法框架。 | DLC概述 |
⑤ | 为了方便您在提交任务时指定所需的数据集和代码仓,PAI支持添加文件系统NAS或对象存储OSS的数据集以及Git代码仓。 | 准备工作 |
⑥ | 模型管理模块统一管理训练完成的模型,并直接对接模型在线服务(EAS)。您可以将模型直接部署为在线服务。 | 注册及管理模型 |
⑦ | PAI平台的模型在线预测服务,支持异构硬件(CPU和GPU)模型加载,高吞吐低延迟,大规模复杂模型一键部署及实时弹性扩缩容。说明目前EAS产品不支持使用DSW镜像和CPFS类型的数据集。 | EAS概述 |
- AI+大数据最佳实践
区域 | 描述 | 相关文档 |
---|---|---|
区域 | 描述 | 相关文档 |
---|---|---|
① | 使用MaxCompute存储数据,首先在DataWorks中对数据进行预处理,然后PAI引用MaxCompute表作为数据源进行模型训练。 | - 创建表 - 导入数据 - 通用数据开发 |
② | Designer支持大规模分布式的传统机器学习、深度学习、强化学习训练,支持流批一体训练,该子模块封装了上百种机器学习算法,您可以拖拽式建模、自动调参,从而无编程玩转人工智能。 | Designer概述 |
③ | DataWorks根据配置的调度和时间属性等参数,周期调度任务。 | - 调度参数支持的格式 - 时间属性配置说明 |
④ | 任务管理支持将Designer的实验数据或自定义任务的执行信息记录到PAI提供的任务管理服务中,从而便于进行任务间的实验比较。 | 任务管理 |
⑤ | 模型管理模块统一管理训练完成的模型,直接对接模型在线服务(EAS),您可以直接将模型部署为在线服务。 | 注册及管理模型 |
⑥ | PAI平台的模型在线预测服务,支持异构硬件(CPU和GPU)模型加载,高吞吐低延迟,大规模复杂模型一键部署及实时弹性扩缩容。说明目前EAS产品不支持使用DSW镜像和CPFS类型的数据集。 | EAS概述 |