AI算力云服务介绍
数据集
海量且高质量的数据是模型训练的基础,提供低成本且高可靠性的OSS标准存储,以及大数据量的数据集管理能力,平台支持新建,编辑及删除数据集的功能
镜像服务
支持系统镜像和自定义镜像,提供不同框架、语言及GPU sdk版本的镜像, 可通过镜像仓库在线构建镜像,支持对镜像地址的查看。
容器实例
支持实例创建功能,提供丰富的算力资源规格、镜像资源供用户选择,支持配置SSH,支持配置挂载数据集。提供容器运行环境,对实例支持交互式调试,可对指标对实例进行监控,支持制作镜像功能,保存到镜像仓库中供使用。
分布式训练
提供分布式训练任务的可视化配置界面,支持节点镜像、挂载、输出、 三方库、环境变量和任务资源配置,任务资源支持多种算法框架,极大 提高开发者的训练效率及资源调优。
模型管理
支持注册新模型或者更新模型版本,通过关联存放在文件存储中的模型文件, 定义相关配置,帮助管理用户自定义模型,便于开发者后续的模型部署。 平台支持模型的新建、删除等功能,也支持一键部署功能
模型部署
支持自定义部署和大语言模型部署两种部署方式,可一键部署模型 对于部署的模型支持在线调试和服务日志的查看,相关人员可根据 模型结果对模型进行在线调试。