H3C-人工智能解决方案介绍.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《H3C-人工智能解决方案介绍.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- H3C 人工智能 解决方案 介绍
- 资源描述:
-
1、logoH3C 人工智能平台解决方案02人工智能需求背景01H3C 人工智能解决03案例分享AI无处不在无人驾驶媒体、娱乐生命科学工业机器人人工智能三大要素1.深度学习算法:神经网络算法2.大数据:15万职业棋手棋谱+百万业余棋手棋谱3.超算体系:1202个CPU+176个GPU+高速互联算据算法算力深度学习是人工智能的子集 l 机器学习的典型特征为利用简单模型描述复杂特征l 深度学习的典型特征是通过简单特征加上复杂模型l 深度学习是一种实现机器学习的技术,计算能力增强解决了机器学习的瓶颈,从而推动深度学习的蓬勃发展,目前人工智能前沿是在深度学习Artifical Intelligence 人
2、工智能Machine Learning机器学习Deep Learning深度学习深度学习的计算需求6Step1:训练阶段Step2:推理阶段高性能集群计算单机和边缘计算模型架构和参数AI平台Cat人工智能模型训练、推理流程用户业务推理服务业务训练数据AI训练平台AI模型AI模型AI模型在线预测部署输入生成发布模型评估AI模型模型库 AI全栈式方案基础平台服务基础平台服务(AIAI产品)产品)机器学习机器学习 深度学习深度学习通用服务通用服务(算法模型)(算法模型)图像识别图像识别 目标检测目标检测 OCROCR、NLPNLP 语音识别语音识别行业场景解决方案行业场景解决方案(行业业务系统或者应
3、用)(行业业务系统或者应用)智能税务智能税务 智能公安智能公安 智能检务智能检务 智能金融智能金融业务问题业务问题AIAI建模建模模型训练模型训练模型评估模型评估模型发模型发布部署布部署服务服务应用应用(机器学习 /深度学习)教育公安信用AI企业用户面临的挑战GPU是AI科研必不可少的、紧缺且昂贵的部件;GPU资源缺少统一管理和调度,硬件资源利用率低AI相关的软件组件众多,数据建模和训练以及部署复杂;易用性较差、问题定位困难、无法聚焦算法研究机器/深度学习算法库和算法框架繁多,无从选择TensorFlow/Caffe/MXNet/等;无法训练出高质量的模型,科研水平难以提升开发上手困难科研效率
4、低算法框架选择困难算法价值无法体现GPU管理困难教学科研成本高01人工智能需求背景02H3C 人工智能解决方案03案例分享H3C AIOS 人工智能平台三大应用场景云上AI服务人工智能平台AI一体机为CloudOS云平台的人工智能服务,和大数据平台、云平台共提供ABC融合方案主要数字化转型的企事业单位,智慧类项目面向科研市场,搭建人工智能实验室等科研场所,需求大规模AI集群的应用场景主要面向教育行业和研究所基于H3C UIS 5300 G3 和AIOS软件产品共同推出软硬件一体化的AI解决方案,主要面向构建AI基础机构的传统及新型企业p 我们目前聚焦AI平台层,提供平台产品,上层的行业场景化A
5、I服务,可合作。H3C AIOS 人工智能产品系统架构管理员/用户AI API ServiceAI Resource Manager Service(基于kubernetes+docker的H3C容器平台)平台层应用层通用AI应用图像/视频/语音/自然语言处理/数据管理模型训练在线/离线开发可视化模型验证AI市场超参数搜索模型评估AI组件层计算框架模型托管模型部署在线预测服务服务监控服务使用者云计算资源池服务器存储网络异构计算资源池GPUFPGATPU作业调度集群分区存储服务多级配额 任务流引擎日志服务ML/DL算法库镜像仓库行业解决方案智慧金融/医疗/公安/气象/TensorflowCaff
6、eCaffe2PyTorchMXnet更易用的AI平台模型训练在线推理 算法机器/深度学习库多框架 算力GPU硬件赋能云计算资源池 H3C AIOS人工智能平台核心功能人工智能平台AIOS提 供 深 度 学 习 可 视 化 训 练 平 台(H o r o v o d 分 布 式 特 性,集 成TensorFlow、Pytorch等框架),支持多机多卡,支持RDMA特性、超参搜索,内置通用框架组件及模板可视化训练环境支持在线/离线开发、拖拽式和编码式建模,支持远程桌面和SSH等连接方式;支持JupyterLab交互式编程,支持用户自定义开发环境自定义开发环境提供统一的模型库管理以及模型部署服务,
7、支持多种模型格式的在线推理服务,支持多实例部署模式统一推理环境为多租户提供开发环境和存储资源的统一调配及安全隔离;对GPU计算资源提供统一的资源共享及调度模式支持人工智能平台AIOS统一监控运维AI建模体系统一开发环境:编码式建模离线环境在线环境镜像选择:用户可以使用内置镜像或者是自定义镜像目录挂载:支持用户空间工作目录挂载jupyterlab:内置镜像支持jupyterlab/jupyter平台端本地开发命令行:文件上传命令行:提交训练命令行:查看训练日志统一开发环境:拖拽式建模任务流引擎调度器Scheduler节点Executor作业DriverJobHandler(通用pod执行组件)C
8、ontainer(task1)Container(task2)数据算子数据算子算法库数据处理深度学习机器学习模型评估用户空间数据脚本公共文件n易用性:拖拉拽式任务流建模,支持内置算法组件,支持用户自定义脚本训练;n扩展性:算法组件可扩展、作业类型可扩展;用户自定义组件(规划中);n灵活性:支持全局变量、内置变量;支持手动运行、批量运行、定时运行;n可控性:任务流引擎与用户资源配额相结合,满足平台对用户的资源控制。深度学习开发平台在线编辑系统提供web端脚本在线编辑器,并提供常用API的代码自动补全功能,方便用户随时调整训练脚本,修改网络结构,并及时运行脚本可视化训练提供可视化的深度学习训练过程
展开阅读全文