登录 / 注册
IT168服务器频道
IT168首页 > 服务器 > 服务器资讯 > 正文

浪潮发布AI深度学习训练集群管理软件

2017-05-10 17:49    it168网站原创  作者: 厂商投稿 编辑: 谢涛

  【IT168 资讯】5月9日,浪潮在美国圣何塞举行的2017 GPU技术大会(GTC17)上正式发布了人工智能深度学习训练集群管理软件——AIStation。


▲浪潮在GTC17发布人工智能深度学习训练集群管理软件AIStation

  该软件可以支持多种深度学习框架,快速部署深度学习训练环境,全面管理深度学习训练任务,实现对计算集群的CPU、GPU资源进行统一的管理、调度及监控,有效的提高计算资源的利用率和生产率,为深度学习用户提供高效易用的平台。


▲AIStation架构图

  人工智能深度学习训练流程较长、开发环境较复杂,涉及数据准备和处理、特征工程、建模、调参等多个步骤及多个框架和模型,每个框架依赖环境不同且有可能交叉使用。同时,深度学习模型在训练时往往耗时较长,短则数小时长则数天,以往在训练完成后才意识到模型存在问题,大大耗费了用户的精力和时间。


▲GTC17现场与嘉宾进行沟通交流

  浪潮AIStation可以提供从数据准备到分析训练结果的完整深度学习业务流程,支持Caffe、TensorFlow、CNTK等多种计算框架和GoogleNet、VGG、ResNet等多种模型,支持对训练过程实时监控并可视化训练过程,支持打印每一步的损失函数值的日志、训练误差或测试误差等,支持动态分配GPU资源实现资源合理共享,实现了“一键式”部署深度学习计算环境、快速启动训练任务,实时监控集群的使用情况,合理安排训练任务,可及时发现运行中的问题,提高集群的可靠性。


▲AIStation核心价值

  浪潮一直以来深耕人工智能计算平台,已具备覆盖单机2\4\8卡在内的业界最全GPU服务器产品线,日前和百度联合发布了面向更大规模数据集和深层神经网络的超大规模人工智能计算平台SR-AI整机柜服务器,可实现单机16块GPU加速卡扩展,并是唯一可提供FPGA加速卡的主流服务器厂商。

  目前,浪潮已是全球Super7互联网公司中的三家(Baidu、Ali和Tencent)的AI GPU服务器的主要供应商,并与科大讯飞、奇虎360、搜狗、今日头条、Face++等人工智能领先公司保持在系统与应用方面的深入紧密合作,帮助客户在语音、图像、视频、搜索、网络等方面取得数量级的应用性能提升。

  • IT168企业级IT168企业级
  • IT168文库IT168文库

扫码送文库金币

编辑推荐
系统架构师大会
系统架构师大会
点击或扫描关注
IT168企业级微信关注送礼
IT168企业级微信关注送礼
扫描关注
首页 评论 返回顶部