阿里云:让异构计算走上云端 推动AI发展

本文讲的是阿里云:让异构计算走上云端 推动AI发展【IT168 评论】算法、数据和计算力是人工智能发展的三大要素。如果将人工智能比作一艘火箭,那么算法就是控制台,数据是燃料,计算力则是加速引擎。随着人工智能对计算需求的不断提升,传统计算已无法满足要求,于是异构计算应运而生,异构计算的并行效率和计算峰值超越了传统计算很多倍,是支持人工智能深度学习或数据分析的主要力量。

  国内首屈一指的云服务供应商阿里云早先曾发布了异构计算解决方案,为客户提供高效率、低延迟的实时计算及灵活弹性的异构资源。近日更是推出了全新一代的异构加速平台,为人工智能产业提供多场景化的全球加速能力,涵盖了GPU、FPGA在内的6款异构实例。特别在深度学习领域,可以将其成本缩减一半,大幅降低人工智能计算的门槛。

  在首届人工智能计算大会(AICC 2017)AI+计算创新论坛上,阿里云高性能计算/异构计算高级技术专家游亮为我们分享了阿里云高性能计算和异构计算解决方案。


▲阿里云高性能计算/异构计算高级技术专家游亮发表主题演讲

  异构计算在阿里巴巴的应用

  异构计算在阿里巴巴集团的应用,包括淘宝天猫上的拍照购,包括商品风格预测、图片质量控制、CRT预估、千人千面、人脸识别、内容鉴定、图片创意、图像搜索、OCR语音识别等。阿里巴巴建立了一个异构计算的集群,所使用的基本是M40和P100的企业级GPU加速卡。建立了一个统一的资源管理调度监控服务,并在集群上支持了容器服务,让容器去支持GPU的自动调度,也支持容器的一键部署。同时,也对集团内的应用也提供了很多性能优化服务。

  “从2013年开始,我们开始服务集团内的深度学习客户,也在集团内建立了一个深度学习的异构计算集群,到2016年,我们则开始着手把集团内的异构计算平台服务能力在公共云上对外提供开放和输出。”游亮说。

  阿里云异构计算能力的对外输出

  在人工智能大浪潮下,很多企业开始做人工智能方面的创新。而计算能力往往会成为一个巨大的问题,有些企业会选择自建如GPU集群等,但这也会遇到很多问题,包括选型难、采购周期长、机器维护困难等。为了帮助众多人工智能新兴企业解决这些痛点,阿里云推出了弹性GPU服务,把CPU与GPU的优势结合起来,在云上进行统一虚拟化,让GPU计算成为一个统一的计算资源池。企业可以随买随用,根据实际业务需求对异构计算资源进行弹性伸缩。

  阿里云推出了最为全面的异构计算产品线,可满足深度学习训练、推理、图像处理、视频处理等不同的需求。同时,GPU计算服务与阿里云产品体系是深度整合的,可以与阿里云上的ECS弹性计算实例、OSS对象存储、NAS文件存储、SLB负载均衡等产品结合,在云上完成深度学习的整个过程,形成数据闭环。

  除了GPU计算实例之外,阿里云也推出了FPGA as a Service(FaaS)的服务。深度结合FPGA在高性能功耗比、低延迟数据交互和访问、硬件加速、硬件可编程等方面的优势,在云上推出了FPGA弹性云服务器和开发环境,并建立了FPGA镜像市场,为了让更多开发者能够享受到FPGA开发的收益,推动建立和繁荣丰富的FPGA生态,最终加速人工智能的发展。

  除此之外,阿里云也推出了IaaS+服务,包括统一的异构资源调度产品E-HPC,保证应用对于异构资源的合理利用,大大提高异构资源利用率,同时也正在自研和优化开源的深度学习框架帮助客户实现多个场景下的性能优化,提高计算效率,降低延迟。

  在加速人工智能发展方面,异构计算扮演着重要的角色。阿里云也正深耕异构计算市场,推出了弹性GPU云服务器和FaaS解决方案及IaaS+和性能优化服务,帮助企业更加灵活、弹性地使用异构计算的能力,将异构计算变成一种普适性的计算,加速人工智能发展,进而推动产业升级和社会进步,改变人们的生活、生产方式。

原文发布时间为:2017-09-20

本文作者:谢涛

原文标题:阿里云:让异构计算走上云端 推动AI发展

时间: 2024-09-16 01:16:38

阿里云:让异构计算走上云端 推动AI发展的相关文章

运用大数据建设云平台 铜仁高新区精准扶贫走上“云端”

铜仁高新区作为省级高新技术产业开发区,深入贯彻习近平总书记"四个切实"."五个一批"."六个精准"重要指示精神,全面落实省委.省政府提出的大扶贫.大数据两大战略行动,按照科学治贫.精准扶贫.有效脱贫要求,让精准扶贫走上"云端". 2015年底,我市与浪潮软件集团有限公司及省国土厅合作,启动了"铜仁精准扶贫云"框架结构建设."铜仁精准扶贫云"是在充分吸纳"贵州省扶贫云"

阿里云发布异构计算产品家族,你可以在上面模拟核爆炸

本文讲的是阿里云发布异构计算产品家族,你可以在上面模拟核爆炸 数据.算力和算法,这是人工智能发展的三大要素. 近一年来,人工智能迎来了史上第三次热潮.移动互联网时代沉淀下来的大量数据和GPU近几年的快速发展,让学界和业界相信,这人工智能时代真的要来了. 由于人工智能模型训练对算力的要求,原有的通用型CPU架构无法满足,不少企业或科研机构在训练模型的时候会通过采用和主处理器(CPU)不同架构的加速器件(也就是所谓"异构"),如GPU.FPGA.ASIC等器件,提供高密度并行计算的运算能力

阿里云联手神州数码打造云端智慧城市

本文讲的是阿里云联手神州数码打造云端智慧城市[IT168资讯]1月29日,阿里云计算与神州数码签署战略合作协议,双方将在智慧城市.政府.大企业等领域开展全方位合作,通过资源互补形成产业合力.同时,神州数码将以战略合作伙伴身份加入阿里云云合计划,共同推动中国云计算生态体系的完善. 根据协议,神州数码将围绕阿里云平台开展技术研发,为政企客户提供基于阿里云的应用和服务;阿里云为神州数码提供相关技术支持. 协议还约定双方将共享市场资源,建立神州数码和阿里云平台相结合的市场推广机制,利用各自领域优势,通过

阿里云发布异构计算解决方案:弹性GPU实例及FPGA解决方案

1月21日,阿里云发布异构计算解决方案:弹性GPU实例和FPGA解决方案.它们能为客户提供高效率.低延迟的实时计算.在数据安全性有保障的前提下,提供灵活弹性的异构计算资源.弹性GPU产品2016年底开放邀测以来,视频.渲染和计算等领域众多用户已在使用. 弹性GPU实例 弹性GPU实例是阿里云为客户定制的支持多家GPU的弹性计算GPU系列产品. 性能介绍 以最新的弹性GPU实例来看,它可以灵活提供2048到8192个并行处理核心,搭配32GB的DDR5显存,最高提供15.08TFOPS单精度和1T

服务器 tomcat-怎么将用eclipse做的项目发布到阿里云的jsp服务器上

问题描述 怎么将用eclipse做的项目发布到阿里云的jsp服务器上 已将项目复制到服务器上 server.xml 也配置过了 数据库也配置过了 项目还是不能运行 求解决-- 解决方案 jsp服务器,是啥服务器?

阿里云ECS服务器CentOS7上安装Apache服务

阿里云ECS服务器CentOS7上安装Apache服务 ---------------------------------------------- 使用root登录 1.确保服务器系统处于最新状态 [root@localhost ~]# yum -y update 如果显示以下内容说明已经更新完成 Replaced:   grub2.x86_64 1:2.02-0.64.el7.centos   grub2-tools.x86_64 1:2.02-0.64.el7.centos        

阿里云ECS服务器CentOS7上安装MySql服务

阿里云ECS服务器CentOS7上安装MySql服务 ---------------------------------------------- 使用root登录 1.确保服务器系统处于最新状态 [root@localhost ~]# yum -y update 如果显示以下内容说明已经更新完成 Replaced:   grub2.x86_64 1:2.02-0.64.el7.centos   grub2-tools.x86_64 1:2.02-0.64.el7.centos Complete

阿里云ECS服务器CentOS7上系统安全加固

阿里云ECS服务器CentOS7上系统安全加固 ---------------------------------------------- 使用root登录 1.确保服务器系统处于最新状态 [root@localhost ~]# yum -y update 如果显示以下内容说明已经更新完成 Complete! 2.重启服务器 [root@localhost ~]# reboot # 寻找空密码的用户 [root@localhost ~]# awk -F: '($2==""){prin

阿里云ECS服务器CentOS7上用户管理操作

阿里云ECS服务器CentOS7上用户管理操作 ---------------------------------------------- 使用root登录 # 查看系统中所有用户 [root@localhost ~]# cut -d : -f 1 /etc/passwd # 查看可以登录系统的用户 [root@localhost ~]# cat /etc/passwd | grep -v /sbin/nologin | cut -d : -f 1 # 查看登录用户 [root@localho