华为发布全球最快AI训练集群Atlas900,ResNet训练首次1分钟内完成
原标题:华为发布全球最快AI训练集群Atlas 900,ResNet训练首次1分钟内完成
新智元编辑部
【新智元导读】刚刚,在华为全联接大会上,华为首次发布计算战略,并重磅发布AI训练集群Atlas 900。华为号称这是全球最快的AI训练集群,由数千颗最强算力AI处理器昇腾910互联,总算力达到256-1024 PFLOPS@FP16,相当于50万台PC计算能力!
在刚刚开幕的华为全联接大会上,华为首次发布计算战略,并重磅发布了全球最快AI训练集群Atlas 900。
全球训练最快的AI集群Atlas900有多厉害?
采用算力最强AI处理器昇腾910
Atlas 900 AI训练集群由数千颗昇腾910互联
世界顶级强劲算力:总算力达到256-1024 PFLOPS@FP16。相当于50万台PC计算能力
业界最快:实测仅需59.8秒即可完成基于ImageNet数据集训练ResNet-50模型
全球算力巅峰Atlas 900:相当于50万台PC
去年全联接大会上,华为发布了全栈全场景的AI解决方案,现如今,用于训练的昇腾处理器和AI计算框架MindSpore都已经发布了,这标志着,华为的全栈全场景AI解决方案全面落地。
在今天的全联接大会上,华为发布了一款重量级的产品——Atlas 900,这是当前全球最快的AI训练集群,由数千颗昇腾处理器组成。
Atlas 900 AI训练集群:
采用算力最强AI处理器昇腾910
Atlas 900 AI训练集群由数千颗昇腾910互联
世界顶级强劲算力:总算力达到256-1024 PFLOPS@FP16。相当于50万台PC计算能力
业界最快:实测仅需59.8秒即可完成基于ImageNet数据及训练ResNet-50模型
华为自研HCCS片间互联240Gbps,单端口速率业界领先
采用最新PCIE 4.0接口,速率为当前业界2倍
100GPoCE高速集群互联网络
HCCL通信库+网络拓扑+训练算法=实现线性度>80%
华为Atlas 900 AI训练集群
在衡量AI计算能力的金标准ResNet-50模型训练中,Atlas 900只用了59.8秒就完成了训练,这比原来的世界纪录还快了10秒。这是什么概念?相当于短跑冠军跑完终点,喝完一瓶水才等到第二名。
基于ResNet-50 v1.5模型和 ImageNet-1k数据集的测试数据
ImageNet-1k数据集包含128万张图片,精度为75.9%,在同等精度下,其他两家业界主流厂家测试成绩分别是70.2s和76.8s,Atlas 900 AI训练集群比第2名快15%。
胡厚崑表示:Atlas 900的强大算力,可广泛应用于科学研究和商业创新。比如天文探索、石油勘探等领域,都需要进行庞大的数据计算和处理,原来可能花费好几个月的工作,现在交给Atlas 900,就是几秒钟的事情。
Atlas 900集成的数千颗昇腾处理器,正是前段时间正式商用的昇腾 910。
昇腾910号称算力最强的 AI 处理器,基于 7nm 增强版 EUV 工艺,单 Die 内建 32 颗达芬奇核心,半精度 (FP16) 算力达到 256 Tera-FLOPS,整数精度 (INT8) 算力达到 512 Tera-OPS,而且,达到规格算力所需功耗仅 310W。
Atlas 900总算力达到256-1024 PFLOPS@FP16,相当于50万台PC计算能力。作为对比,谷歌的 TPU 3.0,性能是 100 petaflops。
胡厚崑还分享了一个天文探索的案例。天文研究高度依赖于海量的数据分析和计算,离不开超强的算力支持。
下面这张是南半球的星空图,这张图上有20万颗星星,用人眼是看不见这么多星星的,这些画面来自于SKA射电望远镜的数据。
当前条件下,天文学家要从这20万颗星星中,找出某种特征的星体,相当困难,一个天文学家需要耗费169天的工作量,才能完成这项工作。现在用上Atlas 900,只用10秒,就从20万颗星星中检索出了相应特征的星体。
此外,华为还发布了基于昇腾的华为云EI集群服务。为了让大家马上就能用上Atlas 900的超强算力,它已经被部署到华为云上,并以极优惠的价格向全球科研机构和大学开放。
胡厚崑:华为新一轮沃土计划将投资15亿美元
华为副董事长胡厚崑登台分享了华为在计算方面的洞察与战略。根据Gartner的数据,预计到2023年,计算产业的规模将超过2万亿美元。胡厚崑分享了计算智能时代的三个重要特征:
第一个特征,需要超强的算力。统计计算本身就是一种暴力计算,高度依赖于算力。举个例子,为了让计算机认识一只猫,就需要数百万图片的训练,这对算力的消耗是非常惊人的,面向自动驾驶、天文探索、气象预测等更复杂场景,对算力的需求将会更大。
第二个特征,计算和智能将会无处不在,而不仅仅是分布在中心侧。从中心节点的暴力计算,到边缘侧的专业计算,如基因测序,以及端侧的个性计算,如耳机、手机,一起构成了未来智能时代的计算形态。
第三个特征,端边云之间需要高效的协同。中心侧负责通用模型的计算,为端侧的个性化计算和边缘侧的专业化计算,提供协同支撑。
此外,华为首次发布了计算战略,从四个方面来布局,包括对架构创新的突破、对全场景处理器族的投资,坚持有所为有所不为的商业策略,以及不遗余力地构建开放生态。
架构创新
未来计算无处不在、智能无所不及,这其中算力是关键基础。
而目前产业界算力供给却是稀缺的,算力供给的关键在于处理器的效能,当前摩尔定律已经几乎走到极限的时候,从产业发展角度,我们必须要在处理器架构上寻求突破,要用新的处理器架构来匹配算力的增速。
另一方面,从华为自身的业务布局来看,既有网络业务,也有终端业务,又涉及公有云服务,全面覆盖端、边、云,所以全场景智能,本身就是华为业务智能化的基本需求。
因此,华为推出了达芬奇架构,以实现计算和智能的无处不在,这是自然而然的选择。到目前为止,达芬奇计算架构是业界唯一能够覆盖端、边、云全场景的处理器架构,这也是华为打造计算产业的坚实基础。
投资全场景处理器
处理器是整个计算产业最基础的部分,经过多年投资努力,华为已经发布了多个系列的处理器。
具体包括支持通用计算的鲲鹏系列,支持AI的昇腾系列,支持智能终端的麒麟系列,以及支持智慧屏的鸿鹄系列。未来将持续不断地对处理器进行投资,将来还将推出一系列处理器,面向更多的场景。
商业策略有所为有所不为
华为的商业策略,用一句话概括就是有所为有所不为。总体而言,我们不直接对外销售处理器,以云服务面向客户,以部件为主面向合作伙伴,优先支持合作伙伴发展整机。具体来说,有三个方面的考虑:
硬件开放:我们把服务器主板、AI模组和板卡等硬件开放给伙伴,帮助伙伴做好整机和解决方案。
软件开源:我们把服务器操作系统、数据库、AI开发框架等软件开源,帮助伙伴做好商用版本,让软件开发更简单。
使能应用开发和迁移:我们不做应用,但我们提供工具和团队,帮助伙伴更高效地做好应用开发和迁移。
构建开放生态
胡厚崑表示:计算产业是个开放的产业,高度依赖于生态,需要全球的协作。华为沃土计划发布四年来发展得非常好,目前已汇聚500万开发者,在今天的大会上,华为将正式宣布新一轮的沃土计划,这个计划华为将投资15亿美元。
以华为为代表的中国科技巨头不断蓄力,致力于共创智能新高度,如今AI元力汇聚,我们将重启一个怎样的未来?
当前,边缘计算和工业互联网成为智能+时代的硬核驱动,万物互联的5G、智联网正在启动,全球AI生态系统面临重建。
在此背景下,中国AI产业亦将增强原创能力,技术攻坚,展现出头雁效应。与此同时,在世界范围内秉承开放开源共享共赢的态度已是业界共识,急需重启一个AI无处不在的未来。
今年10月18日(周五),由中关村海淀园管委会&新智元举办的AI World 2019 世界人工智能峰会将在北京•中关村国家自主创新示范区展示中心举办。
作为10月16日-18日举办的2019年中关村论坛中的年度重磅论坛,AI World 2019 世界人工智能峰会以AI元力,重启未来为主题,全球众多人工智能领域产业精英、学术领袖及投资领袖参与支持,共同探讨全球AI新生态格局下,中国AI产业将如何发展。
峰会邀请了华为、微软、科大讯飞、地平线、依图、滴滴出行、ARM等全球人工智能企业的领袖作为讲者,分享对AI产业和发展的真知灼见。
首批嘉宾确认!AI World 2019 世界人工智能峰会邀你重启元力
当前,全球AI生态格局正在面临大变革,无论产业还是学术,中国AI将以更加突飞的姿态成为领头雁,关键核心技术面临新突破。
AI World 2019 世界人工智能峰会邀请的首批嘉宾,聚焦AI热点话题和趋势,届时将为与会者带来精彩演讲。
目前本次峰会确认的首批嘉宾为:
王成录 华为消费者BG软件部总裁
王成录,现任华为消费者BG软件部总裁,负责消费者软件的战略、规划、研发、集成和生命周期管理,致力于不断地为用户提供更优质的体验和服务。2016年底,全新安卓体验的EMUI 5.0发布,其在性能上所做的技术革新,解决了安卓系统一直以来久用卡顿的历史问题,对安卓行业生态的技术发展做出卓越贡献。2018年6月,GPU Turbo技术发布,上市之后的反响超出预期。2019年8月,分布式技术发布,开启以手机为中心的全场景智慧生活。
杨静 新智元创始人、CEO
杨静女士于2015年9月创办新智元,2016年3月出版专著《新智元 机器+人类=超智能时代》,2016年10月联合主办世界人工智能大会,并出版《中国人工智能产业发展报告》。2017年、2018年继续主办世界人工智能峰会,并担任中国人工智能产业发展联盟理事、中国证券投资基金业协会第一届金融科技专业委员会委员等职务。2017年与英特尔联合主办新智元开源·生态技术峰会,2018年主办新智元产业·跃迁技术峰会,2019年主办新智元智能云·芯世界技术峰会。
胡郁 科大讯飞轮值总裁
胡郁,科大讯飞联合创始人,轮值总裁,消费者事业群总裁,核心研发平台总裁。他是中国科学技术大学信号与信息处理专业工学博士,教授级高工;国务院特殊津贴专家;科技部新一代人工智能战略咨询委员会委员;科技部863类人智能重点项目首席专家;语音及语言信息处理国家工程实验室执行主任;中科院人工智能产学研创新联盟应用规划组组长;中国科学技术大学兼职教授、博士生导师;中国人工智能学会副理事长,会士;中文信息学会的常务理事;湖畔大学二期学员。
王永东微软全球资深副总裁、微软 (亚洲) 互联网工程院院长、微软亚太研发集团首席技术官
王永东博士现任微软全球资深副总裁,微软(亚洲)互联网工程院院长,微软亚太研发集团首席技术官。团队的研发工作既有微软的全球产品,也包括亚太地区产品与服务,方向主要涵盖人工智能, 必应(Bing)搜索引擎, 在线广告技术, 语音及自然语言处理技术,大数据,微软Office云服务等领域,并负责为集团设立技术研发策略、愿景及整体方向。
叶杰平 滴滴出行副总裁兼AI Labs负责人
叶杰平,滴滴出行副总裁兼AI Labs负责人,美国密歇根大学教授,他的专业方向为大数据、机器学习、数据挖掘、及其在智能出行和生物医药领域的应用。他是多个国际顶级人工智能会议的资深委员会会员、区域主席和委员会副主席, 他也是多个顶级人工智能期刊的副主编。他于2010年获得美国国家自然科学基金会生涯奖,2017年获得中国计算机学会CCF科学技术奖科技进步卓越奖。他的研究成果被选为顶级人工智能会议KDD和ICML的最佳论文。
张峥 AWS上海AI研究院院长
张峥于2014年加入上海纽约大学,为纽约大学全球网络计算机终身教授,纽约大学库朗数学研究所、计算机系、数据学院兼职教授,于2018年10月学术休假,作为AWS上海AI研究院首任院长加入AWS。张峥是《知识分子》专家委员会成员。他是深度学习和人工智能、高性能大容量计算和存储系统的两栖专家,在国际会议获多次最佳论文, 谷歌学术引用八千多次,H-index47,在微软和惠普获卓越贡献奖。他是开源深度学习平台MXNet的共同创始人和顾问,于2018年开始领导并创立深度图计算DGL的开源项目。
金勇斌 OPEN AI LAB 创始人兼CEO、Arm中国生态公司总经理
金勇斌先生同时担任中国人工智能产业发展联盟(AIIA)总体组副组长、专家委员,Arm人工智能生态联盟(AIEC)秘书长。金勇斌先生在Arm期间先后担任过亚太区网络应用市场营销经理成功推动Arm处理器大规模应用到通信网络基础设施领域、战略大客户经理负责Arm和华为及海思的战略合作及商业合作、大中华区产品销售总监、战略联盟业务发展总监兼AI生态发展负责人、市场营销副总裁等职位。
颜水成 依图科技首席技术官(CTO)
颜水成博士是IEEE Fellow、IAPR Fellow、ACM 杰出科学家,主要研究领域为计算机视觉、机器学习和多媒体分析,迄今在国际顶级期刊及会议共发表600余篇论文,引用量超过4万次,H-index为98。2014、2015、2016和2018年,他四次当选汤森路透全球高被引学者。
黄畅 地平线联合创始人& 副总裁
黄畅,地平线联合创始人&副总裁,于2015年参与创立地平线,主导地平线自主研发的人工智能处理器架构BPU(Brain Processing Unit) 及基于该架构的芯片、工具链、算法等相关基础技术平台的研发工作。加入地平线前,他曾就职于百度美国研发中心。2013年,作为核心团队成员,他参与组建了百度深度学习研究院(IDL),并出任百度高级科学家、主任研发架构师。此前,他还曾担任美国南加州大学和 NEC 美国研究院(世界上最早从事卷积神经网络研发的 5 个实验室之一)研究员。
黄超 Autowise.ai创始人兼CEO
黄超,Autowise.ai创始人兼CEO。2017年下半年创立Autowise.ai并在2018年初推出全球首个无人驾驶清洁车队,目前已在国内外多个地区展开路测和商业运营。黄超曾任滴滴无人驾驶负责人、首席工程师,带领团队完成level4无人驾驶从0到1研发,加入滴滴前任职百度研究院大数据实验室资深研发工程师,成果应用到搜索、凤巢等核心业务。
若全天参加,请务必勾选上、下午两场
现在,AI World 2019 世界人工智能峰会已开放注册,新智元邀请您免费注册参会!只需点击文末阅读原文即可跳转至报名页面,选择公众注册,然后按照页面要求填写注册信息就可以啦,记得勾选AI World2019峰会上午场和下午场哦~