打造AI导向的基础设施,联想问天两款AI服务器发布
中国算力大会联想展台,钛媒体App拍摄
通用人工智能时代到来,大模型训练的参数量突破万亿级关卡,AI算力已成为企业训练开发使用人工智能的硬门槛,以及算力基础设施的重要发展方向。据IDC报告显示,随着生成式人工智能应用的爆发,各行业对智算的需求首次超过通用算力,AI算力已成为算力发展的主要方向。
同时,中国信通院发布的数据也指出,截至2021年底,基础算力稳定增长,规模为95EFLOPS,增速为24%,占比为47%。智能算力增长迅速,2021年规模达到104EFLOPS,增速为85%,占比为51.5%。智能算力的比重提升代表智算应用场景的不断丰富,智能算力成增长动力。
联想中国区基础设施业务群服务器事业部总经理陈振宽
联想集团副总裁、联想中国区基础设施业务群服务器事业部总经理陈振宽表示,AI算法模型的变革使AI算力需求进入爆发式增长阶段,2010年之前,训练算力的增长率约20个月翻一番;2012年深度学习来临,训练算力每6个月翻一番;2018年以来基于Transformer架构的大模型训练算力需求每年数百倍增长。
AI算力已经成为中国算力发展的主要方向,根据IDC统计,中国AI算力持续高速增长,2022年规模达268百亿亿次/秒(EFLOPS)。同时未来几年的复合增长率高达52.3%。
相比较通用算力,AI算力有着明显的差异。从千万级的参数到千亿级的参数,从深度学习需要中等规模的训练和推理到现在要全面地去实现超大规模的训练,AI算力需要依据AI数据和算法的特性设计和优化,具体到AI算力基础设施层面就需要根据特性进行针对性的优化。
此前,在联想集团2023/24财年第一季度业绩会上,联想集团执行副总裁兼中国区总裁刘军透露,联想在AI的基础设施上,也有比较前瞻和显著的布局。截至目前,有60多款产品都是AI基础设施产品,包括推理服务器、训练服务器、AI存储等。
钛媒体App了解到,普慧算力包含普适和智慧,是联想算力发展的战略方向,也是联想的价值主张。其中,普适是指希望算力能够像水和电一样,可以人人即取即用而不必见;智慧更多是指人人可以随需使用而不必问,人们无需在使用算力前,询问它能否满足要求,需要使用、随需使用就可以。
陈振宽称,联想AI算力战略有两大特征,一个是AI赋智,二是绿色赋能。其中,AI赋智即让100%算力基础设施产品支持AI,50% 基础设施研发投入在AI领域,全面AI技术覆盖全域AI应用;绿色赋能则是全面布局和引领液冷技术,打造液冷集群方案灯塔,以绿色算力基础设施助推智算产业可持续发展。
在中国算力大会上,联想发布了两款全新AI服务器产品—联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器。联想方面表示,在通用算力向AI算力发展的当下,联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器两款新品将分别满足不同类型的AI应用场景需求。
联想问天WA7780 G3
具体来看,联想问天WA7780 G3是一款专为AI大模型训练所打造的服务器,采用了三重独立风道设计,预留了液冷冷板,基于第四代英特尔®至强®可扩展处理器,将AI算力提升了3.44倍,至高可达32P FLOPS AI算力。NVIDIA H800 GPU匹配第四代Tensor Core配合Transformer引擎(FP8精度),与上一代产品相比,可为大模型AI训练速度带来高达9倍提升,可将大模型AI推理速度提升高达30倍。
联想问天WA5480 G3
联想问天WA5480 G3 AI训推一体服务器是一款4U机架式AI服务器,支持多元算力和丰富的生态,采用2颗第四代英特尔®至强®可扩展处理器,支持最新PCIe 5.0。通过PCIe扩展,最多可以支持10张包括最新NVIDIA H800 GPU在内的,多类型、多品牌AI加速卡。
在联想的理念中,兼顾不同算力形态,会从不同场景上提供全面的产品来满足不同算力需求。这次推出的这两款产品比较偏向于大规模的推理和大规模的训练,就是大规模和超大规模。同时,两款AI服务器新品也可以配合联想的边缘计算的产品来实现边缘推理。
联想集团董事长兼CEO杨元庆在业绩会上表示,在未来三年里会追加投入10亿美元(70亿人民币)在人工智能方向的所有领域,这个领域包括适合人工智能计算需要的服务器存储的产品,包括给云计算厂商的,也包括企业级的。
面向未来的发展,陈振宽称,联想也在积极了解客户在不同领域上的需求和痛点,以AI导向的基础设施助力人工智能加速,通过AI技术,覆盖全域应用,加速实现普慧算力。(本文首发钛媒体App,作者/杜志强,编辑/钟毅)
国产兆瀚构建了以台式机、通用服务器、AI服务器、软硬一体机为核心的兆瀚计算产品矩阵。
据了解该公司与英伟达(Nvidia)在2019年就宣布合作,将英伟达的深度学习平台NGC集成到该公司的AI服务器中,以优化AI模型的开发和部署。此外,该公司还开始将英伟达的GPU用于其AI服务器中,以提升服务器的AI计算能力。
英伟达在AI计算领域具有深厚的技术积累和广泛的市场认可,而国内这家公司则是中国领先的物联网应用方案提供商之一。在物联网、智慧城市等领域拥有强大的业务能力和行业应用经验。两家公司合作,有助于加强AI计算硬件和解决方案的融合,推动AI技术在各种应用场景下的应用和普及。
兆瀚AI服务器
该公司的AI服务器产品主要包括AtSmart2900、AtSmart4850、AtSmart7200等多款型号,在AI计算、深度学习、大数据分析等方面有着广泛的应用。以下为对几款产品的简要介绍:
AtSmart2900:该款服务器采用Intel Xeon Scalable处理器,支持最多24个DDR4内存插槽和2个M.2 NVMe固态硬盘插槽,具有高性能、高可靠性和高扩展性的特点。在AI计算场景下,可根据不同的工作负载调整CPU和GPU之间的配比,进一步提高计算效率。
AtSmart4850:该款服务器采用AMD EPYC处理器,支持高通量、高容量、高速度、高可靠性的存储,可轻松处理各种复杂大规模计算。同时,还集成了多个高性能扩展插槽和网络接口,满足多种场景需求。
AtSmart7200:该款服务器采用两颗Intel Xeon Scalable Gold 6230处理器,配备多块V100、T4等高性能GPU,适用于深度学习、图像分析、语音识别等AI应用场景。它还支持NVLink技术,可实现高速内存互通和高带宽数据传输。
拓维信息
这家公司就是华为鲲鹏、昇腾、鸿蒙开源等核心合作伙伴——拓维信息
拓维信息的AI服务器产品具有高性能、高可靠性、高扩展性等特点,在国内外的客户中有着广泛的应用。
拓维信息早在5月9日就在互动平台表示,公司的兆瀚系列服务器产品已能够满足当前各类主流AI场景与大模型的训练需求,目前正在与国内多家头部TMT公司开展适配测试。
另外,拓维信息近日表示:公司生产的AI服务器支持英伟达GPU的运行。
AI算力热潮下,这家公司的妖刀已经杀破了前高压力,是否已经确定了第二波狂飙行情?在算力服务上扮演接力龙的地位?替代总妖王?国产最强AI服务器,可用英伟达GPU