1987WEB视界-分享互联网热门产品和行业

您现在的位置是:首页 > 人工智能AI > 正文

人工智能AI

为AI大模型而生新华三AI服务器全面升级

1987web2023-08-17人工智能AI102
(ChinaIT.com讯)当前,以ChatGPT为代表的AI大模型应用全面爆发,对算力的需求也随之水涨船高。为进一步满足AIGC时代的算力需求,近日,在紫光股份旗下新华三集团年度盛会2023NAV

(ChinaIT.com讯)当前,以ChatGPT为代表的AI大模型应用全面爆发,对算力的需求也随之水涨船高。为进一步满足AIGC时代的算力需求,近日,在紫光股份旗下新华三集团年度盛会2023 NAVIGATE领航者峰会上,新华三智慧计算重磅发布11款H3C UniServer G6和HPE Gen11系列新品,打造面向AI全场景的服务器产品矩阵,为海量数据和模型算法提供强大的底层平台支撑,实现AI算力资源的充分供给。H3C UniServer G6和HPE Gen11系列服务器新品多元产品矩阵满足AI算力多元需求作为智慧计算的引领者,新华三集团在AI领域深耕多年,2022年在中国加速计算市场实现增速第一,并在国际权威AI基准评测MLPerf中累计斩获132项世界第一,展现出深厚的技术经验和实力。依托智慧计算体系构建的先进计算架构和智能算力管理能力,新华三打造了专为大模型训练而生的智能算力旗舰H3C UniServer R5500 G6,以及适用于大规模推理/训练场景的混合算力引擎H3C UniServer R5300 G6,进一步满足不同AI场景下的多元算力需求,实现AI计算的全场景覆盖。智能算力旗舰为大模型训练而生H3C UniServer R5500 G6集强劲、低碳、智能于一身,相较上一代产品,算力提升3倍,对于GPT-4大模型训练场景,训练时间缩短70%,可应用于大规模训练、语音识别、图像分类、机器翻译等多种AI业务场景。强劲:R5500 G6支持最高96核CPU,可实现150%内核性能提升;搭载全新NVIDIA HGX H8008-GPU模组,可提供32 PFLOPS的算力支撑,大模型AI训练速度提升9倍,大模型AI推理性能提升30倍;同时,基于PCIe 5.0及400G网络的加持,让用户可以部署更高性能的AI算力集群,加速AI在企业的落地与应用。智能:R5500 G6支持2种拓扑配置,智能灵活适应多种AI应用场景,加速深度学习和科学计算应用,极大提升了GPU的资源利用率。同时得益于H800的多实例GPU特性,单块H800可切分成7个GPU实例,最高可切分成56个GPU实例,每个实例都拥有独立的计算、显存资源,可以运行不同的AI应用,极大地提升了AI资源的灵活性。低碳:R5500 G6全面支持液冷,既包括CPU的冷板式液冷,也涵盖针对GPU的液冷,PUE可降至1.1以下,全面赋能算力热潮下的冷静计算。值得一提的是,R5500 G6一经发布便在2023年算力实力榜中获评2023年度十大卓越高性能服务器。混合算力引擎灵活匹配训练推理需求H3C UniServer R5300 G6作为全新一代AI服务器,在CPU和GPU的规格上相较于上一代提升显著,具备卓越性能、智能拓扑、算存一体等优势,可应用于深度学习模型训练、深度学习推理等AI应用场景,灵活匹配训推算力需求。卓越性能:R5300 G6适配最新一代NVIDIA企业级GPU,性能对比上一代产品可提升4.85倍,支持GPU、DPU、NPU等多种类型AI加速卡,应对AI不同场景下对异构计算算力的需求,助力智能时代。智能拓扑:R5300 G6拥有HPC、AI并行、AI串行、4卡直通、8卡直通5种GPU拓扑设置,带来前所未有的灵活性提升,可灵活匹配用户不同应用场景,智能调配资源,驱动算力高效运转。算存一体:R5300 G6灵活适配AI加速卡和智能网卡,集训练、推理能力于一身,支持10个双宽GPU和24LFF硬盘槽位,可在一台服务器中同时训练和推理,为开发和测试环境提供经济高效的算力引擎。高达400TB的海量存储,充分满足AI数据对于存储空间的需求。AI热潮奔涌,算力在挑战中不断重构,唯有进化可应万变。新一代AI服务器的发布,是新华三集团践行内生智能技术理念,持续推动智慧计算进化的又一里程碑。面向未来,新华三将在云智原生战略指引下,秉持精耕务实,为时代赋智慧的理念,精耕智慧计算沃土,探索AI深层次应用场景,以未来就绪的可进化算力,让智能世界加速到来。

来源:数字化领航

流程图

AI算法模型之应用部署概述

模型部署框架类型