天天视讯！浪潮信息助力淮海智算中心，千亿参数AI大模型训练算力效率超50%

2023-02-20 16:18:06 来源: 电子创新网

(资料图片)

近日，淮海智算中心携手浪潮信息进行了超大规模参数AI大模型训练性能测试，实测数据表明，千亿参数规模的自然语言AI单体大模型在淮海智算中心计算平台上的训练算力效率达53.5%，刷新了业内AI大模型训练算力效率新高。这意味着淮海智算中心将可为国内生成式AI创新团队提供高性能、高效率的AI大模型训练算力服务。

生成式AI需要基于海量的自然语言或多模态数据集，对拥有巨大参数的超大规模AI模型进行训练，其训练所需AI算力当量非常高，如以PD(Petaflops-Day)为单位来衡量，OpenAI的GPT-3大模型训练的算力当量为3640PD，而浪潮"源1.0"大模型的算力当量则为4095PD。

超大规模AI大模型的训练一般必须在拥有成百上千加速卡的AI服务器集群上进行，如何在AI计算集群上获得更高的训练算力效率则会直接影响到模型训练时长以及算力消耗成本，这对于提升生成式AI研发创新效率有着非常重要的影响。据公开资料表明，GPT-3大模型在其V100 GPU集群上的训练算力效率为21.3%，而浪潮"源1.0"的训练算力效率则达到了44.8%。

针对AI大模型训练的计算特点，浪潮信息AI团队对淮海智算中心算力系统进行了专业设计，对集群架构、高速互联、算力调度等方面进行全面优化，在系统架构上，采用单节点集成8颗加速器的AI服务器，节点内加速器间实现超高速P2P通信，节点间建立极低延迟、超高带宽的Infiniband通信网络。在大模型训练技术层面，成功运用了中文巨量AI模型"源1.0"的训练优化经验，对分布式训练策略进行了针对性优化，通过合理设计张量并行、流水并行和数据并行，精准调整模型结构和训练过程的超参数，最终实现了千亿参数规模AI大模型的训练算力效率达到53.5%。

千亿参数AI模型结构及其实际性能表现

关键词：浪潮信息模型结构自然语言通信网络性能测试

天天视讯！浪潮信息助力淮海智算中心，千亿参数AI大模型训练算力效率超50%

您可能也感兴趣:

今日热点

中国算力发展指数白皮书发布广东算力创新水平和研发投入居首

生命科技标准创新研讨会举行打通标准应用“最后一公里”

“黑科技”广泛应用我国单位GDP二氧化碳排放持续下降

更多

更多

排行

最近更新

今日要闻

天天视讯！浪潮信息助力淮海智算中心，千亿参数AI大模型训练算力效率超50%

您可能也感兴趣:

今日热点

中国算力发展指数白皮书发布 广东算力创新水平和研发投入居首

生命科技标准创新研讨会举行 打通标准应用“最后一公里”

“黑科技”广泛应用 我国单位GDP二氧化碳排放持续下降

为您推荐

近十年财险业务快速发展 财产保险业风险保障水平不提升

辽宁扩大缓缴社保费政策实施范围 补缴期间免收滞纳金

增额终身寿险成银保市场上的黑马 中途退保恐会损失保费

保险公司纷纷探索转型之路 聚焦细分业务、推出新产品

更多

更多

排行

最近更新

今日要闻

中国算力发展指数白皮书发布广东算力创新水平和研发投入居首

生命科技标准创新研讨会举行打通标准应用“最后一公里”

“黑科技”广泛应用我国单位GDP二氧化碳排放持续下降

近十年财险业务快速发展财产保险业风险保障水平不提升

辽宁扩大缓缴社保费政策实施范围补缴期间免收滞纳金

增额终身寿险成银保市场上的黑马中途退保恐会损失保费

保险公司纷纷探索转型之路聚焦细分业务、推出新产品