腾讯发布新一代超强算力集群：面向大模型训练，性能提升3倍

腾讯发布新一代超强算力集群：面向大模型训练，性能提升3倍

作者 | IT之家2023-04-14

IT之家 4 月 14 日消息，IT之家从腾讯官方获悉，腾讯云发布了新一代 HCC 高性能计算集群，采用最新一代星星海自研服务器，搭载英伟达 H800 Tensor Core GPU。

腾讯官方称，该集群基于自研网络、存储架构，带来 3.2T 超高互联带宽、TB 级吞吐能力和千万级 IOPS。实测结果显示，新一代集群算力性能较前代提升 3 倍。

去年 10 月，腾讯完成首个万亿参数的 AI 大模型 —— 混元 NLP 大模型训练。在同等数据集下，将训练时间由 50 天缩短到 11 天。如果基于新一代集群，训练时间将进一步缩短至 4 天。

计算层面，服务器单机性能是集群算力的基础，腾讯云新一代集群的单 GPU 卡在不同精度下，支持输出最高 1979 TFlops 的算力。

针对大模型场景，星星海自研服务器采用 6U 超高密度设计，相较行业可支持的上架密度提高 30%；利用并行计算理念，通过 CPU 和 GPU 节点的一体化设计，将单点算力性能提升至更高。

网络层面，计算节点间，存在着海量的数据交互需求。随着集群规模扩大，通信性能会直接影响训练效率，需要实现网络和计算节点的最大协同。

腾讯自研的星脉高性能计算网络，号称具备业界最高的 3.2T RDMA 通信带宽。实测结果显示，搭载同等数量的 GPU，3.2T 星脉网络相较 1.6T 网络，集群整体算力提升 20%。

同时，腾讯自研的高性能集合通信库 TCCL，融入定制设计的解决方案。相对业界开源集合通信库，为大模型训练优化 40% 负载性能，消除多个网络原因导致的训练中断问题。

存储层面，大模型训练中，大量计算节点会同时读取一批数据集，需要尽可能缩短数据加载时长，避免计算节点产生等待。

腾讯云自研的存储架构，具备 TB 级吞吐能力和千万级 IOPS，支持不同场景下对存储的需求。COS+GooseFS 对象存储方案和 CFS Turbo 高性能文件存储方案，充分满足大模型场景下高性能、大吞吐和海量存储要求。

此外，新一代集群集成了腾讯云自研的 TACO 训练加速引擎，对网络协议、通信策略、AI 框架、模型编译进行大量系统级优化，大幅节约训练调优和算力成本。

腾讯混元大模型背后的训练框架 AngelPTM，也已通过腾讯云 TACO 提供服务，帮助企业加速大模型落地。

通过腾讯云 TI 平台的大模型能力和工具箱，企业可结合产业场景数据进行精调训练，提升生产效率、快速创建和部署 AI 应用。

依托分布式云原生的治理能力，腾讯云智算平台提供 16 EFLOPS 的浮点算力。

默认最早最热评分最高

0条

您可能感兴趣

搞懂物联网产业链其实很简单！《2023年中国AIoT产业全景图谱》重磅发布！

2022挚物·AIoT产业领袖峰会【线上直播】

不用担心WiFi问题了？小米11售后政策更新：3年免费修

区别于行业！三翼鸟发布全屋智慧全场景解决方案

澳大利亚Telstra公布了首批可以利用其5G SA网络的终端设备

乔布斯女儿吐槽苹果iPhone 14没新意

热门文章

1

2025电子产业四大猜想，慕尼黑上海电子展带你一站了解政策、技术、市场的多维破局？

4天前

2

“具身智能十五大重点方向”明确产业发展热点，上下游合力推动具身时代到来

4天前

3

广和通亮相火山引擎“AIoT智变浪潮”，共探AI智能硬件全球化机遇

4天前

4

康盈半导体徐州测试基地投产，为存储产品品质护航

5天前

5

郭元强书记莅临格创东智调研人工智能产业发展情况

6天前

6

开放自动化OPA完成"量子跃迁"进入"实战元年",过程自动控制迎来全面安卓化

6天前

7

第二届“金灵光杯”中国互联网创新大赛“低空经济”专题赛报名即将开启

6天前

8

从消费到车规，华大电子携Qi2无线充全栈方案亮相亚洲充电展

7天前

9

提振消费政策背景下消费物联网的发展趋势

7天前

10

2025 SEMICON China首日，格创东智大模型 × Agent研讨会引爆半导体AI智造新浪潮

1周前

11

小米/京东/阿里/腾讯齐入局,大厂打响具身智能"军备竞赛"

1周前

12

华大电子闪耀亮相Auto CS，赋能智能网联安全新生态

1周前

13

2025边缘AI报告:实时自主智能,从范式创新到AI硬件的技术基础

1周前

14

共筑AI产业新未来 2025人工智能基础设施峰会成功召开

1周前

15

格创东智亮相SEMICON China 2025，以创新方案引领中国半导体产业智能化升级

1周前

16

移动互联网的发展能为物联网带来哪些启示？

1周前

17

遇见端侧AI未来，移远通信从模型、模组到应用的全面落地

1周前

18

华为成为第一家进入OPC基金会董事会的中国公司

1周前

19

超50家企业出席！「科创与金融经济双轮驱动：香港与大湾区可持续发展新路径研讨会」圆满落幕

2周前

20

AI玩具革命浪潮下，移远通信如何赋能传统玩具转型？

2周前

“连接”与“计算”——从物联网迈向智联网星辰大海的两大门槛

在物联网繁荣发展并向智联网迈进的关键阶段，对于“连接”与“计算”都提出了更高要求。模组作为重要的中间件，不仅需要跟随通信代际更迭而推陈出新，更需要持续向更加智能化的方向升级，成为AI与物联网有机结合的

2023-04-14

智次方·物联网智库 —— 研究型智能产业服务平台

关于智次方

友情链接

ITES深圳工业展

极客邦科技

智联车智库

智吱屋小程序

本站由阿里云提供计算与安全服务违法和不良信息举报电话：010-88884220 举报邮箱：liuzong@zzw.com 网上有害信息举报

©2022 北京英维塔科技有限公司京ICP备16012223号-1

京ICP备16012223号

智次方·物联网智库 —— 研究型智能产业服务平台

X