九九久久久久午夜精选,欧美一二区视频,国产成人精品一区二三区2022,日本色妞,久久久99精品,亚洲国产精品久久精品成人,91热久久免费频精品99欧美

您當前的位置是:  首頁 > 技術 > 技術動態(tài) >
 首頁 > 技術 > 技術動態(tài) > 騰訊云發(fā)布新一代HCC高性能計算集群 采用最新一代星星海自研服務器

騰訊云發(fā)布新一代HCC高性能計算集群 采用最新一代星星海自研服務器

2023-04-17 14:29:56   作者:   來源:騰訊云   評論:0  點擊:


  據報道,4月14日,騰訊云發(fā)布,新一代HCC高性能計算集群,采用最新一代星星海自研服務器,搭載NVIDIA H800 Tensor Core GPU,基于自研網絡、存儲架構,帶來3.2T超高互聯帶寬、TB級吞吐能力和千萬級IOPS。實測結果顯示,新一代集群算力性能較前代提升3倍。

  去年10月,騰訊完成首個萬億參數的AI大模型——混元NLP大模型訓練。在同等數據集下,將訓練時間由50天縮短到11天。如果基于新一代集群,訓練時間將進一步縮短至4天。

  大模型進入萬億參數時代,單體服務器提供的算力有限,需要將大量服務器相連,協同優(yōu)化單機算力、網絡架構和存儲性能,打造大規(guī)模、分布式的高性能計算集群。

  計算層面

  服務器單機性能是集群算力的基礎,新一代集群的單GPU卡在不同精度下,支持輸出最高1979 TFlops的算力。

  針對大模型場景,星星海自研服務器采用6U超高密度設計,相較行業(yè)可支持的上架密度提高30%;利用并行計算理念,通過CPU和GPU節(jié)點的一體化設計,將單點算力性能提升至更高。

  網絡層面

  計算節(jié)點間,存在著海量的數據交互需求。隨著集群規(guī)模擴大,通信性能會直接影響訓練效率,需要實現網絡和計算節(jié)點的最大協同。

  騰訊自研的星脈高性能計算網絡,具備業(yè)界最高的3.2T RDMA通信帶寬。實測結果顯示,搭載同等數量的GPU,3.2T星脈網絡相較1.6T網絡,集群整體算力提升20%。

  同時,騰訊自研的高性能集合通信庫TCCL,融入定制設計的解決方案。相對業(yè)界開源集合通信庫,為大模型訓練優(yōu)化40%負載性能,消除多個網絡原因導致的訓練中斷問題。

  存儲層面

  大模型訓練中,大量計算節(jié)點會同時讀取一批數據集,需要盡可能縮短數據加載時長,避免計算節(jié)點產生等待。

  騰訊云自研的存儲架構,具備TB級吞吐能力和千萬級IOPS,支持不同場景下對存儲的需求。COS+GooseFS對象存儲方案和CFS Turbo高性能文件存儲方案,充分滿足大模型場景下高性能、大吞吐和海量存儲要求。

  此外,新一代集群集成了騰訊云自研的TACO訓練加速引擎,對網絡協議、通信策略、AI框架、模型編譯進行大量系統級優(yōu)化,大幅節(jié)約訓練調優(yōu)和算力成本。

  騰訊混元大模型背后的訓練框架AngelPTM,也已通過騰訊云TACO提供服務,幫助企業(yè)加速大模型落地。

  通過騰訊云TI平臺的大模型能力和工具箱,企業(yè)可結合產業(yè)場景數據進行精調訓練,提升生產效率、快速創(chuàng)建和部署 AI 應用。

  依托分布式云原生的治理能力,騰訊云智算平臺提供16 EFLOPS的浮點算力,規(guī)模業(yè)界領先。

  以新一代集群為標志,基于自研芯片、星星海自研服務器和分布式云操作系統遨馳,騰訊云正通過軟硬一體的方式,打造面向AIGC的高性能智算網絡,持續(xù)加速全社會云上創(chuàng)新。

【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

相關閱讀:

專題

CTI論壇會員企業(yè)

清涧县| 昂仁县| 灌阳县| 隆化县| 维西| 水城县| 蓬莱市| 大石桥市| 行唐县| 阿坝县| 广德县| 靖州| 云安县| 鄂托克前旗| 安阳市| 教育| 来宾市| 辽阳市| 凤山县| 桃园市| 聊城市| 银川市| 东平县| 波密县| 长治市| 高青县| 内乡县| 德阳市| 柳林县| 宁化县| 孟州市| 璧山县| 浑源县| 定襄县| 金乡县| 吐鲁番市| 桐柏县| 犍为县| 商洛市| 石柱| 惠水县|