應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

華為推出昇騰超節(jié)點技術(shù),成功實現(xiàn)業(yè)界最大規(guī)模 384 卡高速總線互聯(lián)

2025-05-26 08:57 IT之家
關(guān)鍵詞:華為昇騰超節(jié)點

導(dǎo)讀:在鯤鵬昇騰開發(fā)者大會 2025 —— 昇騰 AI 開發(fā)者峰會上,華為推出了昇騰超節(jié)點技術(shù),成功實現(xiàn)業(yè)界最大規(guī)模的 384 卡高速總線互聯(lián)。

  2025 年 5 月 23 日,在鯤鵬昇騰開發(fā)者大會 2025 —— 昇騰 AI 開發(fā)者峰會上,華為推出了昇騰超節(jié)點技術(shù),成功實現(xiàn)業(yè)界最大規(guī)模的 384 卡高速總線互聯(lián)。

  當(dāng)前,大模型發(fā)展呈現(xiàn)參數(shù)與效率交替演進(jìn)的態(tài)勢:一方面,Scaling Law 不斷推動模型能力突破極限;另一方面,以 DeepSeek 為代表的創(chuàng)新架構(gòu)與工程技術(shù),正加速模型能力在千行萬業(yè)的落地應(yīng)用。在此背景下,MoE 成為主流模型結(jié)構(gòu),其復(fù)雜的混合并行策略帶來巨大挑戰(zhàn),TP、SP、EP 單次通信量高達(dá) GB 級且難以掩蓋。隨著并行規(guī)模持續(xù)擴(kuò)大,傳統(tǒng)服務(wù)器跨機帶寬已成為訓(xùn)練的核心阻礙,亟需計算架構(gòu)的創(chuàng)新升級以適配未來模型發(fā)展。

  傳統(tǒng)服務(wù)器依賴以太網(wǎng)絡(luò)實現(xiàn)跨機互聯(lián),通信帶寬較低。實踐表明,當(dāng) TP、SP 或 EP 等分布式策略的混合并行域超過 8 卡時,跨機通信帶寬便成為性能瓶頸,導(dǎo)致系統(tǒng)性能大幅下降。

  據(jù)介紹,華為昇騰超節(jié)點打破了以 CPU 為中心的馮諾依曼架構(gòu),創(chuàng)新提出了對等計算架構(gòu),憑借高速總線互聯(lián)技術(shù)實現(xiàn)重大突破,把總線從服務(wù)器內(nèi)部,擴(kuò)展到整機柜、甚至跨機柜。在超節(jié)點范圍內(nèi),用高速總線互聯(lián)替代傳統(tǒng)以太,通信帶寬提升了 15 倍;單跳通信時延也從 2 微秒做到 200 納秒,降低了 10 倍,使集群如同一臺計算機般協(xié)同工作,有效突破系統(tǒng)性能限制。

  從華為中國官方獲悉,此次推出的昇騰 384 超節(jié)點,由 12 個計算柜和 4 個總線柜構(gòu)成,是目前業(yè)界規(guī)模最大的超節(jié)點。依托華為在 ICT 領(lǐng)域深厚的技術(shù)與工程經(jīng)驗,通過最佳負(fù)載均衡組網(wǎng)方案,該超節(jié)點可進(jìn)一步擴(kuò)展為包含數(shù)萬卡的 Atlas 900 SuperCluster 超節(jié)點集群,為未來更大規(guī)模的模型演進(jìn)提供支撐。

  性能測試數(shù)據(jù)顯示,在昇騰超節(jié)點集群上,LLaMA 3 等千億稠密模型性能相比傳統(tǒng)集群提升 2.5 倍以上;在通信需求更高的 Qwen、DeepSeek 等多模態(tài)、MoE 模型上,性能提升可達(dá) 3 倍以上,較業(yè)界其他集群高出 1.2 倍,在行業(yè)中處于領(lǐng)先地位。