9月5日,中科曙光在2025世界智能產(chǎn)業(yè)博覽會上發(fā)布了國內(nèi)首個基于AI計算開放架構(gòu)設(shè)計的產(chǎn)品--曙光AI超集群系統(tǒng)。
記者在現(xiàn)場了解到,這一AI超集群系統(tǒng)以GPU為核心,實現(xiàn)了"算、存、網(wǎng)、電、冷、管、軟"一體化緊耦合設(shè)計,具備"超高性能、超高效率、超高可靠、全面開放"四大特點,可為萬億參數(shù)大模型訓(xùn)練推理、行業(yè)大模型微調(diào)、多模態(tài)大模型開發(fā)、AI4S等場景提供高效算力底座。
據(jù)介紹,曙光AI超集群系統(tǒng)具有高性能、高效率、高可靠、全面開放的技術(shù)特點。比如,在性能方面,單機柜可搭載96張GPU卡、算力規(guī)模達百P級、訪存總帶寬超180TB/s,支持多精度、混合精度運算以及百萬卡超大集群擴展;效率方面,千卡集群大模型訓(xùn)練推理性能達到業(yè)界主流水平2.3倍,開發(fā)效率提升4倍。
當(dāng)前,伴隨AI大模型快速演進以及全球IT產(chǎn)業(yè)生態(tài)體系調(diào)整,國內(nèi)AI算力領(lǐng)域面臨高端算力供給不足、國產(chǎn)加速卡性能差距大、算力成本高、自主軟硬件生態(tài)不成熟等挑戰(zhàn)。而發(fā)展更大規(guī)模、更高效智算集群來彌補國產(chǎn)單卡算力差距以突破算力瓶頸,打造開放式、標準化、高效率的算力集群,以實現(xiàn)智算集群的易用與可控成本,正逐漸成為業(yè)界共識。
值得關(guān)注的是,相比封閉系統(tǒng),曙光AI超集群系統(tǒng)不僅通過緊耦合設(shè)計像一臺計算機般高效工作,還支持多品牌AI加速卡以及兼容主流軟件生態(tài),為用戶提供更多開放性選擇,并降低硬件成本和軟件開發(fā)適配成本,保護前期投資。
中科曙光總裁助理、智能計算產(chǎn)品事業(yè)部總經(jīng)理杜夏威表示,克服國內(nèi)AI算力多維挑戰(zhàn),需匯聚芯片、計算系統(tǒng)、大模型等產(chǎn)業(yè)鏈多方力量,構(gòu)建開放AI計算架構(gòu)并拉通產(chǎn)業(yè)間跨層協(xié)作,以打破"技術(shù)墻"與"生態(tài)墻"。據(jù)他透露,依托AI超集群系統(tǒng),中科曙光將開放AI存儲優(yōu)化能力、液冷基礎(chǔ)設(shè)施設(shè)計規(guī)范、DeepAI基礎(chǔ)軟件棧等三項技術(shù)能力,助力合作伙伴、重點用戶在AI應(yīng)用存儲性能加速、液冷超節(jié)點系統(tǒng)設(shè)計、GPU開發(fā)統(tǒng)一開發(fā)框架等方面獲得高級別技術(shù)共享、深度定制優(yōu)化與專業(yè)技術(shù)支持。(記者 楊鵬岳)
轉(zhuǎn)自:中國電子報
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65363056。
延伸閱讀