人工智能浪潮席卷全球,算力基礎(chǔ)設(shè)施的自主可控與效能革新,已成為信息產(chǎn)業(yè)發(fā)展的核心命題。7月28日世界人工智能大會(huì)期間,天津移動(dòng)TPU智算中心的正式點(diǎn)亮,向業(yè)界展示了一個(gè)高性能算力集群的落成,也提供了一個(gè)從底層芯片架構(gòu)、服務(wù)器整機(jī)集成到運(yùn)營(yíng)商級(jí)算力服務(wù)的全鏈條自主創(chuàng)新范本,為我國(guó)智算產(chǎn)業(yè)生態(tài)的構(gòu)建開(kāi)拓了極具價(jià)值的參考路徑。

核心技術(shù)探源:TPU架構(gòu)何以成為破局關(guān)鍵?
本次智算中心的算力核心,是中昊芯英歷時(shí)近五年自主研發(fā)的“剎那”TPU芯片。當(dāng)前AI算力 市場(chǎng)以GPU為主流,為何要選擇并落地TPU這一專用架構(gòu)路線?答案源于對(duì)AI計(jì)算本質(zhì)的深刻洞察。
天津移動(dòng) TPU 智算中心的項(xiàng)目建設(shè)負(fù)責(zé)人、天津移動(dòng)城三分公司副總經(jīng)理高亢在點(diǎn)亮儀式致辭時(shí)表示:“算力的競(jìng)爭(zhēng)其實(shí)就是芯片、架構(gòu)、能耗與效率的競(jìng)爭(zhēng)。在進(jìn)行底層算力硬件選型時(shí),芯片的算力性能、功耗與易用性是天津移動(dòng)重點(diǎn)關(guān)注的核心因素。能耗決定長(zhǎng)期運(yùn)營(yíng)成本,性價(jià)比決定能否大規(guī)模普及,易用性決定開(kāi)發(fā)者愿不愿意留下來(lái)?!?/span>
當(dāng)大模型訓(xùn)練的參數(shù)量不斷躍升,當(dāng)推理側(cè)并發(fā)呈指數(shù)級(jí)增長(zhǎng),傳統(tǒng)的芯片架構(gòu)可能面臨效能瓶頸。而 TPU 芯片架構(gòu)相較于傳統(tǒng)的 GPU,在 AI/ML 計(jì)算場(chǎng)景下因創(chuàng)新架構(gòu)而具有天然的效能優(yōu)勢(shì)。
作為國(guó)產(chǎn) TPU AI 專用算力芯片的領(lǐng)導(dǎo)者和先行者,中昊芯英提供的自研 “泰則?”GPTPU 人工智能服務(wù)器,為項(xiàng)目提供了核心的 AI 算力效能。“泰則?”搭載的 TPU 芯片“剎那?”由中昊芯英歷時(shí)近 5 年研發(fā),是中國(guó)首枚量產(chǎn)的高性能 TPU 架構(gòu) AI 專用大芯片,擁有全自研的 IP 核、指令集與計(jì)算平臺(tái)?!皠x那?”的 AI 算力性能超越海外著名 GPU 產(chǎn)品近 1.5 倍,能耗降低 30%,將價(jià)格、算力和能耗綜合測(cè)算,“剎那?”的單位算力成本可降低近一半。1024 片芯片通過(guò)光模塊片間高速互聯(lián)的能力,使系統(tǒng)集群性能遠(yuǎn)超傳統(tǒng) GPU 數(shù)倍,千卡集群可支撐超千億參數(shù)大模型的運(yùn)算需求。
系統(tǒng)集成攻堅(jiān):打通“芯”到“算”的最后一公里
一顆高性能芯片的誕生只是第一步。如何高效、穩(wěn)定地將其集成到服務(wù)器系統(tǒng)中,讓上層應(yīng)用順暢調(diào)用其算力,既是產(chǎn)業(yè)化落地的關(guān)鍵,也是我國(guó)信息產(chǎn)業(yè)長(zhǎng)期面臨的挑戰(zhàn)。
在此次項(xiàng)目中,太極股份提供了智算服務(wù)器整機(jī)集成、測(cè)試、部署和軟硬件優(yōu)化等。搭載太極股份自研的 TAIJI2000-Z001 CPU 服務(wù)器與中昊芯英的“泰則?”TPU AI 服務(wù)器,集成 AI 算力服務(wù)器系統(tǒng),同步開(kāi)發(fā)適配國(guó)產(chǎn)芯片的嵌入式軟件,并提供一次性集成部署及后期運(yùn)維等全生命周期服務(wù),通過(guò)“軟硬件 + 集成 + 運(yùn)維”的一體化能力,確保了算力集群的高效穩(wěn)定運(yùn)行。
太極股份數(shù)字基礎(chǔ)設(shè)施業(yè)務(wù)集團(tuán)總經(jīng)理孟凡池介紹,在硬件層面,太極股份基于自研的旗艦級(jí)TAIJI-2000-Z001 AI服務(wù)器做了深度適配。該服務(wù)器平臺(tái)本身具備強(qiáng)大的擴(kuò)展性,可支持8塊“剎那”TPU芯片,并配備了高速內(nèi)存與存儲(chǔ)通道。集成的難點(diǎn)在于,必須確保TPU芯片與CPU之間、多塊TPU芯片之間的高速互聯(lián)與數(shù)據(jù)通路暢通無(wú)阻,才能最大化發(fā)揮芯片集群的并行計(jì)算能力。
軟件層面的挑戰(zhàn)更為艱巨。太極股份針對(duì)“剎那”的全自研指令集,開(kāi)發(fā)了適配的嵌入式軟件系統(tǒng)和編譯工具,為國(guó)產(chǎn)芯片與上層應(yīng)用軟件架起了溝通的“橋梁”。編譯系統(tǒng)支持高斯樸素貝葉斯、支持向量機(jī)等機(jī)器學(xué)習(xí)模型,方便開(kāi)發(fā)者將現(xiàn)有AI模型便捷地遷移至TPU平臺(tái),極大地降低了國(guó)產(chǎn)芯片的應(yīng)用門檻。
太極股份成功打通了從國(guó)產(chǎn)核心器件到國(guó)產(chǎn)算力設(shè)備的“最后一公里”,形成了一套軟硬件協(xié)同優(yōu)化的完整解決方案。

算力運(yùn)營(yíng)變革:運(yùn)營(yíng)商的“算網(wǎng)融合”新角色
中國(guó)移動(dòng)立足“供給者、匯聚者、運(yùn)營(yíng)者”定位,特別是秉持著“為國(guó)建云”的初心使命,在AI-IaaS層提出芯片開(kāi)放、協(xié)議開(kāi)放、形態(tài)開(kāi)放的目標(biāo),旨在以多芯兼容的開(kāi)放式架構(gòu)打破技術(shù)論斷,激發(fā)國(guó)產(chǎn)智算潛能。
天津移動(dòng)將通過(guò)“算力運(yùn)營(yíng)平臺(tái)、MaaS平臺(tái)、云管平臺(tái)”三大關(guān)鍵平臺(tái)的建設(shè),使能從“算力提供者”向“智能服務(wù)提供者”的戰(zhàn)略轉(zhuǎn)型。
天津移動(dòng)TPU智算中心的落地,是這一轉(zhuǎn)型的生動(dòng)實(shí)踐。天津移動(dòng)城三分公司副總經(jīng)理高亢表示,天津移動(dòng)正按照“一云多芯”策略持續(xù)進(jìn)行基礎(chǔ)設(shè)施建設(shè),構(gòu)建以異構(gòu)融合、高速傳輸、統(tǒng)一調(diào)度、服務(wù)化供給為核心特征的“四位一體”新型AI算力體系。
這意味著算力不再是孤立的數(shù)據(jù)中心資源,而是像流量一樣可被靈活輸送和智能分配的網(wǎng)絡(luò)化資源。借力中國(guó)移動(dòng)的云網(wǎng)融合基礎(chǔ)設(shè)施,天津移動(dòng)TPU智算中心的國(guó)產(chǎn)TPU算力能夠以低時(shí)延、高可靠的方式,精準(zhǔn)賦能華北地區(qū)的工業(yè)、金融、科研等用戶,實(shí)現(xiàn)“算力像水電一樣,即取即用”的愿景。
這次多方合作,清晰地勾勒出我國(guó)信息產(chǎn)業(yè)在AI時(shí)代的發(fā)展新圖景:以中昊芯英為代表的“硬核”科技企業(yè)負(fù)責(zé)底層技術(shù)突破,以太極股份為代表的系統(tǒng)集成商負(fù)責(zé)產(chǎn)業(yè)化承接與生態(tài)構(gòu)建,以天津移動(dòng)為代表的運(yùn)營(yíng)商負(fù)責(zé)將算力轉(zhuǎn)化為人工智能普惠服務(wù)。這種協(xié)同模式,為我國(guó)加速構(gòu)建自主可控、高效綠色的算力基礎(chǔ)設(shè)施,提供了堅(jiān)實(shí)的產(chǎn)業(yè)支撐。
轉(zhuǎn)自:中國(guó)網(wǎng)
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來(lái)源“中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場(chǎng)。版權(quán)事宜請(qǐng)聯(lián)系:010-65363056。
延伸閱讀

版權(quán)所有:中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號(hào)-2京公網(wǎng)安備11010502035964