當(dāng)前位置首頁(yè) > 中國(guó)制造 > 企業(yè) >

200億美元！英偉達(dá)“收購(gòu)”Groq技術(shù)許可與“TPU原班人馬”

中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng) 時(shí)間：2025-12-31

　　當(dāng)?shù)貢r(shí)間12月24日，一則英偉達(dá)以200億美元收購(gòu)AI專(zhuān)用芯片初創(chuàng)公司Groq資產(chǎn)的新聞爆料，沸騰了硅谷的圣誕節(jié)。

　　很快，Groq發(fā)布公告，稱(chēng)英偉達(dá)與Groq達(dá)成的交易是“非排他性技術(shù)許可協(xié)議”，英偉達(dá)將獲得Groq的芯片技術(shù)授權(quán)，且Groq創(chuàng)始人兼CEOJonathanRoss（當(dāng)年谷歌TPU的創(chuàng)始成員）、總裁SunnyMadra及其他核心團(tuán)隊(duì)將加入英偉達(dá)，而Groq公司將繼續(xù)獨(dú)立運(yùn)營(yíng)。這是英偉達(dá)有史以來(lái)最大規(guī)模的一筆交易，遠(yuǎn)超2019年收購(gòu)Mellanox的70億美元。

　　這一交易并非孤立事件，而是近年來(lái)全球AI市場(chǎng)競(jìng)爭(zhēng)與格局演進(jìn)的一個(gè)縮影，特別是正在全球范圍內(nèi)加速展開(kāi)的、圍繞AI專(zhuān)用算力的布局與轉(zhuǎn)向：6月，路透社報(bào)道，作為英偉達(dá)GPU長(zhǎng)期以來(lái)的最大采購(gòu)商之一的OpenAI已開(kāi)始租用谷歌TPU為其ChatGPT及其他AI產(chǎn)品提供算力支持；10月，谷歌與Anthropic官宣谷歌將向Anthropic供應(yīng)至多100萬(wàn)塊專(zhuān)用AI芯片TPU及附加的谷歌云服務(wù)；11月，TheInformation報(bào)道稱(chēng)Meta正計(jì)劃于2027年將谷歌TPU部署至自有數(shù)據(jù)中心，特斯拉也官宣已在車(chē)輛控制系統(tǒng)與數(shù)據(jù)中心大規(guī)模部署數(shù)百萬(wàn)顆自研AI芯片。

　　頂級(jí)AI科技企業(yè)們的動(dòng)態(tài)無(wú)不清晰釋放出一個(gè)信號(hào)：全球AI算力基礎(chǔ)設(shè)施正逐步走出以GPU架構(gòu)為核心的單一范式，轉(zhuǎn)向以TPU和類(lèi)TPU為代表的AI專(zhuān)用芯片的新架構(gòu)方向。

　　“非典型收購(gòu)”背后：AI專(zhuān)用算力芯片的崛起

　　盡管交易雙方強(qiáng)調(diào)其“非收購(gòu)”性質(zhì)，但過(guò)去兩年里，通過(guò)“技術(shù)授權(quán)”的方式實(shí)現(xiàn)“人才收購(gòu)”或獲得“技術(shù)轉(zhuǎn)讓”，已經(jīng)是硅谷科技巨頭們屢用不鮮、既能規(guī)避傳統(tǒng)并購(gòu)可能面臨的監(jiān)管、又能快速將目標(biāo)產(chǎn)品/技術(shù)/人才納入麾下的“非典型收購(gòu)”方法。

　　2025年，Meta斥資近150億美元收購(gòu)AI數(shù)據(jù)標(biāo)注初創(chuàng)公司ScaleAI49%股權(quán)，ScaleAI聯(lián)合創(chuàng)始人兼CEO加入Meta，ScaleAI仍保持獨(dú)立運(yùn)營(yíng)；AMD與加拿大AI芯片創(chuàng)企UntetherAI達(dá)成協(xié)議，吸納UntetherAI整個(gè)AI硬件與軟件工程團(tuán)隊(duì)；谷歌斥資24億美元（約合人民幣168億元），引進(jìn)AI代碼生成初創(chuàng)公司W(wǎng)indsurf頂尖人才與技術(shù)。蘋(píng)果、微軟和亞馬遜也都在近兩年進(jìn)行過(guò)類(lèi)似的交易。

　　而此次英偉達(dá)與Groq之間200億美元的巨額交易，英偉達(dá)CEO黃仁勛在內(nèi)部郵件中闡釋了其意圖：“我們計(jì)劃將Groq的低延遲處理器集成至NVIDIAAI工廠(chǎng)架構(gòu)，將該平臺(tái)的應(yīng)用范圍擴(kuò)展至更廣泛的AI推理與實(shí)時(shí)工作負(fù)載領(lǐng)域?！?/p>

　　公開(kāi)資料顯示，Groq成立于2016年，是一家專(zhuān)注于AI專(zhuān)用芯片研發(fā)的美國(guó)公司，公司估值在今年9月的最新一輪融資中達(dá)到69億美元。其芯片產(chǎn)品取名為L(zhǎng)PU（語(yǔ)言處理器），專(zhuān)為AI推理場(chǎng)景設(shè)計(jì)，號(hào)稱(chēng)運(yùn)行大語(yǔ)言模型的速度可達(dá)GPU的10倍，能耗卻只有十分之一。值得注意的是，Groq創(chuàng)始人JonathanRoss曾是谷歌TPU（張量處理器）芯片項(xiàng)目的創(chuàng)始成員之一。

　　在Meta被報(bào)道計(jì)劃大規(guī)模部署谷歌TPU、Anthropic已簽署百萬(wàn)片TPU采購(gòu)協(xié)議之后，作為英偉達(dá)主要客戶(hù)的各大模型廠(chǎng)商，正在積極尋求并計(jì)劃實(shí)際采用以TPU為代表的新算力源。Groq團(tuán)隊(duì)的TPU背景，使其成為英偉達(dá)理解以TPU為代表的AI專(zhuān)用算力芯片的最佳對(duì)象。AI專(zhuān)用芯片已展現(xiàn)出通用GPU架構(gòu)難以匹敵的能效優(yōu)勢(shì)，且這一差距無(wú)法僅通過(guò)迭代現(xiàn)有產(chǎn)品線(xiàn)輕易抹平。

　　TPU芯片：為AI/ML而生的架構(gòu)

　　GPU最初設(shè)計(jì)用于圖形處理，尤其是實(shí)時(shí)渲染和圖像處理，因此對(duì)其中體面結(jié)構(gòu)的矩陣和向量運(yùn)算做了專(zhuān)門(mén)優(yōu)化，后來(lái)逐漸發(fā)展成為通用計(jì)算設(shè)備（GPGPU）。GPU具有大量結(jié)構(gòu)較為簡(jiǎn)單的并行處理單元，適合處理高度并行的任務(wù)，如圖形渲染和科學(xué)計(jì)算，因此被廣泛應(yīng)用于計(jì)算機(jī)圖形學(xué)、游戲開(kāi)發(fā)、視頻編碼/解碼、深度學(xué)習(xí)訓(xùn)練和推理。

　　TPU是谷歌專(zhuān)為加速機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)而設(shè)計(jì)的專(zhuān)用芯片，特別是針對(duì)深度學(xué)習(xí)模型的訓(xùn)練和推理。TPU針對(duì)張量運(yùn)算進(jìn)行了高度優(yōu)化，單個(gè)的脈動(dòng)陣列架構(gòu)吞吐量和處理效率相較GPU有了更大提升，特別適合于處理矩陣乘法等常見(jiàn)于神經(jīng)網(wǎng)絡(luò)的操作，主要用于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型的訓(xùn)練和推理，特別是使用TensorFlow框架的任務(wù)。

　　TPU在架構(gòu)和設(shè)計(jì)上的根本性革新，使其成為比GPU更適合進(jìn)行大量部署或使用的深度學(xué)習(xí)計(jì)算單元：

　　多維度的計(jì)算單元提高計(jì)算效率：相較于CPU中的標(biāo)量計(jì)算單元和GPU中的矢量計(jì)算單元，TPU使用二維乃至更高維度的計(jì)算單元完成計(jì)算任務(wù)，將卷積運(yùn)算循環(huán)展開(kāi)的方式實(shí)現(xiàn)最大限度的數(shù)據(jù)復(fù)用，降低數(shù)據(jù)傳輸成本，提升加速效率；

　　更省時(shí)的數(shù)據(jù)傳輸和高效率的控制單元：馮諾依曼架構(gòu)帶來(lái)的存儲(chǔ)墻問(wèn)題在深度學(xué)習(xí)任務(wù)當(dāng)中尤為突出，而TPU采用更為激進(jìn)的策略設(shè)計(jì)數(shù)據(jù)傳輸，且控制單元更小，給片上存儲(chǔ)器和運(yùn)算單元留下了更大的空間；

　　面向AI的加速，強(qiáng)化AI/ML計(jì)算能力：定位準(zhǔn)確，架構(gòu)簡(jiǎn)單，單線(xiàn)程控制，定制指令集，TPU架構(gòu)在深度學(xué)習(xí)運(yùn)算方面效率極高，且易于擴(kuò)展，更適合超大規(guī)模的AI訓(xùn)練計(jì)算。

　　隨著大模型參數(shù)規(guī)模與復(fù)雜度的提升，計(jì)算的核心日益集中于大規(guī)模、高并行度的矩陣乘法運(yùn)算（MatMul）。GPU的架構(gòu)優(yōu)勢(shì)在于處理高度并行但模式多變的圖形計(jì)算，其通用性帶來(lái)了靈活性，但在執(zhí)行AI計(jì)算任務(wù)時(shí)，其復(fù)雜的控制邏輯、多層級(jí)的內(nèi)存系統(tǒng)會(huì)帶來(lái)不可避免的功耗和效率開(kāi)銷(xiāo)。而谷歌TPU架構(gòu)，則通過(guò)脈動(dòng)陣列架構(gòu)，將計(jì)算資源高度集中于矩陣運(yùn)算單元，并以片上高帶寬存儲(chǔ)替代復(fù)雜的數(shù)據(jù)調(diào)度機(jī)制，從硬件層面重構(gòu)計(jì)算路徑。這種“以算為本”的設(shè)計(jì)理念，使其在能效比、吞吐密度和規(guī)模化部署上展現(xiàn)出顯著優(yōu)勢(shì)。

　　AI芯片產(chǎn)業(yè)共識(shí)：架構(gòu)創(chuàng)新對(duì)突破算力瓶頸的價(jià)值

　　如今，越來(lái)越多的世界頂尖科技公司在積極應(yīng)用甚至自研TPU或類(lèi)TPU架構(gòu)的AI專(zhuān)用芯片：

　　早在2019年，英特爾就收購(gòu)了來(lái)自以色列的AI芯片制造商 HabanaLabs，并在2024年4月推出了專(zhuān)攻深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)推理的類(lèi)TPU芯片Gaudi3；且今年11月，外媒報(bào)道稱(chēng)英特爾正在與同樣由谷歌TPU早期團(tuán)隊(duì)創(chuàng)立的美國(guó)AI芯片獨(dú)角獸 SambaNova 進(jìn)行初步的收購(gòu)談判；

　　2023年11月，微軟在其全球技術(shù)大會(huì)Ignite上宣布推出專(zhuān)為Azure云服務(wù)和AI工作負(fù)載設(shè)計(jì)的ASIC芯片Maia100，預(yù)計(jì)2026年正式發(fā)布；

　　2023年11月底，AWS發(fā)布了為生成式AI和機(jī)器學(xué)習(xí)訓(xùn)練設(shè)計(jì)的云端AI算力芯片Trainium2；2024年底，AWS與Anthropic官宣共同打造名為ProjectRainier的EC2UltraCluster，將使用數(shù)十萬(wàn)片Trainium2芯片；

　　2024年7月，蘋(píng)果公司使用谷歌TPU訓(xùn)練其人工智能系統(tǒng)“蘋(píng)果智能”（AppleIntelligence）的AI模型AFM，通過(guò)2048片TPUv5p芯片來(lái)訓(xùn)練擁有27.3億參數(shù)的設(shè)備端模型AFM-on-device，以及8192片TPUv4芯片來(lái)訓(xùn)練其為私有云計(jì)算環(huán)境量身定制的大型服務(wù)器端模型AFM-server；

　　2025年6月，據(jù)路透社報(bào)道，作為英偉達(dá)GPU長(zhǎng)期以來(lái)的最大采購(gòu)商之一的OpenAI已開(kāi)始租用谷歌的TPU為其ChatGPT及其他AI產(chǎn)品提供算力支持；

　　2025年10月，谷歌與Anthropic共同發(fā)布聲明，宣布谷歌將向Anthropic供應(yīng)至多 100萬(wàn)塊專(zhuān)用AI芯片TPU以及附加的谷歌云服務(wù)，這筆交易價(jià)值數(shù)百億美元；

　　2025年11月，TheInformation報(bào)道稱(chēng)Meta正計(jì)劃于2027年將谷歌TPU部署至自有數(shù)據(jù)中心，并最早自2026年起租用谷歌云TPU算力；

　　2025年11月，特斯拉首席執(zhí)行官馬斯克官宣稱(chēng)特斯拉已在車(chē)輛控制系統(tǒng)與數(shù)據(jù)中心大規(guī)模部署自研AI芯片，數(shù)量達(dá)數(shù)百萬(wàn)顆，支撐起FSD自動(dòng)駕駛、Dojo超級(jí)計(jì)算機(jī)等核心業(yè)務(wù)，公司計(jì)劃以“一年一代”的節(jié)奏推進(jìn)芯片迭代；

　　······

　　資本與產(chǎn)業(yè)層面的密集動(dòng)作，其根源在于AI計(jì)算負(fù)載結(jié)構(gòu)本身正在發(fā)生深刻變化。越來(lái)越多的頭部科技公司開(kāi)始將目光投向AI專(zhuān)用架構(gòu)。TPU所代表的專(zhuān)用算力路徑，正逐步從“可選方案”演變?yōu)橹蜗乱浑A段AI發(fā)展的關(guān)鍵基礎(chǔ)設(shè)施之一。

　　國(guó)內(nèi)唯一全自研、已量產(chǎn)TPU芯片的公司

　　核心創(chuàng)始團(tuán)隊(duì)組建于2018年，作為國(guó)內(nèi)唯一一家掌握TPU架構(gòu)AI專(zhuān)用芯片核心技術(shù)并實(shí)現(xiàn)全自研TPU芯片量產(chǎn)的公司，中昊芯英的創(chuàng)始人及CEO楊龔軼凡曾作為谷歌TPU芯片核心研發(fā)者，深度參與過(guò)TPUv2/3/4的設(shè)計(jì)與研發(fā)工作。

　　TPU為AI大模型而生的天然優(yōu)勢(shì)架構(gòu)，使其在面向AI計(jì)算場(chǎng)景時(shí)，在同等生產(chǎn)制程下相較于GPU可以擁有 3-5倍的性能提升。以中昊芯英歷時(shí)近五年全自研的國(guó)內(nèi)首枚已量產(chǎn)TPUAI芯片“剎那?”為例，“剎那?”在處理大規(guī)模AI模型運(yùn)算時(shí)與海外知名GPU芯片相比，計(jì)算性能可以超越其近1.5倍，在完成相同計(jì)算任務(wù)量時(shí)的能耗降低 30%，將價(jià)格、算力和能耗綜合測(cè)算，“剎那?”的單位算力成本僅為其42%。

　　全球AI算力產(chǎn)業(yè)的發(fā)展趨勢(shì)顯示，當(dāng)計(jì)算效率與成本成為AI大模型加速迭代及大規(guī)模商用落地的核心瓶頸時(shí)，對(duì)底層算力架構(gòu)進(jìn)行專(zhuān)用化、定制化革新，已成為驅(qū)動(dòng)產(chǎn)業(yè)前進(jìn)的重要因素。對(duì)于中國(guó)AI芯片產(chǎn)業(yè)而言，這一全球性趨勢(shì)明確了專(zhuān)注特定賽道、深耕架構(gòu)創(chuàng)新的戰(zhàn)略?xún)r(jià)值。中昊芯英將繼續(xù)堅(jiān)定TPU技術(shù)路徑，聚焦AI計(jì)算本質(zhì)，致力于為市場(chǎng)提供高效、可行的專(zhuān)用算力解決方案。

　　轉(zhuǎn)自：日照新聞網(wǎng)

返回產(chǎn)經(jīng)網(wǎng)首頁(yè) >>

　　【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品，轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來(lái)源“中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”，違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊，僅代表作者個(gè)人觀(guān)點(diǎn)，不代表本網(wǎng)觀(guān)點(diǎn)和立場(chǎng)。版權(quán)事宜請(qǐng)聯(lián)系：010-65363056。

延伸閱讀

熱點(diǎn)視頻

科技賦能玫瑰產(chǎn)業(yè)升級(jí) 校企合作共筑鄉(xiāng)村振興新篇章

熱點(diǎn)新聞

200億美元！英偉達(dá)“收購(gòu)”Groq技術(shù)許可與“TPU原班人馬”

熱點(diǎn)視頻

熱點(diǎn)新聞

微信公眾號(hào)