中國移動推出九天深度思考大模型


中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)   時間:2025-03-18





  中國移動近日推出自主研發(fā)的“九天深度思考大模型”,通過模擬人類思維過程的進階處理方式,在復(fù)雜任務(wù)推理、精準(zhǔn)意圖理解和專業(yè)領(lǐng)域知識應(yīng)用等方面展現(xiàn)出顯著優(yōu)勢,標(biāo)志著“九天”大模型從“快速應(yīng)答”向“深度思考”邁出重要一步。


  隨著人工智能技術(shù)加速演進,通過模擬人類認(rèn)知機制實現(xiàn)復(fù)雜邏輯推理,推動人工智能從“感知智能”邁向“認(rèn)知智能”,是業(yè)界共同探索的重要發(fā)展路徑。為進一步解決人工智能落地行業(yè)過程中必須攻克的“復(fù)雜系統(tǒng)智能化”難題,中國移動全新研發(fā)了“九天深度思考大模型”,對推進人工智能規(guī)?;疃荣x能千行百業(yè)具有重要戰(zhàn)略意義。


  據(jù)了解,“九天深度思考大模型”具備嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)推理能力、文字組織能力及豐富的行業(yè)知識。與傳統(tǒng)語言大模型不同,“九天深度思考大模型”在處理問題時并非直接生成答案,而是通過多次迭代的“慢思考”過程,確保每個結(jié)論均經(jīng)過嚴(yán)謹(jǐn)推演。例如,面對數(shù)學(xué)問題,大模型會先拆解題目條件,調(diào)用相關(guān)公式和定理,再通過分步計算驗證結(jié)果;對于開放性問題,則通過語義深度分析生成結(jié)構(gòu)化的論述。這種“慢思考”模式不僅提升了復(fù)雜任務(wù)的準(zhǔn)確性,還顯著增強了答案的可解釋性。此外,中國移動“九天”人工智能團隊在大模型訓(xùn)練中引入了跨領(lǐng)域知識融合策略,結(jié)合大規(guī)模行業(yè)語料庫與通用語料,使其能夠靈活切換專業(yè)場景,同時保持自然語言生成的流暢性。


  測試結(jié)果表明,“九天深度思考大模型”在代碼理解、數(shù)學(xué)計算、生成內(nèi)容邏輯、專業(yè)知識全面性和準(zhǔn)確性等方面效果顯著提高,并在奧林匹克數(shù)學(xué)考試題、GPQA兩個數(shù)據(jù)集中表現(xiàn)優(yōu)異。該模型的技術(shù)優(yōu)勢體現(xiàn)在四大方面:一是實現(xiàn)全鏈路自主創(chuàng)新,覆蓋數(shù)據(jù)集構(gòu)建、預(yù)訓(xùn)練、微調(diào)、強化學(xué)習(xí)及推理等關(guān)鍵環(huán)節(jié);二是完成全棧國產(chǎn)化支持,基于國產(chǎn)萬卡算力集群與算法框架,完成17款國產(chǎn)AI芯片的適配驗證,實現(xiàn)跨芯片架構(gòu)的無縫遷移與持續(xù)訓(xùn)練;三是打造體系化AI技術(shù)體系,憑借算力網(wǎng)絡(luò)優(yōu)勢實現(xiàn)開放環(huán)境下AI能力的智能調(diào)度與彈性部署;四是強化復(fù)雜系統(tǒng)智能化能力,打造行業(yè)智能化引擎,深度解構(gòu)通信、能源等重點領(lǐng)域業(yè)務(wù)邏輯,實現(xiàn)AI能力與產(chǎn)業(yè)場景的有機融合。(記者 宜欣)


  轉(zhuǎn)自:人民郵電報

  【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65363056。

延伸閱讀

?

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964