2025世界機器人大會丨一目科技李智強博士解析觸覺技術(shù)如何增強具身智能


中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)   時間:2025-08-14





  8月8日,2025世界機器人大會在北京經(jīng)濟技術(shù)開發(fā)區(qū)開幕。其間,一目科技創(chuàng)始人兼CEO李智強博士參與人工智能大模型賦能機器人與具身智能產(chǎn)業(yè)新范式論壇,發(fā)表《觸覺增強的世界模型》主題演講并發(fā)布一目視觸覺傳感器。

  據(jù)了解,安裝該傳感器相當于給機器人裝上了“能看見觸感”的眼睛——它用攝像頭拍下彈性材料接觸物體時的細微形變,再把這些變化轉(zhuǎn)化成高清的“觸覺照片”。比起傳統(tǒng)只能感知單一壓力傳感器,它能同時“感受”物體的軟硬、紋理甚至滑動趨勢。這種高保真的觸覺信息,能幫機器人更精準地“理解”物體特性,像人類一樣完成精細操作。

  AI大模型筑基具身智能:需補上“觸覺感知”課

  “對比文本、視覺類大模型,具身智能在物理世界感知能力上仍有明顯不足——溫度、材質(zhì)、光滑度等觸覺數(shù)據(jù)的缺失,制約著其技術(shù)瓶頸突破?!崩钪菑姴┦吭诓稍L中直指核心問題。

  他認為,AI大模型要為具身智能筑基,需先解決兩大難題:一是數(shù)據(jù)采集,需通過高保真觸覺感知技術(shù),還原人類指尖的多維力學(xué)感知能力,收集物理世界的“觸覺語言”;二是數(shù)據(jù)量不足,“大模型需要海量數(shù)據(jù)才能收斂泛化,我們提出‘以真實觸覺信號錨定仿真系統(tǒng),通過仿真計算生成超真實任務(wù)變體數(shù)據(jù)’的閉環(huán)路徑,為神經(jīng)世界模型提供數(shù)據(jù)‘養(yǎng)料’。”

  多傳感器融合:從“看”到“觸”的操作閉環(huán)

  針對一目科技自研的多傳感器融合系統(tǒng)(融合視覺、觸覺、力覺等模態(tài)),李智強解釋其核心價值:“人類操作時,視覺主導(dǎo)環(huán)境感知,而精細抓握的核心在于觸覺與力覺的協(xié)同——尤其在物體接觸瞬間,視覺對微觀交互的感知能力顯著受限,這正是多模態(tài)融合技術(shù)的核心價值所在?!?/p>

  該系統(tǒng)的優(yōu)勢體現(xiàn)在三方面:一是通用接口設(shè)計,可與VLA大模型及觸覺模型集成,構(gòu)建VTLA大模型體系,快速接入前沿算法;二是傳感器芯片化創(chuàng)新,通過微型化與低功耗技術(shù)提升觸覺信號的保真度;三是材料學(xué)突破,團隊研發(fā)的“仿生皮膚”在耐久性與感知特性上趨近人類指尖,支撐長時間、高精度操作。

  通用機器人落地難點:數(shù)據(jù)量與泛化性需“分而治之”

  對于通用機器人在開放場景中實現(xiàn)閉環(huán)迭代的最大難點,李智強認為數(shù)據(jù)量缺失和場景泛化性不足是兩大核心挑戰(zhàn)。

  “真實世界數(shù)據(jù)采集效率低,純靠采樣是線性過程,難以滿足大模型需求?!币荒靠萍颊ㄟ^與行業(yè)頭部企業(yè)合作,將觸覺仿真能力接入其世界大模型,“通過觸覺仿真能力與世界模型的融合,構(gòu)建‘真實錨定虛擬’的數(shù)據(jù)閉環(huán),實現(xiàn)物理交互數(shù)據(jù)的指數(shù)級擴增?!?/p>

  針對場景泛化性,他提出“分而治之”策略:“80%的通用任務(wù)(如抓取、放置)由基礎(chǔ)模型提供標準化力控接口,實現(xiàn)語義級動作規(guī)劃;剩余20%高精度場景(如醫(yī)療儀器操作),則通過‘技能包’形式提供專業(yè)參數(shù)配置,讓機器人能像下載APP一樣‘學(xué)會’新技能?!?/p>

  產(chǎn)業(yè)新形態(tài):從“儀器智能”時代到“具身智能的操作即服務(wù)”時代

  談及AI大模型與具身智能的融合,李智強指出其將引發(fā)產(chǎn)業(yè)級變革:“正如互聯(lián)網(wǎng)重構(gòu)所有行業(yè),具身智能將推動多領(lǐng)域‘重做一遍’——通過物理世界與數(shù)字世界的深度耦合,重塑生產(chǎn)流程與服務(wù)范式。”

  李智強進一步強調(diào)MaaS的顛覆性價值:“將機器人的精細化操作能力(如力控抓取、精密插拔)封裝為標準化的物理API接口,通用任務(wù)調(diào)用基礎(chǔ)模型接口,專業(yè)場景則通過參數(shù)配置實現(xiàn)技能定制,使物理操作能力成為即取即用的‘新基建’?!?/p>

  展望未來,李智強認為具身智能的核心突破將集中在“物理世界與數(shù)字世界的深度連接”:“傳統(tǒng)數(shù)字化已在推進,具身智能將進一步擴張維度,讓萬事萬物的物理屬性都能被數(shù)字模型捕捉”。

  “從過去十年類人的‘嗅覺、味覺’研究,到未來聚焦的觸覺技術(shù),我們始終在復(fù)刻人類感知能力,讓AI智能體更懂物理世界——這是感知驅(qū)動的AI計算終極目標?!崩钪菑娬f。


  轉(zhuǎn)自:中國網(wǎng)

  【版權(quán)及免責聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65363056。

延伸閱讀

?

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964