數(shù)據(jù)標(biāo)注總規(guī)模達(dá)17282TB 高質(zhì)量數(shù)據(jù)集需加快建設(shè)


中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)   時(shí)間:2025-04-06





  7個(gè)數(shù)據(jù)標(biāo)注基地的數(shù)據(jù)標(biāo)注總規(guī)模達(dá)到17282TB,已形成醫(yī)療、工業(yè)、教育等行業(yè)的高質(zhì)量數(shù)據(jù)集335個(gè)……國家數(shù)據(jù)局最新發(fā)布的數(shù)據(jù)顯示,我國數(shù)據(jù)標(biāo)注產(chǎn)業(yè)發(fā)展取得階段性成果。


  數(shù)據(jù)標(biāo)注產(chǎn)業(yè)蓬勃發(fā)展


  數(shù)據(jù)標(biāo)注產(chǎn)業(yè)是對(duì)數(shù)據(jù)進(jìn)行篩選、清洗、分類、注釋、標(biāo)記和質(zhì)量檢驗(yàn)等加工處理的新興產(chǎn)業(yè)。人工智能發(fā)展離不開高質(zhì)量數(shù)據(jù)集,而高質(zhì)量數(shù)據(jù)集建設(shè)離不開數(shù)據(jù)標(biāo)注工作。加快培育和發(fā)展數(shù)據(jù)標(biāo)注產(chǎn)業(yè),推進(jìn)數(shù)據(jù)要素市場化配置改革,對(duì)促進(jìn)數(shù)據(jù)開發(fā)利用、賦能經(jīng)濟(jì)社會(huì)發(fā)展、著力培育數(shù)據(jù)標(biāo)注新業(yè)態(tài)、布局?jǐn)?shù)字科技新賽道、構(gòu)建產(chǎn)業(yè)國際競爭新優(yōu)勢(shì)具有重要意義。


  根據(jù)國家數(shù)據(jù)局最新發(fā)布的數(shù)據(jù),目前我國已建成7個(gè)數(shù)據(jù)標(biāo)注基地,分別位于四川成都、遼寧沈陽、安徽合肥、湖南長沙、海南海口、河北保定和山西大同,數(shù)據(jù)標(biāo)注總規(guī)模達(dá)到17282TB,相當(dāng)于中國國家圖書館數(shù)字資源總量的6倍左右。目前已形成醫(yī)療、工業(yè)、教育等行業(yè)的高質(zhì)量數(shù)據(jù)集335個(gè),賦能121個(gè)國產(chǎn)人工智能大模型研發(fā),引進(jìn)和培育標(biāo)注企業(yè)223家,標(biāo)注從業(yè)人員達(dá)5.8萬人,帶動(dòng)數(shù)據(jù)標(biāo)注行業(yè)相關(guān)產(chǎn)值超過83億元。


  數(shù)據(jù)標(biāo)注是提升人工智能算法、模型核心能力的關(guān)鍵環(huán)節(jié)。工信部信息通信經(jīng)濟(jì)專家委員會(huì)委員盤和林在接受《人民郵電》報(bào)記者采訪時(shí)表示,各地在數(shù)據(jù)標(biāo)注規(guī)模上實(shí)現(xiàn)了顯著增長,這顯示數(shù)據(jù)標(biāo)注產(chǎn)業(yè)在各地的快速擴(kuò)展和蓬勃發(fā)展,中國數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的規(guī)模效應(yīng)正在逐步形成,競爭力正在不斷提高,可以預(yù)見,未來中國的數(shù)據(jù)標(biāo)注產(chǎn)業(yè)在海外也是有競爭力的。


  “人工智能落地最大的障礙是應(yīng)用,而數(shù)據(jù)標(biāo)注產(chǎn)業(yè)向垂直領(lǐng)域延伸,則帶動(dòng)人工智能產(chǎn)業(yè)向垂直領(lǐng)域融合,讓人工智能應(yīng)用和傳統(tǒng)產(chǎn)業(yè)領(lǐng)域更好融合?!北P和林表示,高質(zhì)量數(shù)據(jù)集將逐漸形成,特別是在醫(yī)療、工業(yè)、教育等多個(gè)關(guān)鍵行業(yè)領(lǐng)域,這些特色化數(shù)據(jù)標(biāo)注的出現(xiàn),也意味著各地?cái)?shù)據(jù)標(biāo)注產(chǎn)業(yè)通過多元化、垂直領(lǐng)域開發(fā)的方式來錯(cuò)開競爭,而不是單純堆量,這也有利于人工智能產(chǎn)業(yè)多點(diǎn)齊發(fā),最終有利于人工智能產(chǎn)業(yè)生態(tài)的形成。


  推動(dòng)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)智能化發(fā)展


  數(shù)據(jù)標(biāo)注產(chǎn)業(yè)作為數(shù)字經(jīng)濟(jì)領(lǐng)域的新業(yè)態(tài),是布局?jǐn)?shù)字科技新賽道、構(gòu)建產(chǎn)業(yè)競爭新優(yōu)勢(shì)的關(guān)鍵。根據(jù)國家發(fā)展改革委等部門2024年末發(fā)布的《關(guān)于促進(jìn)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)高質(zhì)量發(fā)展的實(shí)施意見》,到2027年,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)專業(yè)化、智能化及科技創(chuàng)新能力顯著提升,產(chǎn)業(yè)規(guī)模大幅躍升,年均復(fù)合增長率超過20%,培育一批具有影響力的科技型數(shù)據(jù)標(biāo)注企業(yè),打造一批產(chǎn)學(xué)研用聯(lián)動(dòng)的創(chuàng)新載體。


  3月18日-20日,全國數(shù)據(jù)標(biāo)注基地先行先試現(xiàn)場會(huì)在四川成都舉行,會(huì)議要求,加快推進(jìn)高質(zhì)量數(shù)據(jù)集建設(shè),推動(dòng)工業(yè)、金融、醫(yī)療、交通、教育等領(lǐng)域的高質(zhì)量數(shù)據(jù)集建設(shè),為人工智能高水平發(fā)展夯實(shí)數(shù)據(jù)底座。同時(shí),會(huì)議提出,因地制宜培育數(shù)據(jù)標(biāo)注產(chǎn)業(yè)。各地要立足自身優(yōu)勢(shì)和資源稟賦,找準(zhǔn)發(fā)展定位,探索特色發(fā)展路徑。通過差異化定位和特色化發(fā)展,形成優(yōu)勢(shì)互補(bǔ)、協(xié)同發(fā)展的產(chǎn)業(yè)格局。


  加快建設(shè)高質(zhì)量的數(shù)據(jù)集,對(duì)于推動(dòng)人工智能深入應(yīng)用,發(fā)揮人工智能在提升行業(yè)效率、改善服務(wù)質(zhì)量方面的巨大潛力具有重要意義。在醫(yī)療領(lǐng)域,通過收集和分析大量患者的醫(yī)療數(shù)據(jù),人工智能大模型可以為個(gè)性化治療提供建議;在金融領(lǐng)域,高質(zhì)量數(shù)據(jù)集可以用于風(fēng)險(xiǎn)評(píng)估、欺詐檢測(cè)、智能投顧;在工業(yè)領(lǐng)域,高質(zhì)量數(shù)據(jù)集可以支持智能制造、預(yù)測(cè)性維護(hù)、質(zhì)量控制等應(yīng)用。


  3月24日,國家數(shù)據(jù)局局長劉烈宏在中國發(fā)展高層論壇2025年年會(huì)上表示,國家數(shù)據(jù)局將充分調(diào)動(dòng)社會(huì)各方力量,積極推動(dòng)高質(zhì)量數(shù)據(jù)集建設(shè),持續(xù)增加數(shù)據(jù)供給,推動(dòng)“人工智能+”行動(dòng)賦能千行百業(yè)?!?#39;人工智能+'行動(dòng)到哪里,高質(zhì)量數(shù)據(jù)集的建設(shè)和推廣就要到哪里。”劉烈宏說,將強(qiáng)化公共數(shù)據(jù)資源登記管理,規(guī)范公共數(shù)據(jù)資源授權(quán)運(yùn)營實(shí)施,建立授權(quán)運(yùn)營價(jià)格形成機(jī)制,積極引導(dǎo)做好高質(zhì)量數(shù)據(jù)集建設(shè)工作。


  “從當(dāng)?shù)匾呀?jīng)形成的產(chǎn)業(yè)和數(shù)據(jù)格局出發(fā),找到具有優(yōu)勢(shì)數(shù)據(jù)資源的領(lǐng)域,有針對(duì)性地開發(fā)這些數(shù)據(jù),繼而由這些數(shù)據(jù)帶動(dòng)相關(guān)產(chǎn)業(yè)實(shí)現(xiàn)'人工智能+'。”盤和林表示,對(duì)于擁有豐富醫(yī)療資源和數(shù)據(jù)的地區(qū),可以重點(diǎn)發(fā)展醫(yī)療領(lǐng)域的數(shù)據(jù)標(biāo)注產(chǎn)業(yè),專注于醫(yī)療影像、病歷文本等數(shù)據(jù)的標(biāo)注;對(duì)于工業(yè)基礎(chǔ)雄厚、制造業(yè)發(fā)達(dá)的地區(qū),可以重點(diǎn)發(fā)展工業(yè)領(lǐng)域的數(shù)據(jù)標(biāo)注產(chǎn)業(yè),專注于工業(yè)設(shè)備狀態(tài)監(jiān)測(cè)、生產(chǎn)線優(yōu)化等數(shù)據(jù)的標(biāo)注,為工業(yè)人工智能的研發(fā)提供有力支撐。


  高質(zhì)量的數(shù)據(jù)標(biāo)注是訓(xùn)練高性能人工智能模型的基礎(chǔ),只有準(zhǔn)確、全面地標(biāo)注數(shù)據(jù),才能訓(xùn)練出可靠、可用的人工智能大模型。數(shù)據(jù)標(biāo)注產(chǎn)業(yè)也需要緊密配合人工智能技術(shù)的研發(fā)和應(yīng)用需求,提供定制化的數(shù)據(jù)標(biāo)注服務(wù),為人工智能技術(shù)的創(chuàng)新和應(yīng)用提供有力支持。


  “數(shù)據(jù)標(biāo)注產(chǎn)業(yè)會(huì)朝著更專業(yè)化、規(guī)?;⒅悄芑姆较虬l(fā)展?!北P和林表示,一方面,隨著人工智能技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷拓展,對(duì)數(shù)據(jù)標(biāo)注的需求將會(huì)越來越大,對(duì)數(shù)據(jù)標(biāo)注的質(zhì)量和效率也會(huì)提出更高的要求。另一方面,人工智能技術(shù)也將對(duì)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)產(chǎn)生影響,很多數(shù)據(jù)標(biāo)注可能不再是由人來標(biāo)注,而是由算法標(biāo)注,不僅如此,數(shù)據(jù)本身可能就是由人工智能生成的,這又會(huì)給數(shù)據(jù)標(biāo)注產(chǎn)業(yè)帶來顛覆性的影響。


  轉(zhuǎn)自:人民郵電報(bào)

  【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場。版權(quán)事宜請(qǐng)聯(lián)系:010-65363056。

延伸閱讀

?

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號(hào)-2京公網(wǎng)安備11010502035964