AI落地場景暴增,頭部企業(yè)如何解決AI訓(xùn)練數(shù)據(jù)難題?


中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)   時間:2021-06-10





  近年來,隨著大數(shù)據(jù)和云計算等新一代信息技術(shù)的不斷進步,人工智能場景應(yīng)用中加速落地,并快速向各個行業(yè)和領(lǐng)域滲透。

  其中,數(shù)據(jù)是人工智能開發(fā)和應(yīng)用的基礎(chǔ),當(dāng)前以機器學(xué)習(xí)為主的人工智能技術(shù)的高速發(fā)展依賴于底層大數(shù)據(jù)的豐富程度。強大的模型需要含有大量樣本的數(shù)據(jù)集作為基礎(chǔ),數(shù)據(jù)的質(zhì)量、多樣性將對算法模型的成敗產(chǎn)生重大影響。高質(zhì)量的AI訓(xùn)練數(shù)據(jù)越多,模型的準(zhǔn)確度和重復(fù)性就越好。

  《2020年中國AI基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)發(fā)展報告》顯示:一個新研發(fā)的計算機視覺算法需要上萬張到數(shù)十萬張不等的標(biāo)注圖片訓(xùn)練;一個用于智慧城市的算法應(yīng)用,每年都有數(shù)十萬張圖片的穩(wěn)定需求;語音方面,頭部公司累計應(yīng)用的標(biāo)注數(shù)據(jù)集已達百萬小時以上,每年需求仍以20%-30%的增速上升,不僅如此,隨著IoT設(shè)備的普及,語音交互場景越來越豐富,每年都有更多的新增場景和新需求方出現(xiàn),對于標(biāo)注數(shù)據(jù)的需求也是逐步增長。

  可以說,高質(zhì)量的AI訓(xùn)練數(shù)據(jù)工作是推進人工智能技術(shù)落地的重要環(huán)節(jié)之一,AI訓(xùn)練數(shù)據(jù)的質(zhì)量和規(guī)模對于提升AI模型應(yīng)用效果的成功至關(guān)重要。在這一過程中,如何從技術(shù)層面、工具層面提升人員效率、數(shù)據(jù)標(biāo)注精準(zhǔn)度,成為目前階段的重要課題。

  從頭部代表企業(yè)云測數(shù)據(jù)的一系列操作中我們觀察到,專業(yè)的數(shù)據(jù)標(biāo)注平臺會通過標(biāo)準(zhǔn)化的流程、方法論和人員機制,提高平臺的流程化協(xié)作能力,來保證數(shù)據(jù)服務(wù)團隊的高效的服務(wù)能力,準(zhǔn)確地把控從創(chuàng)建任務(wù)、分配任務(wù)、標(biāo)注流轉(zhuǎn)到質(zhì)檢/抽檢等環(huán)節(jié),實現(xiàn)對數(shù)據(jù)標(biāo)注過程的全流程掌控,更好的提高數(shù)據(jù)標(biāo)注的效率、精準(zhǔn)度和隱私安全。

  云測數(shù)據(jù)正式對外發(fā)布的其針對AI訓(xùn)練數(shù)據(jù)服務(wù)的平臺產(chǎn)品——「云測數(shù)據(jù)標(biāo)注平臺4.0」為AI訓(xùn)練數(shù)據(jù)服務(wù)提供了齊全的標(biāo)注工具,支持圖片、點云、視頻、文本、音頻、數(shù)據(jù)清洗等各類型的標(biāo)注,并針對每種類型設(shè)置了具有代表性的標(biāo)注模板,可解決AI場景落地多樣性、豐富性的數(shù)據(jù)需求。

  相比傳統(tǒng)的采集數(shù)據(jù)、訓(xùn)練模型的方式,云測數(shù)據(jù)提出了「數(shù)據(jù)在環(huán)和模型迭代在環(huán)新方式」,將數(shù)據(jù)在環(huán)開發(fā)打通,將數(shù)據(jù)采集、處理、標(biāo)注、訓(xùn)練、模型輸出進行持續(xù)迭代集成,實現(xiàn)一站式解決企業(yè)AI數(shù)據(jù)訓(xùn)練需求。

  提升效率方面,「云測數(shù)據(jù)標(biāo)注平臺4.0」通過數(shù)據(jù)傳輸、任務(wù)創(chuàng)建、數(shù)據(jù)標(biāo)注、數(shù)據(jù)質(zhì)檢、數(shù)據(jù)交付過程的全優(yōu)化,提升數(shù)據(jù)的交付效率,節(jié)省時間,從而幫助AI數(shù)據(jù)訓(xùn)練綜合效率提升200%、服務(wù)成本降低60%。

  「云測數(shù)據(jù)標(biāo)注平臺4.0」為企業(yè)提供了處理大規(guī)模感知數(shù)據(jù)的能力,不僅降低了數(shù)據(jù)采集周期,還提升了數(shù)據(jù)標(biāo)注效率,其在數(shù)據(jù)識別的準(zhǔn)確率方面,也達到了傳統(tǒng)數(shù)據(jù)標(biāo)注方式無法企及的高度,從工具層面為數(shù)據(jù)的質(zhì)量、多樣性提供保障,從而為企業(yè)節(jié)省了大量研發(fā)時間和成本。同時極大地促進了人工智能落地的迭代周期,助力人工智能技術(shù)發(fā)展從“探索期”向“成長期”過渡,為 “數(shù)字新基建、數(shù)據(jù)新要素”為特征的新一波數(shù)字經(jīng)濟浪潮保駕護航。

  結(jié)語:

  近日美國未來今日研究所(Future Today Institute)發(fā)布了《2021年科技趨勢報告》,趨勢報告內(nèi)容表明,人工智能正以驚人的速度從學(xué)術(shù)界轉(zhuǎn)向企業(yè),并認為未來戰(zhàn)爭將是一場基于數(shù)據(jù)和算法的“代碼戰(zhàn)”。

  展望未來,數(shù)據(jù)將成為各個行業(yè)的核心資產(chǎn),以高質(zhì)、高效為導(dǎo)向的AI訓(xùn)練數(shù)據(jù)工具,將成為激發(fā)數(shù)據(jù)要素新動能的強大驅(qū)動,為人工智能新發(fā)展發(fā)揮堅實底座和基礎(chǔ)支撐的重要作用。

  轉(zhuǎn)自:中華網(wǎng)


  【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65363056。

延伸閱讀

熱點視頻

“十三五”期間我國高技術(shù)制造業(yè)增長迅猛 “十三五”期間我國高技術(shù)制造業(yè)增長迅猛

熱點新聞

熱點輿情

?

微信公眾號

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964