近日,由中國(guó)計(jì)算機(jī)學(xué)會(huì)、中國(guó)中文信息學(xué)會(huì)和百度公司聯(lián)合舉辦的2021語(yǔ)言與智能技術(shù)競(jìng)賽落下帷幕。金融壹賬通人工智能研究院Gamma Lab登頂機(jī)器閱讀理解任務(wù)榜單,在與思必馳、漢儀字庫(kù)、華中科技大學(xué)等單位競(jìng)賽中,取得第一的好成績(jī)。據(jù)悉,該項(xiàng)賽事自2019年起至今已成功舉辦三屆,是國(guó)內(nèi)自然語(yǔ)言處理領(lǐng)域最權(quán)威的競(jìng)賽之一,在業(yè)內(nèi)具有廣泛影響力。
金融壹賬通人工智能研究院Gamma Lab憑借雄厚的技術(shù)實(shí)力、豐富的金融行業(yè)應(yīng)用場(chǎng)景和高速的成長(zhǎng)性等優(yōu)勢(shì),獲國(guó)際權(quán)威財(cái)經(jīng)媒體《財(cái)資》(The Asset)頒發(fā)的年度金融科技團(tuán)隊(duì)獎(jiǎng)。此外,Gamma Lab信息抽取技術(shù)、微表情識(shí)別、面部動(dòng)作單元識(shí)別、機(jī)器閱讀理解、自然語(yǔ)言生成、情緒識(shí)別、深度學(xué)習(xí)模型推理性能等技術(shù)均取得過(guò)世界第一的好成績(jī)。此次獲獎(jiǎng)也是繼英文機(jī)器閱讀理解(斯坦福機(jī)器閱讀理解競(jìng)賽SQuAD)之后,Gamma Lab在中文機(jī)器閱讀理解方面技術(shù)積累的又一體現(xiàn)。

作為自然語(yǔ)言處理領(lǐng)域最具挑戰(zhàn)的任務(wù)之一,機(jī)器閱讀理解不同于傳統(tǒng)的問(wèn)答系統(tǒng),無(wú)法通過(guò)預(yù)設(shè)的規(guī)則與知識(shí)庫(kù)直接反饋提問(wèn)結(jié)果,而是需要從文章上下文中尋找線索,利用一定的語(yǔ)義信息與推理能力定位準(zhǔn)確答案,同時(shí)需要考慮無(wú)答案、問(wèn)題或原文表達(dá)差異、依賴先驗(yàn)知識(shí)等問(wèn)題。
金融壹賬通Gamma Lab相關(guān)負(fù)責(zé)人表示,當(dāng)前的機(jī)器閱讀理解數(shù)據(jù)集大多都只采用單一的指標(biāo)來(lái)評(píng)測(cè)模型的好壞,缺乏對(duì)模型語(yǔ)言理解能力的細(xì)粒度、多維度評(píng)測(cè),導(dǎo)致模型的具體缺陷很難被發(fā)現(xiàn)和改進(jìn)。為了解決這個(gè)問(wèn)題,主辦方建立了細(xì)粒度的、多維度的評(píng)測(cè)數(shù)據(jù)集,推動(dòng)閱讀理解評(píng)測(cè)進(jìn)入“精細(xì)化“時(shí)代。同時(shí),主辦方提供大規(guī)模中文數(shù)據(jù)集,其中樣本均來(lái)自于實(shí)際應(yīng)用場(chǎng)景,難度大,考察點(diǎn)豐富,覆蓋了真實(shí)應(yīng)用中諸多難以解決的問(wèn)題。
此次競(jìng)賽具備兩大難點(diǎn):一是細(xì)粒度測(cè)評(píng)指標(biāo):相比以往比賽,從詞匯理解(vocab)、短語(yǔ)理解(phrase)、語(yǔ)義角色理解(semantic role)、容錯(cuò)性(fault-tolerant)、推理(reasoning)5類12方面考察模型能力,對(duì)模型的推理性、泛化性、穩(wěn)定性及知識(shí)融入是嚴(yán)峻挑戰(zhàn);二是無(wú)答案樣本:數(shù)據(jù)集中含有一定規(guī)模無(wú)答案樣本,此類樣本的上下文描述看似與提問(wèn)意圖接近、實(shí)際卻找不到正確答案,不僅影響數(shù)據(jù)平衡,還對(duì)模型有干擾作用。
針對(duì)以上難點(diǎn),Gamma Lab應(yīng)用了行為型微調(diào)(Behavioural Fine-tuning)、多模型集成等技術(shù)策略,從而從競(jìng)賽中脫穎而出,取得了第一的好成績(jī)。

除了不斷精進(jìn)自身的科技能力外,Gamma Lab一直積極將基于閱讀理解的技術(shù)賦能金融業(yè)務(wù),為智能審單、股類承做、坐席質(zhì)檢、政策查詢等業(yè)務(wù)提供支持。以智能審單技術(shù)為例,對(duì)一筆企業(yè)營(yíng)收賬款查詢,傳統(tǒng)流程需要審核上千份文件,引入智能審單模型后可提升150%以上效率。
未來(lái),Gamma Lab團(tuán)隊(duì)計(jì)劃將現(xiàn)有技術(shù)進(jìn)一步應(yīng)用于現(xiàn)有模型的迭代升級(jí)及更多業(yè)務(wù)場(chǎng)景拓展,用最先進(jìn)的技術(shù)賦能金融行業(yè)。
Gamma Lab作為金融壹賬通旗下人工智能研究院,致力于推動(dòng)大數(shù)據(jù)、人工智能等前沿技術(shù)在金融領(lǐng)域的深度應(yīng)用。Gamma Lab擁有眾多人工智能、大數(shù)據(jù)專家,累計(jì)申請(qǐng)專利技術(shù)200多項(xiàng),前后獲得近十項(xiàng)世界競(jìng)賽冠軍。Gamma Lab 的迅速崛起離不開金融壹賬通對(duì)科技人才、科技研發(fā)的持續(xù)投入。當(dāng)前,金融壹賬通研發(fā)技術(shù)人才就占46%,吸納了眾多來(lái)自牛津、清華、北大、復(fù)旦、上海交大等全球名校的人才不斷加入。未來(lái),金融壹賬通將憑借靈活多樣的產(chǎn)品矩陣和科技服務(wù)能力,為客戶創(chuàng)造更多的價(jià)值,把“科技讓金融更簡(jiǎn)單”落到實(shí)處。
轉(zhuǎn)自:福建都市網(wǎng)
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來(lái)源“中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場(chǎng)。版權(quán)事宜請(qǐng)聯(lián)系:010-65363056。
延伸閱讀

版權(quán)所有:中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號(hào)-2京公網(wǎng)安備11010502035964