求學時代的困惑
21世紀伊始,年輕的陳忻赴美國斯坦福大學求學,后在波士頓大學做助理教授??蒲泄ぷ鞯娜粘>褪遣殚喐魇礁鳂拥奈墨I資料。和很多初入科研的青年學子一樣,陳忻驚奇地發(fā)現(xiàn),很多文獻資料都要付費購買版權(quán),甚至引用自己之前發(fā)表的論文中的數(shù)據(jù)圖表等,也必須征得出版社的授權(quán)。而學術(shù)界的一半以上的期刊,被以Elsevier,Wiley等巨頭所控制??萍汲霭鏄I(yè)的頭部企業(yè)全部為歐美公司,他們攫取了高額利潤的同時,更是對科研數(shù)據(jù)形成了一定程度上的壟斷。特別是美國等利用學術(shù)期刊坐收全球材料科研成果數(shù)據(jù)。諸如NIST、SciFinder、HSC Chemistry、NOMAD、ICSD之類的國際高端出版商和數(shù)據(jù)庫,為全球提供基礎材料數(shù)據(jù)檢索服務的同時,也在某種程度上把控了這些材料數(shù)據(jù)的來源和使用情況。事實上,西方發(fā)達國家早就對數(shù)據(jù)的收集整理有所布局,如日本長期收集我國材料開發(fā)數(shù)據(jù),歐盟費盡心機想與我國共建數(shù)據(jù)平臺,而我國的數(shù)據(jù)資料收集整理工作起步晚,很容易被卡脖子、扼咽喉。
2011年,時任美國總統(tǒng)奧巴馬宣布啟動一項價值超過5億美元的“先進制造業(yè)伙伴關系”計劃,其中重點之一為“材料基因計劃”。美國政府計劃加強政府、高校和企業(yè)之間的相互合作和數(shù)據(jù)共享,他們希望通過材料基因計劃來倡導高通量計算、高通量制備與表征、專用數(shù)據(jù)庫三大技術(shù)及其平臺建設,以期推進新材料的開發(fā)技術(shù),強化美國在制造業(yè)方面的領先地位。
陳忻敏銳地感覺到——數(shù)據(jù)共享以及材料設計的技術(shù)提升將是未來全球發(fā)展的“兵家必爭之地”。 實驗室里被擱置一邊、無人問津的原始科研材料數(shù)據(jù)將會是未來產(chǎn)業(yè)發(fā)展的基礎和國家重要的戰(zhàn)略資源。從此,陳忻的心里埋下了一顆種子。他希望能夠做好基礎數(shù)據(jù)的收集和整理,在未來全球競爭中為我國的材料數(shù)據(jù)提前布局、搶占賽道。
無人欣賞的跋山涉水
所謂光輝歲月,不是萬眾矚目時的閃亮奪目,而是無人欣賞時的跋山涉水。數(shù)據(jù)整理是數(shù)據(jù)共享的前提和基礎。陳忻決心摒除雜念,偏離了學術(shù)圈里發(fā)文章的“正途”,選擇開始長期艱苦的數(shù)據(jù)清洗和整理工作。數(shù)據(jù)清洗的第一步就是為材料數(shù)據(jù)打標簽。這個工作有時也被稱作數(shù)據(jù)標注——是一份“最不性感、最沒成就感”的工作。例如,一開始只能通過人力,先從網(wǎng)上搜集來大量的國內(nèi)外文獻資料,然后需要有交叉學科背景的人基于精準的語義理解,對每個字段、每種數(shù)據(jù)做物理化學分析和歸類,畫上經(jīng)過理解和分析的符號和標注。只這一件事,就不能一蹴而就,而是真正的苦活累活。

來源:機器學習研究會
知識圖譜技術(shù)是人工智能技術(shù)的組成部分,其強大的語義處理和開放組織能力,為智能化信息應用提供了基礎,被稱為“知識域可視化、知識領域映射地圖”。這項技術(shù)在2012年首先由Google正式提出,迄今為止,其實際應用在發(fā)達國家已經(jīng)逐步拓展并取得了較好的效果,但在我國仍然處于研究的起步階段。在做標簽積累的工作中,陳忻想到結(jié)合量子化學計算和人工智能預測來對材料領域的大量數(shù)據(jù)進行挖掘,并通過深度學習來建立模型,從“苦干”轉(zhuǎn)為“巧干”。這一想法與中國科學技術(shù)大學的師兄弟們不謀而合。2020年陳忻帶著“中國科學技術(shù)大學本科、斯坦福博士、波士頓大學教授”的光環(huán),回國了。他與師兄弟們一起,研究如何結(jié)合量子化學計算和人工智能預測,建立材料數(shù)據(jù)之間的構(gòu)效關系,全力以赴努力搭建第一代中國人自己的材料科學知識圖譜。
第一個案例的啟發(fā)
中國的學術(shù)界和產(chǎn)業(yè)界也逐漸開始意識到數(shù)據(jù)對于學術(shù)研究和產(chǎn)業(yè)創(chuàng)新發(fā)展的重要意義。2015年9月,我國正式印發(fā)《促進大數(shù)據(jù)發(fā)展行動綱要》,這是國家發(fā)布的首個大數(shù)據(jù)國家行動計劃。大數(shù)據(jù)科學與人工智能技術(shù)的結(jié)合,在先進材料研發(fā)中逐漸嶄露頭角,以數(shù)據(jù)驅(qū)動創(chuàng)新的研究新范式則體現(xiàn)出巨大優(yōu)勢。材料研發(fā)的傳統(tǒng) “試錯”模式、“炒菜式”不僅高成本、低效率,周期跨度可能為十幾年甚至幾十年,嚴重制約了我國的產(chǎn)業(yè)升級與經(jīng)濟發(fā)展。

來源:福建物質(zhì)結(jié)構(gòu)研究所
在做數(shù)據(jù)整理的過程中,陳忻就遇到這樣一個合作案例。某集團發(fā)現(xiàn)自己的組合發(fā)動機中的金屬配件需要進行改進,他們的研發(fā)團隊嘗試了多種方案都未能實現(xiàn)。陳忻及其團隊利用搭建的數(shù)據(jù)平臺,為其模擬出燃燒流場、大渦流場,并找到了記憶金屬設計的配方。這一合作直接產(chǎn)生了巨大的經(jīng)濟效益,為該集團加快項目進度5個月,節(jié)省成本4300多萬元。同時,陳忻及其團隊通過這次合作還產(chǎn)生了意外之喜:他們收集了10萬種各類合金演化結(jié)構(gòu)數(shù)據(jù)和金屬原子間相互作用能數(shù)據(jù)——這些數(shù)據(jù)能豐富和完善已有的數(shù)據(jù)庫平臺體系,對團隊來說“價值連城”。“數(shù)據(jù)”就是科研和產(chǎn)業(yè)的共同語言,而數(shù)據(jù)庫平臺就是鏈接科研與產(chǎn)業(yè)的橋梁!
機數(shù)量子的 “靈魂熊貓”
2016年,中科寒武紀創(chuàng)立,來自中國科學技術(shù)大學少年班學院的陳天石、陳云霽兄弟二人白手起家,挑戰(zhàn)冷門的人工智能芯片方向,隨后通過自主研發(fā),成為全球智能芯片領域的先行者。
陳忻也不是孤軍奮戰(zhàn)??拼髱熜纸〗淌谠趯W校做基礎科學研究,立志將人工智能和量子化學相結(jié)合。師兄弟二人一拍即合,決心以產(chǎn)業(yè)化方式做一次大膽的嘗試,通過歸納法與演繹法相結(jié)合來進行科學研究,將人工智能和大數(shù)據(jù)技術(shù)應用到材料研發(fā),帶來學術(shù)和產(chǎn)業(yè)上的聯(lián)合突破。
于是,機數(shù)量子應運而生。

圖:機數(shù)量子愿景、使命、精神
機數(shù)量子以“量子化學計算、大數(shù)據(jù)分析、人工智能預測”為核心技術(shù),十年前就開始著手對材料數(shù)據(jù)進行整合和清洗,經(jīng)過“板凳一坐十年冷”的煎熬,率先建立了材料基因創(chuàng)新研究平臺,開發(fā)了中國首個材料知識圖譜,已建成世界一流、亞洲最大的材料數(shù)據(jù)庫平臺——機數(shù)大材庫(dcaiku)。
陳忻,成為了這支“熊貓俠士”里的“靈魂”代言人。之所以叫“熊貓俠士”,是因為他們跟功夫熊貓都有相同的特質(zhì):真誠、憨厚、聰穎、頑強,甚至連外在形象都有點相似。機數(shù)量子的熊貓俠士們,秉承創(chuàng)始人“俠之大者·為國為民”的情懷和夢想,一心要為國家構(gòu)筑我們中國人的數(shù)據(jù)長城,用數(shù)據(jù)賦能新材料的開發(fā)。
2018年,美國技術(shù)標準局NIST突然宣布停擺,科學家們無法登陸美國數(shù)據(jù)庫進行資料查看和下載。機數(shù)量子的 “機數(shù)大材庫”立刻派上了用場。央視新聞聯(lián)播不僅專訪了機數(shù)大材庫,還充分肯定材料數(shù)據(jù)是涉及到國家戰(zhàn)略安全的資源——機數(shù)量子面向世界科技前沿、面向經(jīng)濟主戰(zhàn)場、面向國家重大需求,再一次交出了一份滿意的答卷。
將量子化學和數(shù)據(jù)科學應用到材料開發(fā),打通數(shù)據(jù)生態(tài)鏈,帶來產(chǎn)業(yè)上的突破,是歷史的必然選擇和國家的發(fā)展方向。10月剛剛結(jié)束的“量子科學與前沿”雁棲湖會議,由中國科學院學部學術(shù)與出版工作委員會組織發(fā)起,中國科學院與北京市合作舉辦,中國科學技術(shù)大學承辦,機數(shù)量子等科技企業(yè)參與協(xié)辦。機數(shù)量子代表量子化學方向首次亮相雁棲湖會議,并向社會開放材料數(shù)據(jù)基礎檢索服務,展示了全球最前沿的科技創(chuàng)新思維和基于材料數(shù)據(jù)庫平臺的材料開發(fā)獨特視角,得到了與會專家和各方媒體的廣泛關注和充分肯定。

圖:機數(shù)量子總經(jīng)理陳忻接受媒體采訪
站在歷史的洪流中,十年跋山涉水,筑夢數(shù)據(jù)長城——陳忻知道,這只是剛剛開始。他對未來數(shù)據(jù)產(chǎn)業(yè)化發(fā)展方向充滿信心,因為宏偉的工程、歷史的突破正是由無數(shù)小成果、無數(shù)科研智慧聚集而成,數(shù)據(jù)長城最終是為了捍衛(wèi)國家的數(shù)據(jù)安全,提升材料研發(fā)的國際競爭力,是拓展國家基礎研究、完善材料應用基礎研究創(chuàng)新體系的重要一環(huán)。
他堅信,機數(shù)量子的“熊貓俠士”們將為量子化學添上數(shù)據(jù)智能的翅膀,飛躍新材料的研發(fā)鴻溝!
轉(zhuǎn)自:頭號新聞網(wǎng)
【版權(quán)及免責聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關法律責任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65363056。
延伸閱讀