數(shù)字人照進現(xiàn)實開啟新人生


中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)   時間:2023-03-02





近200萬個AI數(shù)字人“上崗”直播


  AIGC,即利用人工智能技術自動生成內(nèi)容,包括文字、圖片、音頻、視頻、代碼等。


  “AIGC紅極一時,絕不是一蹴而就,而是多年來數(shù)據(jù)集的積累,厚積薄發(fā)的力量?!蹦暇┬球鹂萍加邢薰綜EO魏佳星告訴記者,過去傳統(tǒng)人工智能偏向分析能力,而現(xiàn)在人工智能已經(jīng)進化到生成新內(nèi)容,通過大量的訓練數(shù)據(jù)和生成算法模型,自動生成文本、視頻等。而AIGC代表AI技術發(fā)展的新趨勢,帶來智能數(shù)字內(nèi)容孿生能力、編輯能力、創(chuàng)作能力等內(nèi)容創(chuàng)作的新變革。


  在視頻成為信息主要表達方式的當下,視頻內(nèi)容的AI自動生成超越語音、圖像等,成為AIGC的除ChatGPT以外的主要關注方向。在南京硅基智能科技有限公司,記者看到了許多和真人相比難辨真假的AI數(shù)字人。普通人只需要提供一段3—5分鐘的真人口播視頻,在AIGC技術下,僅需十幾分鐘時間就可生成一個超高擬真度的數(shù)字人主播?!霸谖覀兊募夹g支持下,已有近200萬個AI數(shù)字人‘上崗’,它們能代替真人出鏡拍視頻做直播,單次最長直播時長紀錄可達400小時?!惫杌悄軇?chuàng)始人司馬華鵬介紹,AI數(shù)字人的技術難點在于其核心“大腦”部分,依賴自然語言處理技術實現(xiàn)與人的高仿真交互。


  記者在現(xiàn)場看到,AI數(shù)字人的嘴型、動作和表情高度匹配,這是如何做到的?司馬華鵬解釋,這是硅基智能在行業(yè)內(nèi)領先的技術,同步效果要在對話中實時推理完成,對算法和算力的要求非常高?!爸挥型瑫r具備自然語言處理、語音識別和生成、視覺合成的整體AI能力,才能給用戶自然逼真的體驗。在硅基AI驅動技術和華為鯤鵬引擎的雙向加持下,打造超級人工智能算力,為高性能計算、數(shù)據(jù)庫、云計算等應用場景的工作負載進行高效加速,可廣泛應用于視頻制作、直播、多模態(tài)交互等場景。這是我們的核心競爭力?!?/p>


  “AIGC站上風口,主要體現(xiàn)在其‘邏輯性’,也就是除了撈取知識庫回答問題,AI已經(jīng)可以通過推理判斷,進行自己的知識體系升級,給出自己獨立思考后產(chǎn)出的結果?!眻D靈人工智能研究院總經(jīng)理李強認為,“目前AI賦能內(nèi)容生產(chǎn)在插畫、設計、醫(yī)療、教育等行業(yè),AI通過自學習,已達到行業(yè)標準并向外輸出。”


  御風而行,AIGC將給產(chǎn)品帶來哪些革新?“只要有想象力,普通人也可以制作出類似‘阿凡達’的大片。”李強告訴記者,AIGC將解放人類的雙手,目前圖靈人工智能研究院重點聚焦人工智能圖像生成,已經(jīng)開發(fā)了“小靈繪畫”和“AI畫靈”兩個產(chǎn)品,用戶基于AI算法,只要輸入關鍵詞或者一段描述場景的文字,便可在幾秒內(nèi)生成一張符合意境的圖片,無論浮世繪或是賽博朋克,梵高或是畢加索。


  魏佳星則認為,智能客服產(chǎn)品需要強大的計算能力快速處理大量數(shù)據(jù),而AIGC擁有巨量的語言模型,且其自然語言生成技術可以生成更人性化的回復,兩者結合,客戶將能夠得到更快速的響應,以及更準確的答案。


  數(shù)字“造人”賦能產(chǎn)業(yè)升級


  《中國互聯(lián)網(wǎng)發(fā)展報告2022》公布的數(shù)據(jù)顯示,江蘇省人工智能領域核心企業(yè)超過1000家,人工智能相關產(chǎn)業(yè)規(guī)模超過2000億元。江蘇人工智能產(chǎn)業(yè)正積極搶抓國家新一代人工智能示范應用戰(zhàn)略機遇,持續(xù)加強人工智能基礎層、技術層、應用層等全產(chǎn)業(yè)鏈研發(fā)部署。在《2021—2022中國人工智能計算力發(fā)展評估報告》中,南京、蘇州分列中國人工智能城市排行榜上第四名和第六名。AIGC在我省落地情況如何?


  “我們用AI技術造人,可為各行各業(yè)輸送大量數(shù)字勞動力?!彼抉R華鵬告訴《科技周刊》記者,目前人類從事著許多重復性的腦力勞動,數(shù)字人打造人類“數(shù)字分身”,幫助企業(yè)數(shù)字化轉型。硅基智能研發(fā)的數(shù)字人產(chǎn)品,目前已應用于數(shù)字人主播、數(shù)字人客服、數(shù)字人醫(yī)生、數(shù)字人教師等各類場景。AIGC大幅度降低了數(shù)字內(nèi)容生產(chǎn)的成本,打破了數(shù)字內(nèi)容生產(chǎn)受到人類想象能力和知識水平的限制。


  如近期南京市商務局啟動“南京百萬數(shù)字人創(chuàng)業(yè)計劃”,依托“AI數(shù)字人”技術將數(shù)字人在直播、短視頻方面的數(shù)字化優(yōu)勢融入線下消費場景,可實現(xiàn)7×24小時全天候直播,為小店發(fā)展降本增效、聚客引流,推動實體小店智能化改造、數(shù)字化升級?!拔覀兞幰荒陜?nèi)打造約20萬個數(shù)字人,服務約2000家企業(yè);3—5年內(nèi)打造約100萬個數(shù)字人,用AI技術賦能傳統(tǒng)行業(yè)?!?/p>


  AIGC內(nèi)部技術協(xié)同也為其應用落地提供了更多“破題思路”。魏佳星告訴記者,云蝠智能AI外呼和數(shù)字人產(chǎn)品之間正在考慮形成一種協(xié)同效應。他解釋,兩者協(xié)同工作時,云蝠智能AI外呼可以幫助企業(yè)快速接通客戶電話,數(shù)字人產(chǎn)品可以與客戶進行人性化的溝通,推薦符合客戶需求的產(chǎn)品和服務,解決客戶的問題,實現(xiàn)更加精準的市場推廣。


  李強說,相信AIGC會對所有內(nèi)容生成相關的行業(yè)產(chǎn)生深遠的影響,在文化、金融、醫(yī)療、安全、教育等領域都大有作為,例如虛擬直播人、汽車人機交互、虛擬老師、AI問診、智能客服、語言翻譯等,應用場景非常寬泛。另外,隨著AIGC技術與行業(yè)的深入融合,又會催生出很多新的市場需求,例如,對制造業(yè)數(shù)字化轉型及數(shù)字政府建設產(chǎn)生進一步驅動力,“而江蘇內(nèi)容生態(tài)市場空間廣闊,政府隨著人工智能行業(yè)的不斷發(fā)展,對政策內(nèi)容也持續(xù)進行細化,從頂層設計至創(chuàng)新成果轉化路徑,再到技術層面都有相應政策指導,未來路徑更為清晰。”圖靈人工智能研究院已經(jīng)在相關領域開始布局。


  爆發(fā)態(tài)勢的AIGC距頂峰還有距離


  AIGC已經(jīng)可比肩“類人智能”了嗎?李強的答案是,技術的發(fā)展往往是爆發(fā)式的,也許當前AIGC的這次爆發(fā)還僅僅只是開始。他舉例,現(xiàn)在爆紅的ChatGPT作為AIGC概念下衍生出的一個模型工具,當下的技術發(fā)展還未達到數(shù)字永生的程度,未來還未可知。目前雖然ChatGPT實現(xiàn)了文本生成的部分場景的“可用”,但遠沒有達到完全的“可信”,在不擅長的領域,ChatGPT會“一本正經(jīng)地胡說八道”。


  據(jù)悉,目前ChatGPT背后的GPT3.5大模型,參數(shù)大概1750億個,而人腦擁有近1000億個神經(jīng)元和100萬億個連接,模型的參數(shù)量級還遠沒有達到人腦的突觸數(shù)量級。并且,AIGC模型需要大量數(shù)據(jù)參與訓練,因此對算力基礎設施有較高要求,這使得頭部企業(yè)的規(guī)模優(yōu)勢更加突出,腰部企業(yè)有被“腰斬”的風險。


  近期,各類AIGC產(chǎn)品呈井噴式出現(xiàn)。李強提醒用戶,過度依賴自動生成內(nèi)容可能導致內(nèi)容缺乏多樣性或原創(chuàng)性,也無法擁有批判性、共情力,所以將其作為輔助工具,用來幫助信息搜集、信息梳理、謀篇布局成為最優(yōu)選。


  人工智能算法真的能做到公平、公正、無害嗎?AIGC帶來技術紅利的同時也帶來了造假、侵權行為泛濫、信息繭房、算法歧視等多重風險。目前,部分開源的AIGC項目對生成的圖像監(jiān)管力度較低,數(shù)據(jù)集系統(tǒng)利用私人用戶照片進行AI訓練,制造虛假音視頻圖像進行誹謗、詐騙、勒索等違法行為已屢見不鮮。此外,一些用戶利用AIGC制作出暴力和性有關的畫作,一些平臺已經(jīng)開始進行倫理方面的限制和干預,相關法律法規(guī)也有待進一步完善。


  對此,構建開放有序的AIGC生態(tài)尤為重要。李強認為,應鼓勵各方加速共性技術和基礎產(chǎn)品研發(fā),重視人工智能技術標準的建設、產(chǎn)品性能與系統(tǒng)安全的測試,積極參與AIGC應用、治理、完善等領域的國際規(guī)則制定和全球發(fā)展合作。另外,提升關鍵技術方面,在算法技術、AI工程化等方面加強攻關,以突破算法透明度、魯棒性、偏見與歧視等技術局限,不斷打磨推出更為安全、可信、可靠的人工智能技術產(chǎn)品,打破技術瓶頸。


  圖靈人工智能研究院也在加速AI內(nèi)容審核和防篡改能力的升級,前者可以對違規(guī)違法的圖文、視頻甚至是直播信息進行自動審核、過濾,后者基于深度學習和端到端強化學習技術,可以對圖片、文字的真實性進行鑒定。業(yè)務方的測試和實跑數(shù)據(jù)顯示,在身份證復印件、門頭照、執(zhí)照復印件、特殊資質等文件類型上已達到行業(yè)最高標準,針對單張圖片的篡改檢測可以在1秒內(nèi)完成。


  “技術的進步帶來身體的延展,借AI之力,人的有限性得以拓展和超越。探索用主流價值導向駕馭‘算法’,為大眾提供更具情感溫度和人文關懷的信息服務,是人工智能時代的應有之舉和努力方向?!崩顝娬f。


  轉自:新華日報

  【版權及免責聲明】凡本網(wǎng)所屬版權作品,轉載時須獲得授權并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關法律責任的權力。凡轉載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權事宜請聯(lián)系:010-65363056。

延伸閱讀

?

微信公眾號

版權所有:中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964