當前位置首頁 > 文化藝術 > 要聞 >

數(shù)字人照進現(xiàn)實開啟新人生

中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng) 時間：2023-03-02

近200萬個AI數(shù)字人“上崗”直播

　　AIGC，即利用人工智能技術自動生成內(nèi)容，包括文字、圖片、音頻、視頻、代碼等。

　　“AIGC紅極一時，絕不是一蹴而就，而是多年來數(shù)據(jù)集的積累，厚積薄發(fā)的力量?！蹦暇┬球鹂萍加邢薰綜EO魏佳星告訴記者，過去傳統(tǒng)人工智能偏向分析能力，而現(xiàn)在人工智能已經(jīng)進化到生成新內(nèi)容，通過大量的訓練數(shù)據(jù)和生成算法模型，自動生成文本、視頻等。而AIGC代表AI技術發(fā)展的新趨勢，帶來智能數(shù)字內(nèi)容孿生能力、編輯能力、創(chuàng)作能力等內(nèi)容創(chuàng)作的新變革。

　　在視頻成為信息主要表達方式的當下，視頻內(nèi)容的AI自動生成超越語音、圖像等，成為AIGC的除ChatGPT以外的主要關注方向。在南京硅基智能科技有限公司，記者看到了許多和真人相比難辨真假的AI數(shù)字人。普通人只需要提供一段3—5分鐘的真人口播視頻，在AIGC技術下，僅需十幾分鐘時間就可生成一個超高擬真度的數(shù)字人主播?！霸谖覀兊募夹g支持下，已有近200萬個AI數(shù)字人‘上崗’，它們能代替真人出鏡拍視頻做直播，單次最長直播時長紀錄可達400小時?！惫杌悄軇?chuàng)始人司馬華鵬介紹，AI數(shù)字人的技術難點在于其核心“大腦”部分，依賴自然語言處理技術實現(xiàn)與人的高仿真交互。

　　記者在現(xiàn)場看到，AI數(shù)字人的嘴型、動作和表情高度匹配，這是如何做到的？司馬華鵬解釋，這是硅基智能在行業(yè)內(nèi)領先的技術，同步效果要在對話中實時推理完成，對算法和算力的要求非常高?！爸挥型瑫r具備自然語言處理、語音識別和生成、視覺合成的整體AI能力，才能給用戶自然逼真的體驗。在硅基AI驅動技術和華為鯤鵬引擎的雙向加持下，打造超級人工智能算力，為高性能計算、數(shù)據(jù)庫、云計算等應用場景的工作負載進行高效加速，可廣泛應用于視頻制作、直播、多模態(tài)交互等場景。這是我們的核心競爭力?！?/p>

　　“AIGC站上風口，主要體現(xiàn)在其‘邏輯性’，也就是除了撈取知識庫回答問題，AI已經(jīng)可以通過推理判斷，進行自己的知識體系升級，給出自己獨立思考后產(chǎn)出的結果?！眻D靈人工智能研究院總經(jīng)理李強認為，“目前AI賦能內(nèi)容生產(chǎn)在插畫、設計、醫(yī)療、教育等行業(yè)，AI通過自學習，已達到行業(yè)標準并向外輸出。”

　　御風而行，AIGC將給產(chǎn)品帶來哪些革新？“只要有想象力，普通人也可以制作出類似‘阿凡達’的大片。”李強告訴記者，AIGC將解放人類的雙手，目前圖靈人工智能研究院重點聚焦人工智能圖像生成，已經(jīng)開發(fā)了“小靈繪畫”和“AI畫靈”兩個產(chǎn)品，用戶基于AI算法，只要輸入關鍵詞或者一段描述場景的文字，便可在幾秒內(nèi)生成一張符合意境的圖片，無論浮世繪或是賽博朋克，梵高或是畢加索。

　　魏佳星則認為，智能客服產(chǎn)品需要強大的計算能力快速處理大量數(shù)據(jù)，而AIGC擁有巨量的語言模型，且其自然語言生成技術可以生成更人性化的回復，兩者結合，客戶將能夠得到更快速的響應，以及更準確的答案。

　　數(shù)字“造人”賦能產(chǎn)業(yè)升級

　　《中國互聯(lián)網(wǎng)發(fā)展報告2022》公布的數(shù)據(jù)顯示，江蘇省人工智能領域核心企業(yè)超過1000家，人工智能相關產(chǎn)業(yè)規(guī)模超過2000億元。江蘇人工智能產(chǎn)業(yè)正積極搶抓國家新一代人工智能示范應用戰(zhàn)略機遇，持續(xù)加強人工智能基礎層、技術層、應用層等全產(chǎn)業(yè)鏈研發(fā)部署。在《2021—2022中國人工智能計算力發(fā)展評估報告》中，南京、蘇州分列中國人工智能城市排行榜上第四名和第六名。AIGC在我省落地情況如何？

　　“我們用AI技術造人，可為各行各業(yè)輸送大量數(shù)字勞動力?！彼抉R華鵬告訴《科技周刊》記者，目前人類從事著許多重復性的腦力勞動，數(shù)字人打造人類“數(shù)字分身”，幫助企業(yè)數(shù)字化轉型。硅基智能研發(fā)的數(shù)字人產(chǎn)品，目前已應用于數(shù)字人主播、數(shù)字人客服、數(shù)字人醫(yī)生、數(shù)字人教師等各類場景。AIGC大幅度降低了數(shù)字內(nèi)容生產(chǎn)的成本，打破了數(shù)字內(nèi)容生產(chǎn)受到人類想象能力和知識水平的限制。

　　如近期南京市商務局啟動“南京百萬數(shù)字人創(chuàng)業(yè)計劃”，依托“AI數(shù)字人”技術將數(shù)字人在直播、短視頻方面的數(shù)字化優(yōu)勢融入線下消費場景，可實現(xiàn)7×24小時全天候直播，為小店發(fā)展降本增效、聚客引流，推動實體小店智能化改造、數(shù)字化升級?！拔覀兞幰荒陜?nèi)打造約20萬個數(shù)字人，服務約2000家企業(yè)；3—5年內(nèi)打造約100萬個數(shù)字人，用AI技術賦能傳統(tǒng)行業(yè)?！?/p>

　　AIGC內(nèi)部技術協(xié)同也為其應用落地提供了更多“破題思路”。魏佳星告訴記者，云蝠智能AI外呼和數(shù)字人產(chǎn)品之間正在考慮形成一種協(xié)同效應。他解釋，兩者協(xié)同工作時，云蝠智能AI外呼可以幫助企業(yè)快速接通客戶電話，數(shù)字人產(chǎn)品可以與客戶進行人性化的溝通，推薦符合客戶需求的產(chǎn)品和服務，解決客戶的問題，實現(xiàn)更加精準的市場推廣。

　　李強說，相信AIGC會對所有內(nèi)容生成相關的行業(yè)產(chǎn)生深遠的影響，在文化、金融、醫(yī)療、安全、教育等領域都大有作為，例如虛擬直播人、汽車人機交互、虛擬老師、AI問診、智能客服、語言翻譯等，應用場景非常寬泛。另外，隨著AIGC技術與行業(yè)的深入融合，又會催生出很多新的市場需求，例如，對制造業(yè)數(shù)字化轉型及數(shù)字政府建設產(chǎn)生進一步驅動力，“而江蘇內(nèi)容生態(tài)市場空間廣闊，政府隨著人工智能行業(yè)的不斷發(fā)展，對政策內(nèi)容也持續(xù)進行細化，從頂層設計至創(chuàng)新成果轉化路徑，再到技術層面都有相應政策指導，未來路徑更為清晰。”圖靈人工智能研究院已經(jīng)在相關領域開始布局。

　　爆發(fā)態(tài)勢的AIGC距頂峰還有距離

　　AIGC已經(jīng)可比肩“類人智能”了嗎？李強的答案是，技術的發(fā)展往往是爆發(fā)式的，也許當前AIGC的這次爆發(fā)還僅僅只是開始。他舉例，現(xiàn)在爆紅的ChatGPT作為AIGC概念下衍生出的一個模型工具，當下的技術發(fā)展還未達到數(shù)字永生的程度，未來還未可知。目前雖然ChatGPT實現(xiàn)了文本生成的部分場景的“可用”，但遠沒有達到完全的“可信”，在不擅長的領域，ChatGPT會“一本正經(jīng)地胡說八道”。

　　據(jù)悉，目前ChatGPT背后的GPT3.5大模型，參數(shù)大概1750億個，而人腦擁有近1000億個神經(jīng)元和100萬億個連接，模型的參數(shù)量級還遠沒有達到人腦的突觸數(shù)量級。并且，AIGC模型需要大量數(shù)據(jù)參與訓練，因此對算力基礎設施有較高要求，這使得頭部企業(yè)的規(guī)模優(yōu)勢更加突出，腰部企業(yè)有被“腰斬”的風險。

　　近期，各類AIGC產(chǎn)品呈井噴式出現(xiàn)。李強提醒用戶，過度依賴自動生成內(nèi)容可能導致內(nèi)容缺乏多樣性或原創(chuàng)性，也無法擁有批判性、共情力，所以將其作為輔助工具，用來幫助信息搜集、信息梳理、謀篇布局成為最優(yōu)選。

　　人工智能算法真的能做到公平、公正、無害嗎？AIGC帶來技術紅利的同時也帶來了造假、侵權行為泛濫、信息繭房、算法歧視等多重風險。目前，部分開源的AIGC項目對生成的圖像監(jiān)管力度較低，數(shù)據(jù)集系統(tǒng)利用私人用戶照片進行AI訓練，制造虛假音視頻圖像進行誹謗、詐騙、勒索等違法行為已屢見不鮮。此外，一些用戶利用AIGC制作出暴力和性有關的畫作，一些平臺已經(jīng)開始進行倫理方面的限制和干預，相關法律法規(guī)也有待進一步完善。

　　對此，構建開放有序的AIGC生態(tài)尤為重要。李強認為，應鼓勵各方加速共性技術和基礎產(chǎn)品研發(fā)，重視人工智能技術標準的建設、產(chǎn)品性能與系統(tǒng)安全的測試，積極參與AIGC應用、治理、完善等領域的國際規(guī)則制定和全球發(fā)展合作。另外，提升關鍵技術方面，在算法技術、AI工程化等方面加強攻關，以突破算法透明度、魯棒性、偏見與歧視等技術局限，不斷打磨推出更為安全、可信、可靠的人工智能技術產(chǎn)品，打破技術瓶頸。

　　圖靈人工智能研究院也在加速AI內(nèi)容審核和防篡改能力的升級，前者可以對違規(guī)違法的圖文、視頻甚至是直播信息進行自動審核、過濾，后者基于深度學習和端到端強化學習技術，可以對圖片、文字的真實性進行鑒定。業(yè)務方的測試和實跑數(shù)據(jù)顯示，在身份證復印件、門頭照、執(zhí)照復印件、特殊資質等文件類型上已達到行業(yè)最高標準，針對單張圖片的篡改檢測可以在1秒內(nèi)完成。

　　“技術的進步帶來身體的延展，借AI之力，人的有限性得以拓展和超越。探索用主流價值導向駕馭‘算法’，為大眾提供更具情感溫度和人文關懷的信息服務，是人工智能時代的應有之舉和努力方向?！崩顝娬f。

　　轉自：新華日報

返回產(chǎn)經(jīng)網(wǎng)首頁 >>

　　【版權及免責聲明】凡本網(wǎng)所屬版權作品，轉載時須獲得授權并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”，違者本網(wǎng)將保留追究其相關法律責任的權力。凡轉載文章及企業(yè)宣傳資訊，僅代表作者個人觀點，不代表本網(wǎng)觀點和立場。版權事宜請聯(lián)系：010-65363056。

延伸閱讀

熱點視頻

前兩個月工業(yè)經(jīng)濟穩(wěn)定恢復，企業(yè)利潤同比繼續(xù)保持增長

熱點新聞

熱點輿情

數(shù)字人照進現(xiàn)實開啟新人生

熱點視頻

熱點新聞

熱點輿情

微信公眾號