隨著人工智能、虛擬現(xiàn)實等技術的發(fā)展和融合,數(shù)字人正在以高度擬人化進入生產(chǎn)生活各個領域,將成為數(shù)字經(jīng)濟發(fā)展的“新動能”,為 Z 時代新消費市場,以及產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型構(gòu)筑巨大的想象空間和應用前景。
作為領先的人工智能軟件公司,商湯科技正憑借領先的原創(chuàng)AI技術,不斷幫助降低AI數(shù)字人的應用門檻,推動數(shù)字人走入千行百業(yè),創(chuàng)造更大的商業(yè)空間。
近日,全球知名研究機構(gòu)弗若斯特沙利文(Frost & Sullivan,簡稱沙利文)聯(lián)合頭豹研究院發(fā)布《2022年中國數(shù)字人市場觀測報告-里程碑》。報告顯示,商湯科技數(shù)字人已全面進入“成熟階段”成為市場領導者,并在十個評估指標中獲得六項最高分,廠商整體競爭力排名第一。同時,國際數(shù)據(jù)公司(IDC)發(fā)布《中國AI數(shù)字人市場現(xiàn)狀與機會分析,2022》報告顯示,商湯科技憑借出色的產(chǎn)品能力、商業(yè)化案例、用戶體驗和戰(zhàn)略愿景,位列數(shù)字人廠商格局的第一梯隊。
圖:中國數(shù)字人市場綜合競爭表現(xiàn)(來源:沙利文咨詢,頭豹研究院)
今年4月,商湯科技聯(lián)合增強現(xiàn)實核心技術產(chǎn)業(yè)聯(lián)盟(CARA)共同發(fā)布了《企業(yè)級AI數(shù)字人:數(shù)字經(jīng)濟發(fā)展“新動能”》白皮書,首次將數(shù)字人的發(fā)展劃分為L1~L5五個等級,并闡述了商湯對AI數(shù)字人技術趨勢的核心洞察。
AI時代,數(shù)字人正在從有顏無智的“CG數(shù)字模特”,進化為可提高生產(chǎn)力、驅(qū)動創(chuàng)新服務的“擬人服務式AI”,融入數(shù)字中國的千行百業(yè),成為“十四五”數(shù)字經(jīng)濟的新交互媒介、新商業(yè)智能服務、新政務便民窗口。通過數(shù)字技術實現(xiàn)對現(xiàn)實世界的改造,AI數(shù)字人將促進數(shù)字經(jīng)濟與實體經(jīng)濟的融合和發(fā)展,成為實體產(chǎn)業(yè)生產(chǎn)力的代表。
L4級數(shù)字人將推動生產(chǎn)力變革
曾經(jīng),游戲、電影中創(chuàng)作的逼真CG人物是科幻遐想的代表。如今,這樣的人物已經(jīng)可以在現(xiàn)實世界中與我們面對面互動,變身各式各樣的服務助手。
從完全手工創(chuàng)作到完全智能化交互,在白皮書中,商湯從擬人化和生產(chǎn)自動化兩個維度,將數(shù)字人的進化歷程劃分為五個階段:
L1級:主要以人工制作為主;
L2級:依靠動捕設備采集表情、肢體等動作,例如電影動畫制作;
L3級:可依靠算法驅(qū)動口型、表情和動作,例如虛擬化身實時互動;
L4級:實現(xiàn)部分智能化交互,在垂直領域創(chuàng)新服務模式;
L5級:實現(xiàn)完全智能化交互,打造真正的個性化虛擬助手。
達到L4級別,意味著數(shù)字人不僅實現(xiàn)了AI仿真動畫生成能力與自然語言理解能力的結(jié)合,通過學習大量的真人會話、語氣、表情和動作,可根據(jù)表達內(nèi)容生成相應神態(tài)和全身動作,輸出栩栩如生的擬人效果,同時,結(jié)合AI算法在制作流程中的深度融合(AIGC),制作效率也得到了大幅提升。只有達到L4或更高級別,AI數(shù)字人才能真正的走入千行百業(yè),推動生產(chǎn)力的變革。
在深度學習技術的加持下,更高級別的AI數(shù)字人將逐步兼具人類認知能力和機器認知能力,既可以在短時間內(nèi)學習不同領域的人類知識,成為相關領域的專家,同時又可以在海量數(shù)據(jù)中提取更多規(guī)律,超越人類的現(xiàn)有認知,突破生產(chǎn)力的邊界。
實現(xiàn)AI數(shù)字人“量產(chǎn)”,提效千行百業(yè)
白皮書指出,多模態(tài)交互、深度學習和AIGC是AI數(shù)字人的三大特征。其中,在應用層面,多模態(tài)交互是 AI 數(shù)字人的“核心力”,可以充分模擬人與人之間自然真實的交互方式;在價值層面,深度學習是 AI 數(shù)字人的“創(chuàng)造力”,能夠結(jié)合不同領域的知識庫和海量數(shù)據(jù)訓練,進行深度學習和迭代升級,快速適應瞬息萬變的市場變化和細分化的場景需求;在制作層面,AIGC 是 AI 數(shù)字人的“生產(chǎn)力”,可結(jié)合 AI 算法快速生成數(shù)字人高精度 3D 模型,將傳統(tǒng)以月計算的制作周期縮短至數(shù)天內(nèi)完成。
作為AI數(shù)字人技術的領導者,商湯以原創(chuàng)的多模態(tài)交互、深度學習和全棧式的AIGC(AI Generated Content)技術,構(gòu)建了智能化生成、智能化驅(qū)動和智能化交互三大引擎,打造出“一站式”AI數(shù)字人生產(chǎn)流水線。在實現(xiàn)媲美真人的逼真程度上,讓AI數(shù)字人“更聰明、更專業(yè)”,并實現(xiàn)“聽得懂,看得見,說得出”的人機交互效果。
得益于自動化的流水線,商湯已根據(jù)行業(yè)需求,快速、靈活地創(chuàng)建了不同角色的AI數(shù)字人,在文旅、展館、金融、教育、商超等實體產(chǎn)業(yè)中規(guī)模化應用,為用戶提供多樣化的服務和體驗。
比如,在上海中共一大紀念館中,商湯AI數(shù)字人擔任講解員,為參會者講解黨史;在廣州永旺商城,商湯AI數(shù)字人則是導購員,為顧客提供智能的問詢服務;在寧波銀行上海分行,擔任大堂經(jīng)理,提供各類業(yè)務咨詢和問題回復。在2020年世界人工智能大會上,商湯AI數(shù)字人還擔任大會導覽員,向參會嘉賓講解AI在不同領域的落地應用和成果。
而在醫(yī)院場景,AI數(shù)字人可以為患者進行分診導診,在減輕導診臺壓力的同時為患者帶來有溫度的關懷。在智能汽車的車艙中,AI數(shù)字人還可化身虛擬行車伴侶,為用戶定制專屬形象,并通過媲美真人的動作和語言與用戶互動,為人車交互融入更多情感元素。
隨著技術發(fā)展邁向更高階的智能等級,AI數(shù)字人也將不僅限于我們所看到的人物形象,它成為可以通過不斷機器學習,成為突破想象力的AI智能體。
例如在游戲中,AI驅(qū)動的NPC可以與人類玩家協(xié)同作戰(zhàn);在社群中,AI可以成為擔任社群管理員,提升運營效率和管理水平。
在不遠的未來,無論是在現(xiàn)實世界還是影視、游戲作品中,AI數(shù)字人、AI智能體都將無處不在,為我們增添娛樂體驗、帶來便捷服務、實現(xiàn)效率提升,深刻改變我們的生活和工作方式。白皮書指出,隨著人工智能、虛擬現(xiàn)實等相關技術的逐步成熟,通過深度學習和認知泛化,AI數(shù)字人將會全面突破應用邊界,升級成為數(shù)字世界的“超級助手”。
如需獲取《企業(yè)級AI數(shù)字人:數(shù)字經(jīng)濟發(fā)展“新動能”》白皮書,敬請關注商湯智能產(chǎn)業(yè)研究院公眾號并回復“數(shù)字人白皮書”獲取,或點擊以下鏈接直接下載:
https://oss.sensetime.com/files/AI%20digital%20man%20whitepaper.pdf
05-31
2024
亞馬遜研發(fā)支出領跑全球 科技巨頭創(chuàng)新競賽日趨激烈
根據(jù)全球知名市場研究機構(gòu)Gartner最新發(fā)布的數(shù)據(jù),2023年全球企業(yè)研發(fā)支出總額達到3.1萬億美元,同比增長5.2%。其中,亞馬遜以...
08-15
2022
中央媒體名單 :嚴格意義上的中央媒體名單: 報紙類中央媒體:人民日報、中國日報、經(jīng)濟日報、光明日報、解放軍報、工人日報、農(nóng)...
05-13
2025
TRYX創(chuàng)氪星系 將攜多款新品亮相COMPUTEX 2025
全球知名的科技盛會COMPUTEXTAIPEI2025即將開幕。上周,高端PC硬件品牌TRYX創(chuàng)氪星系于官方社交媒體賬號官宣C...
01-02
2025
2025年將建成“星座”一期覆蓋全球 吉利加速布局天地一體化出行生態(tài)
2024年12月下旬的一天,在穿上防護服、戴上頭套,通過防塵吹風機后,記者終于進入到位于浙江省臺州灣新區(qū)的吉利衛(wèi)星超級工廠,一...
01-26
2022
【行業(yè)動態(tài)】2022第一季度延期展會通知匯總
中國國際縫制設備展覽會(CISMA)是全球最大的專業(yè)縫制設備展覽會,展品包含了縫前、縫制、縫后各類機器以及CAD/CAM設...
03-21
2022
采購盛宴聚勢云端,無縫助力廠商貿(mào)易。3月18日-4月18日,2022年古鎮(zhèn)燈博會全球買家采購行線上展再次升級啟幕,在展網(wǎng)融合型B2B...
03-10
2022
2022年3月全國展會延期匯總都有哪些?快來看看吧!上述展會信息僅供參考,由于今年疫情情況特殊,展會時間/地點會存在不確定因素,...