
AI數(shù)字人,可能是最快跑通大模型商業(yè)閉環(huán)的產(chǎn)品之一,現(xiàn)在已接近盈利分水嶺。
文|趙艷秋
編|牛慧
“在今年夏季,一個(gè)數(shù)字人主播的直播間,有時(shí)一天能賣出幾萬(wàn)塊錢西瓜,甚至更多。”中科深智CTO宋健告訴數(shù)智前線,“按照分傭模式,商家和數(shù)字人企業(yè)都能掙到錢,這是一個(gè)很正向的過(guò)程。”
過(guò)去,大模型被詬病“燒錢多、商業(yè)難”,但AI數(shù)字人,可能是最快跑通商業(yè)閉環(huán)的產(chǎn)品之一。它們是形似人類、聲似人類,且能與人類對(duì)話和交互的智能體。目前已從技術(shù)驅(qū)動(dòng)期走入商業(yè)驗(yàn)證期,并接近盈利分水嶺。
01
數(shù)字人在直播間開(kāi)始“逼單”
“我們不太再區(qū)分真人和數(shù)字人了。”宋健說(shuō),F(xiàn)在,在直播帶貨市場(chǎng),一個(gè)時(shí)間段中能賣出多少貨,是最重要的指標(biāo),誰(shuí)播的并不重要。
事實(shí)上,一位中級(jí)真人主播每月的綜合人力成本普遍在2萬(wàn)元以上,而他們一天中狀態(tài)最好的直播時(shí)長(zhǎng),最多四小時(shí)。更關(guān)鍵的是,對(duì)于季節(jié)性強(qiáng)、毛利低的生鮮產(chǎn)品而言,商家難以長(zhǎng)期雇傭真人主播,且也不愿意承擔(dān)日益加重的固定成本。

數(shù)字人主播可以全天候工作,而對(duì)于西瓜這類產(chǎn)品,消費(fèi)者的決策過(guò)程可能只需幾秒,直播畫(huà)面重點(diǎn)要體現(xiàn)瓜的新鮮度。在這種情況下,采用數(shù)字人直播的效率會(huì)比真人更高。
商家正在擁抱數(shù)字人。在今年“618”期間,京東宣布1.7萬(wàn)品牌商家使用數(shù)字人直播帶貨。
數(shù)字人的帶貨“技巧”也在躥升。過(guò)去,它們僅能重復(fù)播放固定內(nèi)容。現(xiàn)在,數(shù)字人也能“看懂”抖音、淘寶的后臺(tái)數(shù)據(jù),并學(xué)會(huì)了真人主播摸索出來(lái)的“套路”。比如,在觀眾超過(guò)50人時(shí)觸發(fā)“逼單”策略——“下面我要放出多少單,請(qǐng)用戶在屏幕上叩1”,從而制造從眾感和購(gòu)買壓力,讓用戶迅速進(jìn)入購(gòu)買狀態(tài)。數(shù)字人主播越來(lái)越像人。
在這樣的形勢(shì)下,之前一些對(duì)數(shù)字人有限制的大平臺(tái),也都在放松規(guī)定,制定自己在數(shù)字人上的策略,畢竟這是一個(gè)大勢(shì)。
不僅是電商直播,Gartner高級(jí)首席分析師費(fèi)天褀告訴數(shù)智前線,在他們的2025年針對(duì)中國(guó)AI市場(chǎng)的調(diào)研中發(fā)現(xiàn),數(shù)字人已成為“用戶活躍度和行業(yè)參與度最高的應(yīng)用之一”。數(shù)字人在電商、文娛、金融、教育等多個(gè)行業(yè)表現(xiàn)活躍。
數(shù)字人之所以能夠跑通商業(yè)閉環(huán),核心驅(qū)動(dòng)因素是制作與運(yùn)營(yíng)成本的快速下降。行業(yè)數(shù)據(jù)顯示,虛擬主播24小時(shí)直播成本,已低于真人主播的十分之一。
百度智能云資深人士告訴數(shù)智前線,核心驅(qū)動(dòng)力,來(lái)自大模型技術(shù)與應(yīng)用能力的發(fā)展——大模型推理成本一年內(nèi)下降近 60倍,多模態(tài)技術(shù)成熟,關(guān)鍵場(chǎng)景可用性顯著提升。
從技術(shù)角度看,數(shù)字人由過(guò)去依賴高度定制的動(dòng)捕設(shè)備、專業(yè)團(tuán)隊(duì)建模,演進(jìn)至今天AI算法驅(qū)動(dòng)的自生成。如今只需上傳一張照片、錄制一段語(yǔ)音,AI便能生成虛擬形象。如小冰2024年的“零樣本”數(shù)字人,只要上傳30秒的形象數(shù)據(jù)和10秒的聲音數(shù)據(jù),可以秒級(jí)完成形象聲音復(fù)刻,這背后是大模型等技術(shù)的支撐。從運(yùn)營(yíng)來(lái)看,京東云已公布,言犀數(shù)字人平均成本不到100元/天。
這也讓數(shù)字人應(yīng)用從過(guò)去的試驗(yàn)性投入,進(jìn)入到更具規(guī)模的行業(yè)化部署。在百度智能云披露的一組案例中,一家餐飲企業(yè)使用數(shù)字人進(jìn)行6小時(shí)直播,僅為真人直播15%的成本,銷售效果達(dá)到真人主播的85%。
教育行業(yè)也正在經(jīng)歷類似的轉(zhuǎn)變。以某頭部機(jī)構(gòu)為例,在用數(shù)字人替代真人錄制課程后,綜合制作成本下降1/3,錄制效率提升20倍。
數(shù)字人的商業(yè)變現(xiàn)模式也已清晰。在B端市場(chǎng),主流模式有SaaS訂閱制、項(xiàng)目定制和分成三種。

在C端,有訂閱、數(shù)字分身付費(fèi)等。其中,游戲方面的訂閱服務(wù)已被接受,但像克隆數(shù)字人按月付費(fèi),在國(guó)內(nèi)尚未形成大規(guī)模消費(fèi)習(xí)慣。
不過(guò),盡管AI數(shù)字人技術(shù)在快速普及,市場(chǎng)增速卻呈現(xiàn)線性增長(zhǎng)而非指數(shù)級(jí)爆發(fā)。IDC報(bào)告稱,預(yù)計(jì)數(shù)字人2024-2029年復(fù)合增長(zhǎng)率為43.5%,到2029年,市場(chǎng)規(guī)模將達(dá)到250.5億元人民幣。“這一增長(zhǎng)在互聯(lián)網(wǎng)行業(yè)屬于平穩(wěn)型增長(zhǎng)。”硅基智能相關(guān)人士對(duì)數(shù)智前線說(shuō)。
“可以視為一個(gè)階段性的應(yīng)用‘爆發(fā)’。”小冰科技CEO徐元春說(shuō),一方面是由于數(shù)字人應(yīng)用成本的下降,另一方面則是因?yàn)榇笮蚄A客戶的場(chǎng)景驗(yàn)證進(jìn)入深水區(qū),需要更長(zhǎng)地周期去探索和突破。他認(rèn)為,當(dāng)數(shù)字人技術(shù)能同時(shí)滿足擬人化交互、場(chǎng)景化價(jià)值、低成本運(yùn)維三重目標(biāo)時(shí),將會(huì)迎來(lái)市場(chǎng)規(guī)模的指數(shù)級(jí)增長(zhǎng)。
02
最“餓”的行業(yè),最先用
哪些行業(yè)率先形成數(shù)字人商業(yè)閉環(huán)?
來(lái)自艾媒咨詢2025年報(bào)告的數(shù)據(jù),電子商務(wù)、衛(wèi)生健康與社會(huì)保障、教育、金融是目前數(shù)字人企業(yè)最集中的領(lǐng)域。這一分布并不偶然,恰恰對(duì)應(yīng)的是幾個(gè)要素高度相似的行業(yè):對(duì)交互體驗(yàn)具有持續(xù)需求、場(chǎng)景結(jié)構(gòu)標(biāo)準(zhǔn)化且數(shù)字化基礎(chǔ)扎實(shí)。
簡(jiǎn)而言之,最“餓”的行業(yè)先用上技術(shù)。哪里有成本壓力和服務(wù)缺口,數(shù)字人就率先找到了切入點(diǎn)。

百度智能云人士告訴數(shù)智前線,基于服務(wù)和營(yíng)銷場(chǎng)景的數(shù)字員工,天然具有“價(jià)值可測(cè)量、閉環(huán)高效率”的優(yōu)勢(shì),數(shù)字人在電商直播、基礎(chǔ)客服等高容錯(cuò)場(chǎng)景規(guī);l(fā)。
硅基智能超過(guò)一半的業(yè)務(wù)來(lái)自泛政府市場(chǎng),尤其是政務(wù)大廳,各委辦廳局訴求高。而政府一般會(huì)采購(gòu)全套方案,需要開(kāi)箱即用的產(chǎn)品。
“這類數(shù)字人落地的核心,與項(xiàng)目亮點(diǎn)有很大關(guān)系。”一位政務(wù)項(xiàng)目供應(yīng)商分析,“數(shù)字人有明確的展示效果和示范效應(yīng),也能提升互動(dòng)感,公積金、社保等業(yè)務(wù)辦理中,市民的使用率也較高。”

國(guó)家藥監(jiān)局曾在福建“數(shù)字中國(guó)”上展示其“AI用藥顧問(wèn)”,這位與中國(guó)電信合力打造的數(shù)字人,可全天候提供基礎(chǔ)用藥答疑。相較傳統(tǒng)靜態(tài)問(wèn)答終端,數(shù)字人能處理多輪問(wèn)詢,面帶表情、聲調(diào)自然,降低了市民對(duì)技術(shù)系統(tǒng)的抗拒感。
中科深智宋健進(jìn)一步觀察,辦事大廳等公共場(chǎng)所的數(shù)字人也將迎來(lái)一輪升級(jí),它們可以通過(guò)對(duì)方的外貌、動(dòng)作、語(yǔ)氣變化來(lái)判斷情緒,從而做出有溫度的回應(yīng)。這背后是數(shù)字人與大模型、環(huán)境感知等系統(tǒng)的越來(lái)越緊密的結(jié)合,正獲得真人的“感受力”,從單人的“照本宣科”變成多人互動(dòng)。
“大模型也在與行業(yè)知識(shí)深度結(jié)合,向行業(yè)服務(wù)、行業(yè)營(yíng)銷等‘低容錯(cuò)、強(qiáng)專業(yè)化’場(chǎng)景延伸。”百度智能云相關(guān)人士強(qiáng)調(diào)今年市場(chǎng)的另一大趨勢(shì)。
如汽車電銷數(shù)字員工,在用戶咨詢時(shí),既要洞察客戶需求,給出靈活回復(fù),也要基于該車企實(shí)際參數(shù)給出精準(zhǔn)回復(fù),來(lái)支撐用戶決策。這需要深度提煉垂直決策鏈路,打造開(kāi)箱即用的解決方案,才能交付可量化的業(yè)務(wù)效果,形成漸進(jìn)滲透曲線。對(duì)垂直場(chǎng)景Know-how的沉淀和系統(tǒng)化封裝,是競(jìng)爭(zhēng)分水嶺。
硅基智能人士有類似觀察。數(shù)字人企業(yè)在走入垂類行業(yè)。今年,令她印象深刻的落地應(yīng)用,是一家大型醫(yī)院推出數(shù)字人醫(yī)生。此前,患者進(jìn)醫(yī)院,與醫(yī)生話還沒(méi)說(shuō)幾句人就要走了,F(xiàn)在,數(shù)字人醫(yī)生,基于報(bào)告、醫(yī)囑和大模型的分析,再把信息詳細(xì)說(shuō)一遍,并回復(fù)患者康復(fù)指導(dǎo)、健康問(wèn)題,患者的體驗(yàn)立刻就提升了。
“AI面試官”是另一個(gè)落地速度極快的應(yīng)用方向,尤其在公務(wù)員、校招、職業(yè)能力測(cè)試和培訓(xùn)等領(lǐng)域,數(shù)字人正成為訓(xùn)練中低成本、高強(qiáng)度的替代品。教育場(chǎng)景的另一類延伸,是“數(shù)字導(dǎo)師”或“數(shù)字助教”。百度在其戰(zhàn)略和動(dòng)作中,明確將高校招生顧問(wèn)、4S店銷售專員、銀行營(yíng)銷專員作為重點(diǎn)拓展方向,計(jì)劃打造專用模型、對(duì)接教育SaaS、汽車crm等系統(tǒng)的“行業(yè)智能Agent”。
類似的還有數(shù)字人律師,將門(mén)檻降低,硅基智能人士認(rèn)為,這是科技平權(quán)的好方式。
游戲是另一個(gè)被看好的方向。“過(guò)去游戲里的NPC(非玩家角色)是固定腳本驅(qū)動(dòng)的。”宋健分析,“現(xiàn)在,數(shù)字人可以成為一個(gè)有想法的角色。”未來(lái)游戲里,玩家和NPC之間的關(guān)系可以是“關(guān)系-發(fā)展”。這是沉浸式體驗(yàn)質(zhì)的飛躍,也為游戲設(shè)計(jì)打開(kāi)了新天地。
在這些場(chǎng)景中,數(shù)字人不再只是工具,而逐漸具有了“角色屬性”。
不過(guò),也有一些需求被業(yè)內(nèi)認(rèn)為是偽需求,如一些公司的展廳數(shù)字人。“除非是大公司,否則利用率很低。這些數(shù)字人很多是租賃形式,按月付費(fèi)。最終一些企業(yè)放棄了付費(fèi)。”一位業(yè)內(nèi)人士觀察。
03
數(shù)十萬(wàn)家數(shù)字人企業(yè)?背后技術(shù)與分野
數(shù)字人應(yīng)用爆發(fā)的背后,更深層的邏輯是大模型技術(shù)能力的突破。
“所謂的爆發(fā),并不是數(shù)字人自己的爆發(fā),其實(shí)是依托于整個(gè)大模型的爆發(fā)。”硅基智能人士說(shuō),2024年初,以DeepSeek為代表的大模型在成本與性能上的突破,提升了數(shù)字人的效果,并大幅壓縮了落地門(mén)檻。
其實(shí),數(shù)字人很早就存在了,并在2020年前后元宇宙概念興起時(shí),進(jìn)入大眾視野。但直到2022年后大模型技術(shù)快速成熟,才真正開(kāi)啟了從“看起來(lái)像人”到“互動(dòng)像人”的進(jìn)階。
這背后,大模型對(duì)數(shù)字人的提升非常巨大。此前,制作一個(gè)高質(zhì)量數(shù)字人,是“高端定制”的代名詞,F(xiàn)在,通過(guò)AI驅(qū)動(dòng)的圖像建模與語(yǔ)音合成等技術(shù),數(shù)字人的生成已進(jìn)入“普惠”階段。
中科深智 CTO宋健舉了一個(gè)例子,在今年“618”期間,數(shù)字人版的羅永浩與搭檔何蕭木,在百度平臺(tái)的一場(chǎng)直播中呈現(xiàn)了真實(shí)、自然、配合默契的“日常交互模式”。數(shù)字人還能實(shí)時(shí)捕捉彈幕并進(jìn)行語(yǔ)義分析,以 “羅氏幽默” 風(fēng)格回應(yīng)觀眾提問(wèn),互動(dòng)效果逼近真人直播。
“當(dāng)用戶的代入感接近現(xiàn)實(shí)后,那種對(duì)AI的心理防備,基本也就消失了。”宋健說(shuō)。
不過(guò),企業(yè)們普遍認(rèn)為,數(shù)字人接下來(lái)的大挑戰(zhàn),是讓它的大腦更聰明。
在技術(shù)商業(yè)市場(chǎng)呈現(xiàn)前景的情況之下,IT桔子數(shù)據(jù)顯示,截至7月7日,2025年數(shù)字人領(lǐng)域共發(fā)生投融資案件23起,接近2024年全年的24起,平均每起融資超1.5億元,“技術(shù)–市場(chǎng)–資本”驅(qū)動(dòng)加速。
市場(chǎng)的競(jìng)爭(zhēng)也更為激烈。“大家認(rèn)為數(shù)字人是一個(gè)利潤(rùn)高、有前景,門(mén)檻也不是特別高的行業(yè),大量企業(yè)涌入。”硅基智能人士說(shuō)。
在《中國(guó)虛擬數(shù)字人影響力指數(shù)報(bào)告》第三期顯示,2023年“數(shù)字人、虛擬人”相關(guān)企業(yè)已達(dá)99.3萬(wàn)余家,其中超過(guò)40萬(wàn)家是2023年新增,同比漲幅達(dá)到42.3%。不過(guò),根據(jù)企查查的數(shù)據(jù),截至7月7日,國(guó)內(nèi)數(shù)字人、虛擬人相關(guān)企業(yè)現(xiàn)存量達(dá)2492家。2023年至今共注冊(cè)228家相關(guān)企業(yè),其中2023年注冊(cè)量達(dá)139家,占比達(dá)61%。
盡管不同的說(shuō)法從數(shù)十萬(wàn)家到數(shù)千家,但真正擁有“從建模到交互再到?jīng)Q策”技術(shù)能力的公司并不多,企業(yè)也正在迅速分化出技術(shù)壁壘。
小冰科技CEO徐元春坦言:“未來(lái)很難靠單一維度構(gòu)筑護(hù)城河。”真正具備競(jìng)爭(zhēng)力的,是那些同時(shí)擁有2D/3D數(shù)字人建模及驅(qū)動(dòng)渲染、語(yǔ)音識(shí)別及合成、對(duì)話能力、大模型和AIGC能力,并能夠?qū)⒓夹g(shù)深度嵌入垂直場(chǎng)景的全棧式公司。
除了小冰科技強(qiáng)調(diào)的全棧式,目前市場(chǎng)上的供應(yīng)商格局則呈現(xiàn)為:一邊是以百度、字節(jié)、阿里、華為云、京東科技等“大廠”提供數(shù)字人底層能力、平臺(tái)和解決方案;一邊是中科深智、硅基智能等獨(dú)立公司,扎根垂直行業(yè),提供定制化交付和運(yùn)營(yíng)支持。
不過(guò),與國(guó)內(nèi)企業(yè)需要多個(gè)“技藝”甚至全棧不同,在海外,目前數(shù)字人企業(yè)傾向于分工合作。

如宋健所說(shuō):“大廠在軟件工具、平臺(tái)支撐、標(biāo)準(zhǔn)解決方案方面有優(yōu)勢(shì),但我們這類獨(dú)立公司會(huì)深入到行業(yè)客戶的真實(shí)場(chǎng)景,做定制、做優(yōu)化,以及細(xì)致的運(yùn)營(yíng)服務(wù)。”比如在直播電商市場(chǎng),按效果付費(fèi),需要根據(jù)市場(chǎng)和直播間復(fù)盤(pán),調(diào)整某一頁(yè)視頻或產(chǎn)品拍攝角度,這些要靠人去做的細(xì)致的運(yùn)營(yíng)服務(wù)。
而正在發(fā)生的一大趨勢(shì)是,數(shù)字人從“虛擬形象”向“業(yè)務(wù)智能體”演進(jìn)。百度智能云人士提出,未來(lái)數(shù)字人向低成本個(gè)性化普及,是“表達(dá)者”,數(shù)字員工則是“決策者和執(zhí)行者”。前者解決“怎么表現(xiàn)”,后者負(fù)責(zé)“怎么做事”。數(shù)字員工融合了擬人化形象與業(yè)務(wù)決策能力,是數(shù)字人的邏輯延續(xù),也是其商業(yè)化的下一階段。