作為大模型落地的重要場景之一,數(shù)字人賽道在過去一年多歷經(jīng)了快速發(fā)展。技術(shù)的升階,讓數(shù)字人在與人類交互上有了更好的體驗。
談及數(shù)字人的具體應(yīng)用,不少人已在數(shù)字人直播、數(shù)字人客服以及數(shù)字代言人上見識過數(shù)字人的多種形象。
這是否意味著數(shù)字人已到全面開花的時代?為此,鳳凰網(wǎng)科技在近期專訪了世優(yōu)科技CEO紀(jì)智輝,世優(yōu)科技是一家專注于虛擬人技術(shù)的創(chuàng)業(yè)公司,截至目前已打造超1200個虛擬數(shù)字人形象,如腦白金代言人“白老頭&金老太”、海爾兄弟等。盡管已在數(shù)字人全流程打造與元宇宙全場景服務(wù)方面有諸多經(jīng)驗,紀(jì)智輝認為,數(shù)字人遠沒到真正爆發(fā)的時刻。
在其看來,數(shù)字人想要真正走進家庭場景,必須歷經(jīng)更多硬件基礎(chǔ)設(shè)施的迭代!皵(shù)字人受限于現(xiàn)在的視覺表現(xiàn),可能都是一些大屏幕、小屏幕,交互體驗是不夠沉浸的。未來真正的爆發(fā)可能是在線下,隨著全息投影價格成本降低,把現(xiàn)在的LED屏或者電視換掉,就可以在很多地方都呈現(xiàn),或者是VR眼鏡的進步!
數(shù)字人代表了一種面向未來世界的經(jīng)濟趨勢,但擺在眼前的規(guī);y題仍舊待解。
以下是鳳凰網(wǎng)科技和紀(jì)智輝的對話,經(jīng)編輯發(fā)布:
“大模型給數(shù)字人帶來了機會,但爆發(fā)遠遠未到”
鳳凰網(wǎng)科技:
現(xiàn)在數(shù)字人是否發(fā)展到了一個比較成熟的階段?
紀(jì)智輝:
數(shù)字人更多側(cè)重于技術(shù)和算法,內(nèi)容是通過這些技術(shù)生成的。要生成這些內(nèi)容,進行互動或提供體驗,需要大量的技術(shù)積累和應(yīng)用場景來支撐。畢竟,這屬于一個新技術(shù)的早期,目前還無法在單一領(lǐng)域?qū)崿F(xiàn)規(guī)模化、突破或爆發(fā),還處于面向行業(yè)、特定應(yīng)用場景的ToB階段,我不認為現(xiàn)在是我們的爆發(fā)期。
鳳凰網(wǎng)科技:
大模型技術(shù)的發(fā)展也沒有讓這個行業(yè)發(fā)生改變嗎?
紀(jì)智輝:
有很大的變化,但并沒有真正意義上的爆發(fā)。怎樣才算爆發(fā)?我們應(yīng)該分線上和線下兩個場景來看,線上可能很多場景都是數(shù)字人在提供服務(wù),但今天我們并沒有看到這種情況。線下的場景我們依然沒有看到,比如說走進一個茶室,玻璃上貼了一個透明屏,里面就有一個數(shù)字人,我可以跟他說幫我叫一下某人,或者給我送咖啡,機器人把咖啡送過來,這就是商業(yè)場景里面的一部分。如果說AI哪天無處不在的時候,數(shù)字人也是無處不在的,在家庭場景里面,我們把遙控器換成數(shù)字人來開機,問數(shù)字人要看什么,數(shù)字人就給你找想看的內(nèi)容。在健身行業(yè),數(shù)字人相當(dāng)于是一個家庭助理,可以解決很多問題。
汽車?yán)锩娴能嚈C對話也是一樣的,不能只是聽到聲音,還要見到人。我們溝通的人機交互界面最好是人跟數(shù)字人。
鳳凰網(wǎng)科技:
你覺得是哪些因素限制了數(shù)字人的發(fā)展?
紀(jì)智輝:
整個數(shù)字人受限于我們現(xiàn)在的視覺表現(xiàn),目前都是一些大屏幕、小屏幕, 比如說手機屏,那在這些屏幕上其實我們跟數(shù)字人的交互體驗是不夠沉浸的。所以說真正的爆發(fā)可能會是在線下,隨著全息投影價格成本降低,把現(xiàn)在的LED屏或者電視換掉,那就可以在很多地方都呈現(xiàn),這是一種。第二種是MR或者AR眼鏡,只需要戴著眼鏡,就能看到很多的數(shù)字人。硬件基礎(chǔ)設(shè)施完備才是數(shù)字人真正要爆發(fā)的時候,那時候數(shù)字人是無處不在的。
鳳凰網(wǎng)科技:
大模型其實也有這個痛苦,找不到更多的應(yīng)用場景。
紀(jì)智輝:
數(shù)字人技術(shù)本身就是大模型技術(shù)發(fā)展下的一個重要應(yīng)用場景。在這個時代中,數(shù)字人的作用不可或缺。AI作為整個時代的底層支持,提供了必要的算力和能力。這種能力需要在具體的應(yīng)用場景中體現(xiàn)其價值,并通過交互界面與用戶建立聯(lián)系。我們一直在探索和尋找合適的應(yīng)用場景,但許多人希望跳過發(fā)展過程,直接面向消費者市場。
鳳凰網(wǎng)科技:
你之前提到過世優(yōu)會和一些大模型企業(yè)合作,目前哪幾家合作多一些?
紀(jì)智輝:
其實我們對大模型的依賴度很低,不會捆綁其中的某一家,因為基本上都是開放模型,對我們來講好像都差不多,除非說有的客戶有具體需求,我們才會選擇特定的大模型服務(wù)。我們也會評估在不同行業(yè)、不同應(yīng)用場景,這些模型訓(xùn)練得怎么樣,會優(yōu)先去做選擇,但是基本上不太依賴。
還有些客戶已經(jīng)購買了大模型服務(wù),但他們發(fā)現(xiàn)大模型的應(yīng)用場景有限,所以希望在展廳中加入數(shù)字人元素。我們會根據(jù)客戶使用的大模型來選擇合適的服務(wù),所以我們對大模型的選擇并不挑。
“數(shù)字人的大規(guī)模應(yīng)用必然是先商業(yè)后家庭”
鳳凰網(wǎng)科技:
世優(yōu)在推進數(shù)字人的商業(yè)化落地上有哪些規(guī)劃?
紀(jì)智輝:
目前我們在ToB和ToC市場已經(jīng)進行了布局,可能一年左右,許多人都能體驗到元宇宙場景,可能不是面向家庭用戶,而是在商業(yè)體內(nèi),如《消失的法老》那個實景娛樂項目,這種體驗是大家愿意消費的。隨著業(yè)態(tài)的發(fā)展,未來的電影院、網(wǎng)吧、社交劇本殺等密室可能會在元宇宙中出現(xiàn)。
鳳凰網(wǎng)科技:
所以偏實景娛樂類的應(yīng)用會先出現(xiàn),然后才會反哺到家庭。
紀(jì)智輝:
對,因為所有的新技術(shù),成熟的曲線跟它的生產(chǎn)過程都是一樣的,蒸汽機最先只能在火車、輪船上應(yīng)用,后面才有電氣,然后再到家庭里。一定是行業(yè) b端企業(yè)大品牌開始用,然后再慢慢下沉,因為技術(shù)的成本下降需要一個過程,需要在一些場景里面不斷地打磨成熟。
鳳凰網(wǎng)科技:
目前數(shù)字員工的行業(yè)應(yīng)用率如何?
紀(jì)智輝:
數(shù)字員工目前是數(shù)字人重要應(yīng)用場景之一,數(shù)字員工的應(yīng)用效率隨著技術(shù)的發(fā)展也在持續(xù)增長。但需要注意的是,應(yīng)用率也會受到技術(shù)接受度、投資預(yù)算、數(shù)據(jù)安全和隱私保護等因素的影響。不同行業(yè)和地區(qū)的應(yīng)用率可能會有差異。此外,隨著技術(shù)的不斷進步和成本的降低,預(yù)計數(shù)字員工的應(yīng)用率將繼續(xù)增長。
鳳凰網(wǎng)科技:
你提到了宣傳作用,為什么現(xiàn)在絕大多數(shù)數(shù)字人都是女性形象?
紀(jì)智輝:
確實很多數(shù)字人都是女性,特別是在品牌推廣方面,她們的親和力會更好一點。在消費品領(lǐng)域,卡通形象如海爾兄弟、腦白金,這些都是我們做的。還有許多企業(yè)都有自己的品牌吉祥物,如京東的金屬狗、天貓的貓形公仔、蘇寧的小獅子等。
鳳凰網(wǎng)科技:
你怎么看待數(shù)字人賽道未來的長遠發(fā)展。
紀(jì)智輝:
未來肯定是數(shù)字化的時代,數(shù)據(jù)可視化是未來發(fā)展的必然趨勢,也是國家提倡的數(shù)字經(jīng)濟的一部分。隨著技術(shù)的不斷進步和應(yīng)用場景的不斷拓展,數(shù)字人的功能指向?qū)⒅饾u擴展,從普適化向個性化滲透,數(shù)字人的規(guī);涞睾彤a(chǎn)業(yè)化應(yīng)用已經(jīng)初具雛形,有望在未來幾年內(nèi)取得更大進展,最終成為數(shù)字時代用戶的交互方式。
【免責(zé)聲明】本文僅代表作者本人觀點,與和訊網(wǎng)無關(guān)。和訊網(wǎng)站對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。郵箱:news_center@staff.hexun.com
最新評論