展會信息港展會大全

數(shù)字人戰(zhàn)場,百度智能云投下一枚重磅炸彈
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-09-26 20:22:28   瀏覽:3594次  

導讀:劃重點 01百度智能云的曦靈數(shù)字人產(chǎn)品迎來4.0升級,降低制作成本和門檻,使更多企業(yè)能夠利用數(shù)字人實現(xiàn)提效增收。 02曦靈數(shù)字人4.0解決了傳統(tǒng)2D數(shù)字人動作僵硬的問題,提升對話互動自然程度,支持多種語言切換。 03除此之外,數(shù)字人正化身千行百業(yè)數(shù)字員工,...

劃重點

01百度智能云的曦靈數(shù)字人產(chǎn)品迎來4.0升級,降低制作成本和門檻,使更多企業(yè)能夠利用數(shù)字人實現(xiàn)提效增收。

02曦靈數(shù)字人4.0解決了傳統(tǒng)2D數(shù)字人動作僵硬的問題,提升對話互動自然程度,支持多種語言切換。

03除此之外,數(shù)字人正化身千行百業(yè)數(shù)字員工,在金融、文旅等領域得到廣泛應用,提升業(yè)務處理效率與客戶體驗。

04隨著數(shù)字人技術的持續(xù)演進,百度智能云曦靈數(shù)字人在更多場景落地應用,推動產(chǎn)業(yè)落地先鋒的發(fā)展。

05IDC預計到2026年中國AI數(shù)字人市場規(guī)模將達到102.4億元人民幣,百度智能云曦靈等產(chǎn)品團隊正努力推進標準化SaaS產(chǎn)品和行業(yè)客戶的項目簽約。

以上內容由騰訊混元大模型生成,僅供參考

3D數(shù)字人的價格已經(jīng)從過去的幾萬元,降到現(xiàn)在的199元。

文|徐鑫

編|任曉漁

你可能不知道,自己正在接觸的是數(shù)字人。

許多人對數(shù)字人的印象還停留在形象展示階段。線下大屏上,一個真人形象向大眾介紹產(chǎn)品或者互動,體驗不佳,表現(xiàn)也略顯僵硬,且制作成本高昂。

但過去一年多的時間里,大模型的出現(xiàn),為數(shù)字人產(chǎn)業(yè)帶去了更多可能性。一些廠商把數(shù)字人列為大模型應用落地的前沿陣地,國內的數(shù)字人賽道先鋒企業(yè)產(chǎn)品也在以季為單位加速迭代。

數(shù)字人的技術不斷升級。一方面,數(shù)字人在人像、聲音和語言上的表現(xiàn)力一步步在提升。另一方面,數(shù)字人的制作成本和門檻在大幅降低,效率快速提高。

以百度智能云的曦靈數(shù)字人為例,百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖介紹,基于百舸和千帆兩大業(yè)界領先技術的支撐,“客戶只需用過去百分之一的成本,分鐘級就能輕松創(chuàng)作出屬于自己的數(shù)字人作品。”

技術進步帶來普惠紅利,更多企業(yè)級場景正解鎖數(shù)字人。沈抖介紹,目前,曦靈數(shù)字人平臺已經(jīng)有形象成熟、種類豐富的各類數(shù)字人,覆蓋文旅、電商、金融等各大行業(yè)場景。越來越多企業(yè)利用數(shù)字人實現(xiàn)提效增收,收獲業(yè)務價值。

而隨著企業(yè)應用數(shù)字人的深入,不同企業(yè)對數(shù)字人的需求模式也在分層,廠商們圍繞著數(shù)字人產(chǎn)品的商業(yè)模式和打法策略也在更新。百度智能云的曦靈數(shù)字人團隊介紹,今年他們將重點推進公有云平臺的數(shù)字人調用,而標準化SaaS產(chǎn)品和行業(yè)客戶的項目簽約有望形成良性循環(huán)。

01

以季為單位上新,持續(xù)降低數(shù)字人落地門檻

數(shù)字人正在成為大模型落地的最熱門場景之一。

去年下半年以來廠商們在加速探索大模型落地行業(yè)的路徑,數(shù)字人被不少廠商視作了先鋒場景。進入今年,多家平臺廠商展示大模型與垂直行業(yè)結合案例時數(shù)字人都被列為了重點應用。

國內最早發(fā)布大模型并開啟行業(yè)應用探索的百度,也在這一領域傾注了大量資源。今天舉辦的百度云智大會上,曦靈數(shù)字人迎來4.0升級,這也是這款產(chǎn)品今年以來的第三次發(fā)布更新。

這次更新主要圍繞著能力提升、制作門檻下降、效率和成本優(yōu)化三大維度進行。

在能力升級上,沈抖介紹,曦靈4.0解決了傳統(tǒng)2D數(shù)字人動作僵硬的問題,可以實現(xiàn)人物在不同角度、形體、表情的高度一致,即使是面部微表情也非常逼真、自然。

為此,曦靈團隊進行了專項開發(fā),百度智能云數(shù)字人產(chǎn)品部總經(jīng)理張裕翔介紹,他們獨創(chuàng)口型匹配算法,使得數(shù)字人講話時口型更契合表達內容。為提升對話互動自然程度,它們引入了聆聽態(tài)設計,并通過前置小模型在對話間隙智能插入引導詞,顯著提升了回復的即時性與互動性。

在制作門檻上,曦靈數(shù)字人4.0也進一步簡化對用戶輸入素材的要求。以3D數(shù)字人為例,現(xiàn)在用戶只需輸入一段簡單的文字描述,就可以快速生成不同妝造、不同行業(yè)特色的3D數(shù)字人形象和視頻。

在制作效率與成本優(yōu)化層面,數(shù)字人的生成時長現(xiàn)在降低到了分鐘級水平。行業(yè)觀察到,6月的那次更新升級,曦靈2D數(shù)字人的生成時長就已經(jīng)從3~7天降到小時級。

而成本層面,企業(yè)獲得數(shù)字人的價格也在下降。6月曦靈數(shù)字人更新發(fā)布時,將3D超寫實數(shù)字人的價格門檻從十萬級別降到萬元水平。今天升級后,3D超寫實數(shù)字人的價格從萬元繼續(xù)下探,大幅降價至199元,達到業(yè)內最低價。這對數(shù)字人行業(yè)無疑又是一顆重磅炸彈。

業(yè)界觀察到,今年以來,曦靈數(shù)字人以季為單位快速迭代更新,重點圍繞著長期困擾數(shù)字人行業(yè)落地的幾大難題展開。本次4.0版本更新也延續(xù)了百度曦靈數(shù)字人“高可用,高性價比”的核心理念,意在進一步降低數(shù)字人的使用門檻與成本。

實際上這也是此前行業(yè)的共同發(fā)力方向。IDC告訴數(shù)智前線,AI數(shù)字人技術使用的平民化正成為市場關注的重點,如何通過相關技術降低產(chǎn)品的使用和成本門檻將成為未來競爭的關鍵因素之一

作為國內數(shù)字人賽道里的老玩家,百度智能云的曦靈團隊對數(shù)字人的理解是要能夠替代真人,并在一些領域超過真人。百度智能云數(shù)字人產(chǎn)品部總經(jīng)理張裕翔解釋稱,只有性能表現(xiàn)上超過真人,數(shù)字人才能解鎖更多的行業(yè)場景,被更廣泛地用起來。

他介紹,得益于過去6年,百度在數(shù)字人領域持續(xù)深耕,積累了海量、高質量數(shù)據(jù),目前曦靈數(shù)字人在人像、聲音和語言能力多個維度,已經(jīng)能做到真人無法做到的事。

比如,以人像為例,真人依賴當前環(huán)境里的燈光、妝造,而基于曦靈數(shù)字人平臺,在去還原真人時,可以在視頻里給形象做一些提升,類似直播的修圖瘦臉功能

在聲音方面,普通人日?谡Z表達中有非常多的頓挫和卡頓,但數(shù)字人卻可以做到流暢自然、語調平穩(wěn)且有抑揚頓挫感。而在語言表達能力上,數(shù)字人的多語言切換能力也突破了真人的能力限制,能輕松解鎖多國語言。

“2D數(shù)字人能打破真人的時間、空間和能力局限性,替代真人出鏡,效果表現(xiàn)全面超越真人,這是接下來在2D數(shù)字人領域,大家共同努力的方向。”張裕翔說。

02

企業(yè)應用數(shù)字人的方式,正在發(fā)生變化

經(jīng)過一年多的發(fā)展,大模型技術賦能數(shù)字人,也給數(shù)字人市場帶來了新的可能性。

首先是,隨著數(shù)字人能力升級,數(shù)字人正在解鎖更多的應用場景。

“在人像和聲音之外,大模型給數(shù)字人帶來的語言能力,幫我們帶來了更多可能。”張裕翔所帶領的曦靈團隊在數(shù)字人賽道的落地經(jīng)驗超過五年,觀察了上千家企業(yè)客戶的應用情況。他看到,大模型賦能下,許多原來不可想象的場景里,數(shù)字人有了很廣泛應用。

典型的是直播場景,大模型能力加持,可以生成數(shù)字人的直播腳本,數(shù)字人能夠基于商品的內容信息實時講解,也能完成對商品信息的實時問答,同時7x24小時,穩(wěn)定且高效。又比如多語言能力的加持,數(shù)字人可以靈活切換語種,可以一套內容面向全球的媒體和客戶發(fā)布,給跨境電商、外貿業(yè)務增添便利。“一個能力點的突破之后它就能開啟更多可能”,張裕翔說。

其次,隨著技術進步、可獲得門檻的降低,數(shù)字人進入到更多行業(yè),不同的企業(yè)對數(shù)字人能力的需求點出現(xiàn)了分化。

“千行百業(yè)對數(shù)字人技術的應用要求各有不同”,張裕翔他們收到了非常多樣化的客戶反潰比如,一位傳媒行業(yè)人士感興趣的是,數(shù)字人平臺能不能高清晰的克隆本人聲音,可以輸出高清晰的視頻;而在教育場景,數(shù)字人老師是否能基于學生的學習能力和此前的知識點掌握程度,給出不一樣的答案和講解。

這也是在呼喚數(shù)字人技術服務商能夠系統(tǒng)梳理各項能力,將不同的能力板塊解耦,從而適應和滿足市場的多樣化需求。一些先鋒企業(yè)也順應市場,將數(shù)字人能力沉淀到開放平臺,實現(xiàn)靈活的組件式調用。

以百度智能云的曦靈數(shù)字人為例,今年7月,曦靈數(shù)字人開放平臺上架,將標準化的能力分拆為靈活的組件,供行業(yè)用戶調用。比如人像的定制克壟聲音定制克壟對話交互場景、在各個端的渲染能力、數(shù)字人視頻的制作和直播等能力都能方便被調用。

這一開放平臺的能力也受到了市場的熱烈歡迎。“上線后,每周都有上百家客戶的試用,對于數(shù)字人的應用場景也遠超預期”,張裕翔認為,這反映出數(shù)字人企業(yè)級應用市場的多樣化蓬勃需求,也意味著企業(yè)應用數(shù)字人正在逐步深入。

由此,數(shù)字人市場的服務模式也隨之演進更新。幾年前行業(yè)里數(shù)字人服務以大型定制項目為主,隨著數(shù)字人技術的規(guī)模化復制能力提升,平臺們開始將數(shù)字人能力沉淀為標準化的SaaS產(chǎn)品。而隨著越來越多行業(yè)用起來,企業(yè)的需求分化,又多了靈活的組件式調用方式。

開箱即用的SaaS平臺、高效易集成的組件平臺,以及為頭部客戶量身定制的行業(yè)級解決方案,也是目前百度曦靈數(shù)字人服務行業(yè)客戶的三種形態(tài)。

“組件式合作更適合行業(yè)用戶,它們能通過這些易集成的組件,把數(shù)字人能力接入到自己的系統(tǒng)和應用里。目前行業(yè)主流調用模式以組件式為主,SaaS能夠覆蓋的場景更偏于通用場景。"張裕翔介紹其中的差別。

他認為,數(shù)字人是表現(xiàn)層,進入行業(yè)能用好還需要與行業(yè)的垂直領域去結合,涉及到行業(yè)know-how和深度的場景知識。

比如,在教育場景里,老師在線上課的時候,可能有個數(shù)字人入口,哪里不明白了,戳一下,數(shù)字人老師能基于知識點和學生的情況,一對一溝通和互動。

要實現(xiàn)這一點,就需要調用數(shù)字人開放平臺能力,與教育行業(yè)的伙伴共建,把數(shù)字人能力與企業(yè)現(xiàn)有的課程系統(tǒng)和學生管理系統(tǒng)聯(lián)通起來。這又涉及到產(chǎn)業(yè)分工,需要與教育行業(yè)的伙伴共建,才能把數(shù)字人能力真正在場景里用好。

03

數(shù)字人正化身千行百業(yè)數(shù)字員工

隨著數(shù)字人能力持續(xù)升級,應用門檻持續(xù)降低,企業(yè)獲得數(shù)字人服務的方式變得更加靈活,百度智能云的曦靈數(shù)字人也加速在更多場景里落地應用。

“原來的數(shù)字人項目周期特別長,現(xiàn)在從試用到真正運轉起來,一兩天就搞定了。企業(yè)編程力強一點的話,半天就上手看到效果。”張裕翔觀察,許多企業(yè)能利用曦靈更方便看清數(shù)字人的效果和業(yè)務價值

IDC中國研究經(jīng)理程蔭也告訴數(shù)智前線,當下,企業(yè)對于AI數(shù)字人的應用主要出于創(chuàng)新業(yè)務和幫助企業(yè)提效增收考量。數(shù)字人價值最明顯的領域在直播帶貨、數(shù)字人客服、虛擬主播等場景,ROI較好測算,其他場景下帶來的價值不好測算是技術落地面臨的挑戰(zhàn)之一。

張裕翔則認為,要更全面看待數(shù)字人的價值,ROI指標更偏向用于一些投放和廣告營銷場景里的數(shù)字人效果指標測算,關鍵要看這項技術在企業(yè)里有沒有真正被用起來。

目前,在投放和廣告營銷場景等場景里,百度智能云的曦靈數(shù)字人正在扮演導購角色,增強內容的吸引力與互動性,顯著加速了營銷視頻的創(chuàng)作流程和降低成本。生成效率層面,曦靈數(shù)字人將傳統(tǒng)2.5天的制作周期銳減至0.5天,這為商家贏得了寶貴的市場先機。同時數(shù)字人還能大大降低了拍攝成本,在一線城市里,真人演員的單日花費最低也要1500~2000元。

用戶上傳的素材還能用于批量生成多條視頻,平攤到每一條成本變得更低。“一些銷售場景,廣告素材的生產(chǎn)成本大概降低到了1/3水平。

除了廣告營銷場景,數(shù)字人扮演的數(shù)字員工,也在金融行業(yè)里有大量落地。數(shù)智前線獲悉,不少頭部銀行正在利用百度曦靈數(shù)字人入駐營業(yè)廳,高效接管許多傳統(tǒng)依賴于線下網(wǎng)點營業(yè)員的工作任務,極大地提升了業(yè)務處理效率與客戶體驗。線下網(wǎng)點就不用配備更多的網(wǎng)點營業(yè)員,算上全國的網(wǎng)點數(shù)量,節(jié)省的成本數(shù)額非?捎^。

“銀行場景下數(shù)字人技術驅動的數(shù)字員工運營平臺,能真正提供數(shù)字員工運營能力,大幅解放員工的精力。”張裕翔說,在這個場景里數(shù)字人已經(jīng)真正被深入用起來了。目前,曦靈數(shù)字人在18家頭部銀行覆蓋率達50%,“產(chǎn)品復購率高,很多客戶都已經(jīng)做到三四期甚至五期階段,每年都在迭代產(chǎn)品”。

也有些場景不適合用ROI測算,典型的有文旅領域。一些地區(qū)在利用百度數(shù)字人打造的地方歷史名人,以生成的IP形式再現(xiàn),在文旅景點與游客互動,扮演電子導覽的角色。但業(yè)界認為,不應單純從數(shù)字上來衡量其產(chǎn)生的價值。它能帶來更豐富的旅游體驗,讓歷史文化以更加親近大眾、互動性更好的方式得到傳承。未來隨著數(shù)字人能力持續(xù)演進,它發(fā)揮的作用將進一步呈現(xiàn)和釋放。

可以說,隨著數(shù)字人在越來越多企業(yè)級場景里扮演數(shù)字員工,算得清ROI和業(yè)務價值賬的場景越來越多,數(shù)字人應用市場也在逐步打開。IDC預計,到2026年中國AI數(shù)字人市場規(guī)模將達到102.4億元人民幣。

市場從起步走向成熟,百度智能云曦靈這樣的產(chǎn)品團隊已經(jīng)開始沉淀體系化的打法。

張裕翔介紹,此前公有云產(chǎn)品收入在曦靈數(shù)字人的整體營收里比重不高,占大頭的是政企頭部企業(yè)的合作項目,現(xiàn)在,他們開始更加重視公有云上的營收增長。

“以前能力都沉淀在項目里的,今年我們要把它全面產(chǎn)品化。能力和技術水平做到領先的,再跟進應用產(chǎn)品的功能場景覆蓋。”張裕翔說。

這里面,不同的產(chǎn)品模式,正有望形成良性的聯(lián)動過去的項目沉淀積累的收入,正支撐公有云標準化產(chǎn)品的發(fā)展,而從公有云發(fā)展帶來的能力,又能更好推進項目的簽約。

04

產(chǎn)業(yè)落地先鋒如何煉成

目前,百度智能的云曦靈數(shù)字人作為大模型落地產(chǎn)業(yè)的典型應用場景,已經(jīng)在文旅、電商、金融等各大行業(yè)場景里得到了落地應用,并且應用廣度和深度都在往前邁進。這也是百度的大模型技術進入產(chǎn)業(yè)現(xiàn)場的縮影。

過去一年,大模型正加速從技術變革推進產(chǎn)業(yè)變革。數(shù)據(jù)顯示,今年1~8月,國內大模型中標項目數(shù)量已經(jīng)達到2023年全年數(shù)量的5倍,中標金額達到去年全年的2倍。這里面頭部大模型廠商的角色依然很突出,百度在大模型中標項目數(shù)量、中標金額、覆蓋行業(yè)以及覆蓋央國企數(shù)量,四個關鍵指標上排名第一

產(chǎn)業(yè)落地的快速推進離不開新一代基礎設施的支撐。圍繞著大模型的產(chǎn)業(yè)落地,百度智能云正在形成全棧的基礎設施底座。

算力層面,大模型龐大的訓練需求下,需要的集群規(guī)模越來越大,如何實現(xiàn)對GPU高效穩(wěn)定的管理,從而降低大模型的訓練和推理成本,備受行業(yè)關注。今天的云智大會上,百度智能云推出了百舸4.0版本升級。升級后的百舸,圍繞落地大模型全旅程的算力需求,在集群創(chuàng)建、開發(fā)實驗、模型訓練、模型推理四大方面,為企業(yè)提供“多、快、穩(wěn)、省”的AI基礎設施。

大模型應用的爆發(fā),離不開便捷、高效的大模型工具鏈和應用開發(fā)平臺。為滿足企業(yè)在大模型產(chǎn)業(yè)落地的需求,今天,千帆大模型平臺也在模型開發(fā)層、模型服務層、應用開發(fā)層上全面升級。

升級后的千帆3.0,正進一步降低企業(yè)級應用開發(fā)門檻,同時提供更豐富的大小模型覆蓋更多行業(yè)場景,同時提供更完善的大模型工具鏈,幫助企業(yè)實現(xiàn)一站式的大、小模型開發(fā)服務。

在今天召開的百度云智大會上,百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖對曦靈數(shù)字人、智能客服“客悅”和文心快碼三款產(chǎn)品進行重磅升級,面向企業(yè),這也是百度基于基礎設施上搭建的AI產(chǎn)品樣板間,他認為,只有親自走過用戶要走的路,才能設計出更懂用戶的產(chǎn)品。

大模型進入千行百業(yè)是一個龐大系統(tǒng)工程,圍繞著算力基礎設施、算法訓練和優(yōu)化、行業(yè)場景、數(shù)據(jù)準備和治理以及落地部署等方方面面的工作,模型廠商和應用企業(yè)及模型生態(tài)服務企業(yè)在持續(xù)發(fā)力,為產(chǎn)業(yè)應用加速。

而本次云智大會的一系列重磅產(chǎn)品升級更新,無疑也是這股浪潮里的一個重要注腳。

贊助本站

相關內容
AiLab云推薦
推薦內容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港