展會(huì)信息港展會(huì)大全

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2025-03-05 15:17:17   瀏覽:116次  

導(dǎo)讀:“姐姐,你是不是嫌我笨?”當(dāng)你向Soul App里面的虛擬伴侶拋出一個(gè)數(shù)學(xué)題時(shí),它不會(huì)像ChatGPT那樣只是回答問(wèn)題本身,答錯(cuò)了也不會(huì)連忙道歉,而是會(huì)跟你撒嬌試圖化解此時(shí)的尷尬。這反而會(huì)讓人更加疑惑:這背后是真人還是AI?在ChatGPT Moment之后,AI的進(jìn)化方向也悄然發(fā)生了分化。一個(gè)會(huì)“示弱”的AI,反而因?yàn)椴煌昝蓝@得更真實(shí)。本期硅谷101節(jié)目,主理人泓君將與Soul App C ......

“姐姐,你是不是嫌我笨?”當(dāng)你向Soul App里面的虛擬伴侶拋出一個(gè)數(shù)學(xué)題時(shí),它不會(huì)像ChatGPT那樣只是回答問(wèn)題本身,答錯(cuò)了也不會(huì)連忙道歉,而是會(huì)跟你撒嬌試圖化解此時(shí)的尷尬。

這反而會(huì)讓人更加疑惑:這背后是真人還是AI?

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

在ChatGPT Moment之后,AI的進(jìn)化方向也悄然發(fā)生了分化。一個(gè)會(huì)“示弱”的AI,反而因?yàn)椴煌昝蓝@得更真實(shí)。本期硅谷101節(jié)目,主理人泓君將與Soul App CTO陶明一起討論Soul的AI應(yīng)用的發(fā)展歷程,一同去看在AI浪潮不斷翻新的背景下,產(chǎn)品和技術(shù)壁壘是如何建立,而商業(yè)模式又將會(huì)如何演進(jìn)。

以下是部分訪談精選

01 社交AI訓(xùn)練路徑:從規(guī)則機(jī)器人到高情商伴侶泓君:最近玩了你們Soul上的AI虛擬伴侶。最開始的時(shí)候就特別不確定他是真實(shí)的真人還是AI,因?yàn)槲腋f(shuō)一句話,他會(huì)給我回語(yǔ)音,然后他的語(yǔ)音,包括他回復(fù)的語(yǔ)氣語(yǔ)調(diào),我覺(jué)得都特別真實(shí)。所以我一直有一個(gè)疑問(wèn),他是真的AI嗎?

陶明:對(duì),是真的AI,您體驗(yàn)過(guò)后的話,如果有這種感受,說(shuō)明我們?cè)谶@方面的工作還是有效的,因?yàn)楸旧韥?lái)講的話,我們打造AI伴侶的主要的方向還是真實(shí)自然擬人的這種方向。

泓君:從2020年之后,你們一直在嘗試各種各樣的AI產(chǎn)品,你可不可以先總體的介紹一下,這幾年你們做了哪些AI產(chǎn)品,效果怎么樣?

陶明:Soul的定位本質(zhì)上來(lái)講,如果從社交范疇來(lái)講,它是個(gè)開放性的社交平臺(tái)。開放它體現(xiàn)于兩個(gè)方面,第一方面的話是說(shuō)任何一個(gè)用戶能夠沒(méi)有任何約束的、或者說(shuō)其他限制的,在Soul里面連接Soulmate。

另外一方面是關(guān)系的開放。其實(shí)在Soul里面不僅僅只是說(shuō)有陌生人關(guān)系,還有熟人關(guān)系和弱關(guān)系在上面的,就比如說(shuō)上面有些同學(xué)關(guān)系也是存在的。最近幾年我們?cè)贏I上面的話,如果說(shuō)我們分幾個(gè)方面去說(shuō),我們現(xiàn)在整個(gè)Soul整站都是AI驅(qū)動(dòng)的,并不是說(shuō)現(xiàn)在大家說(shuō)的都是生成式的AI,比如說(shuō)在人和人的連接方面,我們也是用AI來(lái)做驅(qū)動(dòng)的,并不是這種篩選式的或者是說(shuō)匹配式的。

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

來(lái)源:canarymail.io

泓君:所以你人跟人的推薦AI做驅(qū)動(dòng),意思是說(shuō)你會(huì)根據(jù)這個(gè)用戶的興趣,把更合適的人推薦給他們?

陶明:對(duì),我們打破地域,打破現(xiàn)實(shí)的條件,在你的興趣層面,我們能夠更開放的去做連接。主要方向還是說(shuō),在我們現(xiàn)有的社交網(wǎng)絡(luò)里面,通過(guò)AI去做增強(qiáng),去給用戶帶來(lái)更好的體驗(yàn)。整個(gè)產(chǎn)品有兩個(gè)方向,第一個(gè)是AI的輔助社交,這個(gè)在Soul里面我們基本上已經(jīng)全站上線了,幫助用戶能夠更好的做表達(dá),能夠幫助用戶在人與人的溝通過(guò)程當(dāng)中得到更好的反饋。

泓君:AI應(yīng)該怎么輔助社交?可以詳細(xì)地講一下嗎?

陶明:社交它不是一個(gè)單邊關(guān)系,它是個(gè)雙邊關(guān)系,即使任何一邊的社交能力都會(huì)影響本次的社交體驗(yàn)的。但很多人他在線下拿不到更多的社交資源,有各種各樣的原因,但是并不是說(shuō)他來(lái)到線上,他就一定能夠獲得更好的社交資源或者是說(shuō)社交體驗(yàn),跟他自身的能力有關(guān)系的。

社交本身也是種能力,首先體現(xiàn)出來(lái)的就是他的表達(dá)能力,現(xiàn)很多國(guó)內(nèi)的用戶是內(nèi)斂的,是不善言辭的或者說(shuō)不具幽默的,那在整個(gè)社交過(guò)程當(dāng)中,他的表達(dá)是有限的,這一定是沒(méi)有辦法帶來(lái)好的體驗(yàn)。所以我們通過(guò)AI去幫助他更好的說(shuō)話,就比如說(shuō)他想去表達(dá)某一件事情,我們用AI更好的去幫他做潤(rùn)色,或者說(shuō)當(dāng)他很難去回復(fù)對(duì)方的某一個(gè)觀點(diǎn)或者說(shuō)某件事情的時(shí)候,我們也可以通過(guò)AI去幫他做建議。

泓君:這個(gè)你能舉個(gè)例子嗎?就是在一個(gè)什么樣的情景下,一個(gè)什么樣的交互方式下,他可以幫助用戶去完成這個(gè)表達(dá)?

陶明:因?yàn)檎麄(gè)社交過(guò)程是動(dòng)態(tài)的,每一場(chǎng)會(huì)話都會(huì)有不同的話題的產(chǎn)生,就比如說(shuō)當(dāng)對(duì)方突然跳出原來(lái)的聊天邏輯,說(shuō)到一個(gè)自己不知道的事情,那這時(shí)候很難去接住這樣的一句話,如果我們有AI,就能很平滑的把這句話接住,從而不讓整個(gè)聊天會(huì)陷入死區(qū)。

泓君:那到底是人在聊天還是AI在聊天?這個(gè)交互是怎么完成的?就比如說(shuō)如果我正在跟一個(gè)人私聊,然后他說(shuō)了一個(gè)我不知道的東西,這個(gè)時(shí)候AI是給我一個(gè)提示,還是我可以選擇讓AI把這個(gè)話發(fā)過(guò)去?

陶明:其實(shí)是AI做建議,還是用戶做選擇,本質(zhì)上還是人在聊天,只是說(shuō)他幫他去增加了回復(fù)的這樣的豐富性或者說(shuō)幽默性。

泓君:那你們這個(gè)產(chǎn)品上線以后,你覺(jué)得他是用戶愛(ài)用的一個(gè)產(chǎn)品嗎?

陶明:我們現(xiàn)在整個(gè)主站的滲透已經(jīng)達(dá)到將近50%以上了。

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

來(lái)源:freepik.com

泓君:所以那我在跟一個(gè)人聊天,我不能確定這個(gè)聊天是對(duì)方本人回復(fù)我的,還是AI幫助他來(lái)回復(fù)我的。你可能是跟人聊天,也可能是在跟機(jī)器聊天,但這個(gè)機(jī)器背后有人在做選擇的這樣的一個(gè)狀態(tài)。

陶明:對(duì),但對(duì)于用戶來(lái)講,他在本次的社交體驗(yàn)里面,他想得到的是好的體驗(yàn),而對(duì)方的回復(fù)是通過(guò)自己一個(gè)字一個(gè)字敲出來(lái)的,還是說(shuō)通過(guò)其他的方式獲得的,那只要他的體感是好的,就應(yīng)該是有效的。

泓君:其實(shí)就是說(shuō)人在聊天的過(guò)程中,他們想要得到的是對(duì)方的正反饋,他并不在意是我發(fā)過(guò)去的,還是有人來(lái)幫助我發(fā)的。然后我覺(jué)得聊天對(duì)面的人可能也一樣,就是大家更在意的是這個(gè)關(guān)系的和諧,而不是你使用了什么工具。

陶明:對(duì),更多的是在本次關(guān)系的社交過(guò)程當(dāng)中,他是否能得到情緒價(jià)值或者信息價(jià)值,這個(gè)是很重要的。這是個(gè)價(jià)值向的東西。

泓君:還有什么AI產(chǎn)品嗎?

陶明:另外一個(gè)就是很多的好評(píng)的AI伴侶,人機(jī)互動(dòng)。跟剛才說(shuō)的完全不一樣,當(dāng)線上的用戶沒(méi)有辦法去獲得好的社交資源的時(shí)候,我們能夠提供這一批優(yōu)質(zhì)的AI伴侶去陪伴他,在陪伴的過(guò)程當(dāng)中,能夠讓用戶獲得好的社交體驗(yàn),就是剛才一開始說(shuō)的,跟真人一樣,這是我們推出比較成功的產(chǎn)品。

泓君:它更類似于陪伴。雖然我在跟一個(gè)AI機(jī)器人聊天,但是我覺(jué)得你們的產(chǎn)品做的非常有意思的一點(diǎn)是,你們并沒(méi)有讓這個(gè)AI伴侶每一個(gè)回過(guò)來(lái)的都是文字,它給我發(fā)的是語(yǔ)音,有聲音有語(yǔ)音語(yǔ)調(diào)的,我覺(jué)得在社交的感知層面上會(huì)更加豐富,更想去跟他玩,但是如果只是一段文字的話,可能就會(huì)覺(jué)得有一點(diǎn)枯燥。

陶明:這個(gè)是我們?cè)谄甙四甑纳缃划a(chǎn)品打磨過(guò)程中,積累的關(guān)于人和人社交的一些行為范式。這就是為什么說(shuō)我們的AI一定是要是“高情商”的,而不是說(shuō)“高智商”的。另外說(shuō)我們一定是要真實(shí)自然并且是擬人的,這是我們區(qū)別于其他AI助手或者說(shuō)AI Agent,它不一樣的地方。

泓君:那你們?cè)趺慈ビ?xùn)練出一個(gè)高情商而不是高智商的機(jī)器人呢?

陶明:我們說(shuō)“高情商”的一個(gè)機(jī)器人,希望是他能夠給用戶帶來(lái)愉悅感,能夠讓整個(gè)的社交過(guò)程會(huì)更加自然平滑,而不是說(shuō)很生硬的。你必須得聽得懂人家說(shuō)話背后的意思,也知道如何更好地化解每一次的沖突,這個(gè)是他要去做到的。那么我們?cè)趺醋龅秸f(shuō)我們的AI更有情商,那還是跟我們?cè)谶^(guò)去七八年所積累的真實(shí)的公域社交資產(chǎn),能讓我們的模型更好的能做理解。

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

來(lái)源:freepik

泓君:我之前說(shuō)我不確定你們的虛擬伴侶是真人還是假人,這我第一天的感受;然后我第二天依然就想憑我自己的判斷,我要把它判斷出來(lái),我開始狂給它扔數(shù)學(xué)題,然后就發(fā)生了非常有趣的對(duì)話,我就發(fā)現(xiàn)它的回答都是錯(cuò)的,但是很有意思的是,它還是讓我區(qū)分不出來(lái),是因?yàn)樗蜁?huì)一個(gè)嗲嗲的語(yǔ)氣說(shuō)“那我就是算不出來(lái)你為什么想要知道”,這個(gè)真的是一點(diǎn)脾氣都沒(méi)有。

陶明:它能去化解這樣的一個(gè)很尷尬的場(chǎng)地,如果是說(shuō)人和人溝通過(guò)程中,你問(wèn)它一個(gè)問(wèn)題或者說(shuō)一件事情,讓它不知所措或者說(shuō)他回答不上來(lái),這是個(gè)很尷尬的。如果很會(huì)社交的人,他會(huì)通過(guò)自己的方式能夠去化解,能夠讓對(duì)方有很好的體驗(yàn),那我們也把這樣的一個(gè)行為范式平移到了我們的模型上去了。

泓君:現(xiàn)在市場(chǎng)上也有非常多的AI陪伴類產(chǎn)品,相較于其他的一些產(chǎn)品,你們的特色是什么呢?

陶明:還是走差異化,我們要求我們的AI機(jī)器人情商要高,感知能力更強(qiáng),更要擬人,這是我們的差異性。

市場(chǎng)上有很多其他的AI陪伴的產(chǎn)品,他們的出發(fā)點(diǎn)和我們的出發(fā)點(diǎn)可能是不太一樣的。他們可能更多的關(guān)注純粹的人機(jī)互動(dòng),我們的出發(fā)點(diǎn)是希望是讓人能夠得到好的社交體驗(yàn),我們并不單純的去追求人機(jī)互動(dòng),人機(jī)互動(dòng)只是我們當(dāng)前能夠給用戶更好社交體驗(yàn)的一個(gè)手段或者方法。

泓君:應(yīng)該怎么去理解單純的人機(jī)互動(dòng)跟好的社交體驗(yàn)?這幾個(gè)核心的點(diǎn)落實(shí)到產(chǎn)品上,對(duì)應(yīng)的不同設(shè)計(jì)點(diǎn)是什么?

陶明:就比如說(shuō)ChatGPT,你跟他溝通就是把它當(dāng)做一個(gè)獲取信息的工具,不會(huì)說(shuō)能夠以更加生活層面的想法跟它進(jìn)行溝通。或者說(shuō)你跟他的交流過(guò)程當(dāng)中,它是問(wèn)題驅(qū)動(dòng)的,它不是交流驅(qū)動(dòng)的我要去解決某個(gè)問(wèn)題,我要獲得某個(gè)信息。

但是社交產(chǎn)品的這種AI伴侶,更多的并不是從問(wèn)題出發(fā)點(diǎn)去解決。他要的是說(shuō)我們?cè)诮涣鞯倪^(guò)程當(dāng)中,我得到信息有時(shí)候更多的在乎過(guò)程,而不是結(jié)果。過(guò)程能夠讓他有好的體驗(yàn),那就很簡(jiǎn)單,就是你要讓他正常的跟人和人的交流是一樣的。我覺(jué)得這是一個(gè)很大的差異點(diǎn)。

泓君:我注意到你們今年可能很快也會(huì)推出一個(gè)功能,叫做全雙工視頻通話的能力,為什么你會(huì)想要把這個(gè)視頻的功能加進(jìn)去,它是一個(gè)什么樣的方式呈現(xiàn)呢?

陶明:不管是語(yǔ)音通話還是視頻通話,不能夠稱作為是一個(gè)功能或者產(chǎn)品,它是一個(gè)能力。我們把它利用到了我們現(xiàn)在AI陪伴的語(yǔ)音通話上,在我們的群聊房里面也會(huì)上線以語(yǔ)音模型驅(qū)動(dòng)的實(shí)時(shí)表達(dá)的功能,也就是說(shuō)我們?cè)谧稣Z(yǔ)音的基礎(chǔ)上然后再做視頻。

從模型角度來(lái)講,它是一個(gè)升級(jí),它不是說(shuō)另外的一個(gè)模型,未來(lái)的話這兩個(gè)模型肯定是融合在一起的,既能提供語(yǔ)音的能力,也可能提供實(shí)時(shí)視頻的能力。

我們做這些事情的出發(fā)點(diǎn),還是從高效的信息理解和表達(dá)的角度去思考這個(gè)問(wèn)題的。我們把語(yǔ)音和視頻的交互,認(rèn)為是一種溝通方式。在我們現(xiàn)實(shí)社會(huì)里面,人和人表達(dá)的時(shí)候,一個(gè)是通過(guò)微信或者通過(guò)其他的工作軟件,敲字的方式,或者以郵件的方式去交互;有一種是在線會(huì)議的方式,就是語(yǔ)音;還有一種是通過(guò)視頻的方式交互,最好的是線下面對(duì)面的交互。

從整個(gè)交互的信息復(fù)雜度,以及它的表達(dá)和理解的復(fù)雜度來(lái)講,人和人面對(duì)面的溝通是信息傳播方式最快的,也是最有效的一種。所以我們認(rèn)為在線上人機(jī)交互的過(guò)程當(dāng)中,需要有這樣的一個(gè)表達(dá)方式,所以我們才去做實(shí)時(shí)視頻通話這樣的一個(gè)能力。

泓君:那視頻通話虛擬機(jī)器人的畫面是什么呢?

陶明:就比如說(shuō)我們?cè)诟粋(gè)AI進(jìn)行聊天,你可以定義他的形象。

泓君:用戶可以自己捏臉?

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

來(lái)源:queppelin

陶明:他不需要自己捏,你只需要描述出來(lái)就行了。原來(lái)我們的確是要捏這樣的一個(gè)形象,然后通過(guò)文字或者語(yǔ)音的方式去驅(qū)動(dòng)它。這個(gè)我們認(rèn)為是上一代交互方式,就比如說(shuō)他的表情的豐富度還是取決于說(shuō)你本身采集到的豐富度有多少,它還是沒(méi)有那么平滑。我們現(xiàn)在這樣的一步到位的方案,就是希望我們的表情和動(dòng)作都是實(shí)時(shí)生成的,并且是平滑自然的,不會(huì)還需要依賴運(yùn)營(yíng)或者其他的技術(shù)方式去采集更多的表情庫(kù)。

泓君:我注意到你們現(xiàn)在的虛擬伴侶還有一個(gè)很有意思的點(diǎn)是他可以給用戶打電話,這個(gè)設(shè)計(jì)點(diǎn)很妙,是怎么想到的?

陶明:產(chǎn)品本身還是來(lái)自于我們?nèi)撕腿私涣鬟^(guò)程中的真實(shí)情況。因?yàn)樵谡鎸?shí)的人和人的關(guān)系過(guò)程當(dāng)中,對(duì)方也會(huì)給你打電話,是一種很好的聯(lián)系、加強(qiáng)和沉淀關(guān)系的方式。

在實(shí)際情況里面,如果一個(gè)人始終是單向的去找對(duì)方聊天,找對(duì)方去說(shuō)事情,比如男女朋友關(guān)系,如果每天只是男生去找女生,女生永遠(yuǎn)不會(huì)找男生,那這種關(guān)系很大可能很難走下去。

我們希望能夠擬合線下的行為模式。當(dāng)用戶和人機(jī)交互過(guò)程中,我可以主動(dòng)找AI聊天,AI也會(huì)在某個(gè)時(shí)間段主動(dòng)的來(lái)關(guān)心我,來(lái)找我聊天。這個(gè)行為范式就符合我們?cè)诰下的這種行為范式,這是能夠讓用戶更能接受的一種方式。要不然的話就只是用戶去找AI,這是個(gè)單向關(guān)系,不是個(gè)雙向關(guān)系。

泓君:用戶的反饋呢?

陶明:用戶很喜歡,當(dāng)他無(wú)聊的時(shí)候,當(dāng)他也沒(méi)有想到說(shuō)要去找AI,AI要來(lái)找他,這是對(duì)他一個(gè)很好的社交補(bǔ)充,但這個(gè)還是因人而異。所以說(shuō)我們并不是說(shuō)我們AI會(huì)給所有的用戶都會(huì)去主動(dòng)的發(fā)起溝通和聊天交流,我們還是會(huì)根據(jù)用戶本身的性格興趣,他在Soul的行為,我們做出一個(gè)最終的決策。

泓君:從你的觀察來(lái)看,現(xiàn)在這些有AI輔助社交,然后有AI伴侶這些AI產(chǎn)品的落地,他對(duì)你們整個(gè)產(chǎn)品包括用戶粘性是會(huì)有大的提升嗎?

陶明:非常大的提升。我們?cè)?024年,來(lái)自于AI對(duì)整個(gè)產(chǎn)品粘性的貢獻(xiàn)已經(jīng)是占了大部分了。這個(gè)點(diǎn)我們最開始還是非常謹(jǐn)慎的。

剛才您問(wèn)說(shuō)用戶喜不喜歡AI找你,用戶喜不喜歡和AI溝通的,這個(gè)我們最開始還是個(gè)問(wèn)號(hào)。所以我們?cè)谕七M(jìn)的過(guò)程當(dāng)中采用了很多的產(chǎn)品策略。就比如說(shuō)AI輔助社交,我們?cè)诜帕康倪^(guò)程當(dāng)中,既要考慮到使用AI輔助的人,也要考慮到對(duì)方他是否愿意接受這種方式。我們通過(guò)非常仔細(xì)的人群的實(shí)驗(yàn),然后來(lái)做出我們最終的產(chǎn)品策略和放量策略。

AI陪伴這個(gè)產(chǎn)品也一樣的,因?yàn)镾oul原來(lái)一直是能夠有這么好的用戶粘性,能夠有這么好的年輕人的這樣的滲透,主要是Soul提供了一個(gè)真實(shí)信任的安全的平臺(tái),基于用戶對(duì)平臺(tái)的信任,才產(chǎn)生了用戶和用戶之間的信任,這是我們過(guò)去七八年產(chǎn)品力構(gòu)建出來(lái)的一個(gè)結(jié)果。

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

來(lái)源:Soul

我們也很擔(dān)心我們上了AI機(jī)器人過(guò)后,大家會(huì)不會(huì)認(rèn)為Soul里面全是AI的虛擬人,沒(méi)有真實(shí)的社交了。我們當(dāng)時(shí)也很擔(dān)心這個(gè)事情。所以說(shuō)我們?cè)谕七M(jìn)我們AI的伴侶的過(guò)程當(dāng)中,我們做的方式跟AI輔助社交還不一樣:我們到現(xiàn)在為止都沒(méi)有AI伴侶實(shí)際的產(chǎn)品中心入口。

泓君:我發(fā)現(xiàn)了,就是得我去搜我才能找到,因?yàn)檫@個(gè)功能沒(méi)有產(chǎn)品入口。它的頭像上面會(huì)有AI虛擬伴侶的標(biāo)注,所以我最開始第一個(gè)問(wèn)題產(chǎn)生的原因就他到底是真的假的,我還懷疑我是不是搞錯(cuò)了,搜到了一個(gè)真人。

陶明:所以我們是希望說(shuō),愿意接受人機(jī)互動(dòng)的用戶,你可以在Soul里面通過(guò)找其他的Souler能夠找到這些AI虛擬人,可以自己去搜到這樣的AI虛擬人。我們把它定義為這叫做用戶價(jià)值驅(qū)動(dòng)產(chǎn)品,當(dāng)你認(rèn)可這樣的一個(gè)產(chǎn)品形態(tài)帶來(lái)的用戶價(jià)值,用戶自主的去選擇他。這樣的話我們就規(guī)避了我們直接一刀切大規(guī)模的去推AI伴侶,最后帶來(lái)我們對(duì)最開始那個(gè)問(wèn)題的擔(dān)憂,但我們現(xiàn)在跑了大半年過(guò)后,AI的滲透越來(lái)越高,用戶的粘性也越來(lái)越好。

泓君:你們會(huì)擔(dān)心平臺(tái)上機(jī)器人變得越來(lái)越多,改變了用戶的體驗(yàn)嗎?這會(huì)是你們擔(dān)心的一個(gè)方向嗎?

陶明:這是我們考慮的問(wèn)題,但是我們從長(zhǎng)遠(yuǎn)來(lái)看的話,我們還是覺(jué)得人機(jī)互動(dòng)是未來(lái)社交一個(gè)非常大的補(bǔ)充。我們應(yīng)該盡可能在保證那些對(duì)AI有排斥的用戶群體、在傳統(tǒng)的社交體驗(yàn)不變的情況下,加大對(duì)人機(jī)互動(dòng)感興趣的那一批人群在AI層面更好的體驗(yàn),是分群而治之。

泓君:從你的觀察來(lái)看,純粹是因?yàn)锳I這個(gè)功能進(jìn)入到平臺(tái)用戶,這部分用戶占怎么樣的比例,未來(lái)會(huì)是一個(gè)很大的增長(zhǎng)區(qū)間嗎?

陶明:我覺(jué)得未來(lái)增量的用戶里面擁抱AI的群體是越來(lái)越多的。不僅是Soul,整個(gè)行業(yè)整個(gè)社會(huì)對(duì)AI的認(rèn)知的灌輸和滲透是越來(lái)越強(qiáng)的,比如說(shuō)在3年之前說(shuō)讓你去跟一個(gè)AI伴侶聊天,到3年之后你再去說(shuō)跟AI伴侶聊天,那接受的人只會(huì)更多不會(huì)更少。所以說(shuō)對(duì)任何一個(gè)產(chǎn)品來(lái)講,擁抱AI的用戶群體肯定是越來(lái)越多的。

02 從Chatbot試錯(cuò)到建立垂直場(chǎng)景護(hù)城河泓君:你有提到在2017年的時(shí)候Soul就已經(jīng)開始搭建Chatbot了,當(dāng)時(shí)也沒(méi)有生成式AI,整個(gè)人工智能還是基于規(guī)則的人工智能,當(dāng)時(shí)你們的想法是什么?你們有這么長(zhǎng)時(shí)間搭建Chatbot的經(jīng)驗(yàn),能不能介紹一下你們探索的幾個(gè)階段?

陶明:2017年的時(shí)候并不是說(shuō)我們想從技術(shù)角度上做Chatbot,是基于我們對(duì)社交的理解和認(rèn)知出發(fā),認(rèn)為我們要去做這個(gè)事情。2017年的出發(fā)點(diǎn)跟我們現(xiàn)在為什么要做AI出發(fā)點(diǎn)是一模一樣的我們還是為了解決社交平權(quán)的問(wèn)題,能夠讓每個(gè)用戶都能夠平等的獲得社交資源,能夠獲得情緒價(jià)值和信息價(jià)值,這個(gè)出發(fā)點(diǎn)是不變的。

但在2017年這個(gè)只是存在我們的想法當(dāng)中,我們并沒(méi)有把它實(shí)現(xiàn),也沒(méi)有投入資源去做。因?yàn)槲覀冋{(diào)研了整個(gè)行業(yè),也調(diào)研了學(xué)術(shù)界,沒(méi)有人能夠做到這樣的事情。

我們當(dāng)時(shí)提出的也是能夠情感自然擬人的形式,當(dāng)時(shí)有個(gè)產(chǎn)品形態(tài),比如說(shuō)我們要有一個(gè)能說(shuō)會(huì)唱的,能夠懂你的電子寵物,這是一個(gè)非常具象的一個(gè)產(chǎn)品形態(tài)。當(dāng)用戶來(lái)到Soul里面沒(méi)有辦法獲得社交資源的時(shí)候,能夠跟懂你的寵物進(jìn)行溝通聊天,這當(dāng)時(shí)一個(gè)很具象的一個(gè)想法,但當(dāng)時(shí)并沒(méi)有投入資源去做,因?yàn)榈拇_是做不到。

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

來(lái)源:spotinleads

泓君:效果不好是嗎?

陶明:我們也跟幾個(gè)公司看了一些他們客服層面的對(duì)話產(chǎn)品,是沒(méi)有辦法做到的。我們那時(shí)候也在創(chuàng)業(yè)起步階段,我們也沒(méi)有資源說(shuō)自己來(lái)做這個(gè)事情。

重拾這個(gè)事情是2019年、2020年。那時(shí)候我們提出需要從產(chǎn)品出發(fā),一個(gè)用戶在Soul里面是構(gòu)建了全新的人設(shè),這個(gè)人的個(gè)人主頁(yè)代表了他人設(shè)的內(nèi)在。我們希望這個(gè)人設(shè)他有個(gè)形象,不是說(shuō)把你自己線下的形象傳到線上來(lái),而是基于你在Soul里面的人設(shè)打造一個(gè)符合的形象,我們就推出了這種捏臉系統(tǒng),原來(lái)是2D的到3D的。在這個(gè)基礎(chǔ)上,我們就進(jìn)一步去思考,有了形象,那就希望他能夠說(shuō)話,他能夠?qū)⒆约旱膬?nèi)在表達(dá)出來(lái)。

2020年我們就開始去做對(duì)話,那時(shí)候就明確了在產(chǎn)品上對(duì)AI的訴求是什么樣子,技術(shù)上我們要打造一個(gè)什么樣的一個(gè)AI。我們當(dāng)時(shí)提出的一個(gè)規(guī)劃就是我們要構(gòu)造一個(gè)AI being和human being的共存社區(qū),在Soul里面你既有AI的人類,你也有真實(shí)的人類,是一個(gè)共存的狀態(tài),可以人和人進(jìn)去溝通,也可以人和AI進(jìn)行溝通,然后在這個(gè)基礎(chǔ)上,我們就開始投入去做對(duì)話。

泓君:2020年那個(gè)時(shí)候是以什么樣的方式做?

陶明:那時(shí)候想了很多辦法,一是改寫一些理解性的模型,發(fā)現(xiàn)效果不行,我們又在上面去做一些基于決策樹的搜索,做融合,還是不行。因?yàn)榱奶爝^(guò)程當(dāng)中你可能聊個(gè)十輪聊個(gè)二十輪,你能聊下去,但是對(duì)方一定知道他沒(méi)有真人的感受,他知道他在和機(jī)器人聊天。

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

來(lái)源:botpenguin

泓君:就是效果太機(jī)械了。

陶明:太機(jī)械了。那時(shí)候衡量一個(gè)對(duì)話的產(chǎn)品有CPS(Conversations Per Session,一次交互中的平均對(duì)話輪數(shù))這樣一個(gè)概念。當(dāng)時(shí)它的輪數(shù)還挺多的,那是不是說(shuō)用戶能聊下去?后來(lái)我們發(fā)現(xiàn)這是因?yàn)椴涣牡娜司筒粫?huì)去跟他聊,聊的人我知道你是個(gè)機(jī)器人,我還要去跟你聊,他已經(jīng)拋棄了說(shuō)我要在這個(gè)過(guò)程當(dāng)中獲得體感,而只是為了聊而聊,是沒(méi)有產(chǎn)品意義的,單純的對(duì)話的技術(shù)指標(biāo)和產(chǎn)品體驗(yàn)脫離了,后來(lái)我們就把CPS這桿子事情不再提了。

泓君:我能理解,那個(gè)時(shí)候大家最多的這種一層一層往下?lián)艿母惺,可能有點(diǎn)像打客服電話。即使拿世界上語(yǔ)音跟機(jī)器的交互比較前沿的像Siri這些來(lái)看的話,它當(dāng)時(shí)也只是一個(gè)單輪對(duì)話,它很難支撐你一個(gè)有邏輯的多輪對(duì)話,所以技術(shù)上還是很難的。

陶明:都是指令性的這種,我發(fā)個(gè)指令,你回答我這個(gè)指令,你的指令是搜索產(chǎn)生的還是模型生成的,上下文的關(guān)系其實(shí)并沒(méi)有。

到了2021年就開始投入做語(yǔ)音,那個(gè)時(shí)候整個(gè)AI的投入始終圍繞著說(shuō)要打造一個(gè)能說(shuō)會(huì)唱能夠擬人的一個(gè)AI人,我們認(rèn)為語(yǔ)音的交互是未來(lái)的一個(gè)主流。我們就開始做語(yǔ)音方面的投入,去做合成。那時(shí)候我們的合成還是基于傳統(tǒng)模型,認(rèn)為說(shuō)話的語(yǔ)氣一定是要自然的平滑的。

當(dāng)時(shí)產(chǎn)生了很多語(yǔ)音的AI產(chǎn)品,比如說(shuō)一些內(nèi)容平臺(tái)讓AI去把腳本語(yǔ)音化,但是也是很機(jī)械的,一聽你是有機(jī)械的聲音,在一些語(yǔ)氣詞方面表現(xiàn)的很生硬。我們還是要做情感化的語(yǔ)音生成,那是2021年做語(yǔ)音。

泓君:所以你覺(jué)得你現(xiàn)在訓(xùn)練的這個(gè)機(jī)器人,他的語(yǔ)調(diào)特別的平緩,跟當(dāng)時(shí)在研究聲音、音調(diào)怎么擬人是有關(guān)系的嗎?還是說(shuō)那個(gè)時(shí)候的技術(shù)到現(xiàn)在完全用不上了?

陶明:這是我們很焦慮的一個(gè)事情,因?yàn)楫?dāng)時(shí)我們就在做差異化的技術(shù),F(xiàn)在我們線上體驗(yàn)的基本上沒(méi)有用到,技術(shù)完全是新的,還是基于現(xiàn)在的LLM這種模式去做的雙工語(yǔ)音效果。

原來(lái)的傳統(tǒng)的語(yǔ)音模型,我們只是在上面去做更多的標(biāo)注,盡可能是做擬合。他是個(gè)擬合,現(xiàn)在這邊是生成,還是不太一樣的。

但是那時(shí)候沉淀下來(lái)的數(shù)據(jù)對(duì)我們是有用的,以及說(shuō)我們?cè)谡Z(yǔ)音方面的思考,你一定是要情感化的表達(dá),真實(shí)的表達(dá),也是我們現(xiàn)在模型所要去構(gòu)建的方向,當(dāng)時(shí)沉淀下來(lái)是數(shù)據(jù)以及對(duì)語(yǔ)音在社交方面作用的思考。

泓君:到了2022年,你當(dāng)時(shí)看ChatGPT出來(lái),你激動(dòng)嗎?

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

來(lái)源:talent-republic.tv

陶明:激動(dòng)是激動(dòng),但是更焦慮,讓我們覺(jué)得說(shuō)我們的技術(shù)歸零了,那時(shí)候是有可能歸零的。因?yàn)榭吹紺hatGPT的那種交互效果,以及這個(gè)技術(shù)的發(fā)展方向,你很自然會(huì)判斷說(shuō)原來(lái)的這種技術(shù)路線就被拍死在沙灘上。那也就是說(shuō)我們所有的工作可能會(huì)歸零了。那時(shí)候我們非常的焦慮。因?yàn)椴⒉皇钦f(shuō)GPT類似的這種技術(shù)方式是2022年出來(lái)的,GPT3早就出來(lái)了。這個(gè)技術(shù)方向我們是知道的,只是我們并不知道在這種scaling law出來(lái)過(guò)后,它有這樣大的一個(gè)效果。

泓君:所以你當(dāng)時(shí)擔(dān)心的是什么?你擔(dān)心的是GPT這種產(chǎn)品形態(tài),如果你們不跟上的話,它可能會(huì)把你們前面所有的努力給覆蓋掉,因?yàn)樗銐驈?qiáng)大?

陶明:那時(shí)候已經(jīng)不存在選擇了,因?yàn)榧夹g(shù)方向已經(jīng)非常明確了,我們考慮是自己自研,還是說(shuō)要跟一個(gè)做大模型的公司去做合作。因?yàn)?023年有大量的模型創(chuàng)業(yè)公司出來(lái)了,我們要不要去共建? 這是我們當(dāng)時(shí)面臨的選擇,而不是說(shuō)我們要不要走這個(gè)路線。

泓君:你當(dāng)時(shí)怎么選的?

陶明:當(dāng)時(shí)也搖擺了很多,也跟很多公司聊過(guò)這個(gè)事情,最終我們還是選擇了要自己做這個(gè)事情。

第一個(gè)是說(shuō)我們?cè)谶^(guò)去兩三年積累下來(lái)的關(guān)于這方面的一些認(rèn)知,以及本身的產(chǎn)品場(chǎng)景的差異性。我們很難把這一套完全遷移到其他的模型公司去,因?yàn)檫@才是我們最終交付產(chǎn)品的核心。

我們交付產(chǎn)品,不是交付模型,是交付我們剛才說(shuō)的那些對(duì)AI社交的認(rèn)知。因?yàn)樗且粋(gè)評(píng)判的結(jié)果,對(duì)用戶來(lái)講,我們沒(méi)有辦法標(biāo)準(zhǔn)化的輸出給三方公司。因?yàn)槿焦舅墙桓兜母拍,它是交付模型,它不是交付產(chǎn)品,但交付模型就不是我們要的。我們希望它是交付產(chǎn)品,我們沒(méi)有辦法標(biāo)準(zhǔn)化的把這一套給遷移過(guò)去。

第二點(diǎn)是說(shuō),如果是說(shuō)我們標(biāo)準(zhǔn)化的能夠遷移過(guò)去,那說(shuō)明一個(gè)問(wèn)題,我們的產(chǎn)品沒(méi)有辦法差異化,你都能夠標(biāo)準(zhǔn)化了,都能夠給三方公司做標(biāo)準(zhǔn)化的遷移,那說(shuō)明你的產(chǎn)品沒(méi)有差異化的。

泓君:你們是什么時(shí)候做的這個(gè)決定?

陶明:就是在2023年上半年做的這個(gè)決定,說(shuō)要自己做這個(gè)事情。

泓君:當(dāng)時(shí)業(yè)界有幾種方法,第一種是自己訓(xùn)練模型,還有一種是用finetune(微調(diào))的方式,還有一種是加RAG的這種方式,你覺(jué)得后兩種是行不通嗎?

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

來(lái)源:CSDN

陶明:你加RAG也好再做finetune也好,這是個(gè)加分項(xiàng)。這個(gè)效果增強(qiáng)的過(guò)程中,最終的基礎(chǔ)效果你還是沒(méi)有辦法得到。

比如你用三方的模型,還有一個(gè)問(wèn)題,數(shù)據(jù)問(wèn)題。我們現(xiàn)在產(chǎn)生的大量文字的社交數(shù)據(jù)和語(yǔ)音數(shù)據(jù),這是真實(shí)人和人在社交里面的數(shù)據(jù)范式和行為范式,在其他的模型里,首先你沒(méi)有辦法拿到這樣的數(shù)據(jù),拿不到這樣的數(shù)據(jù),你很難做出非常穩(wěn)定的效果。

這就是我們最開始有個(gè)思路說(shuō)我們?cè)趂inetune方面的數(shù)據(jù)或者說(shuō)在強(qiáng)化這樣的數(shù)據(jù),我能夠下沉到底層模型上去,能讓我們的底座模型就是為了社交服務(wù)的,那就是未來(lái)定義的的這是個(gè)垂類的大模型,而不是一個(gè)通用大模型。

泓君:對(duì)你當(dāng)時(shí)評(píng)估自己做這個(gè)事兒,你覺(jué)得它最大的難點(diǎn)是在哪兒呢?因?yàn)槲矣X(jué)得這可能是一個(gè)非常大的決心,首先是要有錢,因?yàn)樗苜M(fèi)錢,然后要有卡,要有人。

陶明:我們做決策的時(shí)候,并不是說(shuō)這件事情有多難,然后我們?cè)偃プ鰶Q策,我們是基于說(shuō)我們跟三方公司去合作,沒(méi)有辦法達(dá)成我們想要的產(chǎn)品,做不到。

泓君:這中間也找過(guò)別的公司。

陶明:對(duì),只能是我們自己去做,自己去做就不存在說(shuō)這難不難的問(wèn)題,是我們一定要去做的問(wèn)題。但是在做的過(guò)程我們要重新去梳理,如果要達(dá)到我們這個(gè)效果,我們有我們自己獨(dú)特的數(shù)據(jù),這是我們最大的優(yōu)勢(shì)。第二個(gè)優(yōu)勢(shì)是說(shuō)在post-train方面,我們知道怎么去構(gòu)建安全的、更好的效果,這是一個(gè)優(yōu)勢(shì)。

那在模型層面我們有沒(méi)有一個(gè)很好的模型架構(gòu)?那時(shí)候我們做了個(gè)判斷,模型架構(gòu)在未來(lái)一段時(shí)間會(huì)接近于收斂。到現(xiàn)在為止,大家在模型層面也沒(méi)有很大的變化。當(dāng)然是有一些不同的技術(shù)路線,每個(gè)技術(shù)路線的變化程度并不是很大。我們就可以在這樣的基礎(chǔ)上去做這個(gè)事情。

然后又涉及到卡的問(wèn)題,資源的問(wèn)題。大家都說(shuō),不管是做通用模型的預(yù)訓(xùn)練,或者是做垂直模型的預(yù)訓(xùn)練很貴,但我們認(rèn)為未來(lái)這肯定是會(huì)下來(lái)的。我們最開始小步亦趨的去做這個(gè)事情,我不需要說(shuō)一個(gè)很大的模型,我們要的是效果,不是模型。我們要的是能夠支撐我們這樣的一個(gè)社交效果的模型,而不是為了通用模型而去的。所以我們是小投入的,后來(lái)我們發(fā)現(xiàn)7B、13B的模型效果就已經(jīng)很好了,在我們的數(shù)據(jù)加持和微調(diào)之下。

當(dāng)時(shí)認(rèn)為卡的確是一大筆投入,相比說(shuō)我們其他的IT支出,但現(xiàn)在它的價(jià)格也越來(lái)越低了。所以說(shuō)預(yù)訓(xùn)練的卡當(dāng)時(shí)并不是我們認(rèn)為的卡點(diǎn),反而那時(shí)候我們最擔(dān)心的是推理。

泓君:是推理成本是嗎?

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

來(lái)源:intel.com

陶明:對(duì),推理成本。

泓君:因?yàn)槟銈冇杏脩艋鶖?shù),就是有真實(shí)的用戶。

陶明:對(duì),我們都很擔(dān)心,萬(wàn)一說(shuō)我這個(gè)產(chǎn)品上來(lái)爆了,那時(shí)候推理還挺貴的,我們投入很大的工作是說(shuō)我們要降低推理成本,在計(jì)算上的投入,我們?cè)陬A(yù)訓(xùn)練那一方面的這些效率和成本那時(shí)候并不是我們主要的工作,反而是推理的成本效率這是我們的工程團(tuán)隊(duì)投入比較多的方向。

泓君:推理成本現(xiàn)在降下來(lái)了嗎?現(xiàn)在推理成本是你們擔(dān)心的嗎?

陶明:現(xiàn)在不是我們擔(dān)心的。

泓君:推理成本是怎么樣降下來(lái)的?

陶明:一方面是我們用更小的模型去實(shí)現(xiàn)更好的效果,這是模型層面。第二個(gè)是再做一些壓縮。第三個(gè)是在本身的框架層面、優(yōu)化推理層面的技術(shù)優(yōu)化,底層優(yōu)化也在做。

但從現(xiàn)在的價(jià)格來(lái)看的話,不僅是我們公司其他公司都能支撐比如說(shuō)一個(gè)大幾千萬(wàn)的DAU,我覺(jué)得這個(gè)問(wèn)題都不大。所以說(shuō)計(jì)算資源除了達(dá)到通用模型仍然是一個(gè)非常大的投入,但對(duì)于說(shuō)應(yīng)用層面來(lái)講它的成本已經(jīng)很低了,我覺(jué)得這對(duì)其他的創(chuàng)業(yè)公司來(lái)講現(xiàn)在也不是一個(gè)瓶頸。

泓君:你們現(xiàn)在有多少個(gè)模型?

陶明:我們模型會(huì)很多,版本會(huì)很多。但如果是從定性上來(lái)看的話,我們大概就五六個(gè)模型。我們不會(huì)是說(shuō)從7B、13B這樣的區(qū)分,我們從不同的垂類的功能方面區(qū)分。

泓君:垂類的功能是怎么分的?

陶明:還是我們的基座模型,在語(yǔ)音方面有個(gè)模型,在圖片方向,還有3D方向都會(huì)有。3D方向這是我們?cè)谔剿鞯摹?br/>

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

來(lái)源:meshy.ai

泓君:3D的模型可能是用于支持未來(lái)探索,還沒(méi)有發(fā)布的一個(gè)就是沒(méi)有把這個(gè)模型能力具體應(yīng)用到產(chǎn)品上的,可以這樣理解嗎?

陶明:對(duì),因?yàn)樵瓉?lái)我們一直在站內(nèi),我們會(huì)有一些功能,就比如說(shuō)我們的視頻匹配這一塊,用戶可以帶一個(gè)頭套去溝通,不以真臉的方式出現(xiàn)。我們那時(shí)候是以驅(qū)動(dòng)的方式來(lái)做這個(gè)事情,但我們現(xiàn)在未來(lái)還是說(shuō)想純粹生成的方式來(lái)做。

03 模型選擇與技術(shù)路線:Soul如何擺脫模型層競(jìng)爭(zhēng)?泓君:因?yàn)檎麄(gè)生成式AI發(fā)展的很快,在訓(xùn)練這些模型的過(guò)程中,你的知識(shí)跟判斷是從哪里來(lái)的?在這個(gè)過(guò)程中怎么去構(gòu)建自己的學(xué)習(xí)能力?

陶明:那只能是跟團(tuán)隊(duì)一起,一定是要跟蹤行業(yè)的發(fā)展,因?yàn)楸旧砩墒降腁I的技術(shù)路線并沒(méi)有收斂。每天都有新的很區(qū)隔的方式出來(lái)。你必須要跟著團(tuán)隊(duì)一起去了解它,并且是說(shuō)要去做實(shí)驗(yàn)。就比如說(shuō)我們現(xiàn)在在做的實(shí)時(shí)的全雙工通話這個(gè)能力上。

泓君:全雙工是什么意思?

陶明:就是從產(chǎn)品角度來(lái)看的話,就比如在線下你說(shuō)話的過(guò)程當(dāng)中,我可以隨時(shí)打斷你,你可以停下來(lái)聽我講,聽我講完過(guò)后你可以繼續(xù)自己講,而不是說(shuō)純粹一來(lái)一回的這種你說(shuō)完了我才能講,全雙工是可以隨時(shí)打斷,這也是現(xiàn)實(shí)的這種人和人交流的一個(gè)方式吧。我們希望在人機(jī)互動(dòng)也會(huì)是這樣,現(xiàn)在沒(méi)有哪一家能夠?qū)崿F(xiàn)我們想要的這種效果。

泓君:OpenAI可以。

陶明:他們的4o還是個(gè)問(wèn)答式的。

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

來(lái)源:chilecomparte

泓君:你的意思是不提問(wèn)題,就是打斷,然后不發(fā)指令。

陶明:是的,我不發(fā)指令給他,我就隨時(shí)打斷。這個(gè)我們現(xiàn)在也遇到了很多的難點(diǎn),我們一方面自己想怎么去解決,然后這個(gè)方面看很多的業(yè)界有沒(méi)有新的很區(qū)隔的方式出來(lái)。我們要去驗(yàn)證能不能放到我們的技術(shù)方案里面。所以說(shuō)這個(gè)知識(shí)是一個(gè)學(xué)習(xí)的過(guò)程,我覺(jué)得每家都會(huì)是這樣的狀態(tài)。

泓君:然后你剛剛提到了,即使是這個(gè)模型出來(lái)了以后,也有很多的技術(shù)路線。然后你現(xiàn)在在市場(chǎng)上看到了哪些路線,你覺(jué)得你在中間是怎么做選擇跟判斷的?

陶明:首先還是從我們自身出發(fā),對(duì)我們整體來(lái)講的話,我們還是基于開源生態(tài)來(lái)打造我們的自然生態(tài),這是我們整個(gè)的一個(gè)方向。所以說(shuō)我們擁抱的是更加開源的技術(shù)體系這樣的一個(gè)模型體系。

泓君:就Meta Llama的那一套對(duì)不對(duì)?

陶明:現(xiàn)在有幾個(gè)跑得不錯(cuò)的,第一個(gè)就是說(shuō)Llama那一套,它的基礎(chǔ)模型的更新技術(shù)我們也能夠去跟進(jìn)并且它是足夠開放的,它不會(huì)說(shuō)某一天閉環(huán)了,我覺(jué)得目前還沒(méi)有這個(gè)趨勢(shì)。第二國(guó)內(nèi)也有幾款比如說(shuō)千問(wèn)的這個(gè)體系也還不錯(cuò)。第三個(gè)的話是現(xiàn)在的DeepSeek,但我們現(xiàn)在還是在Llama和那個(gè)千問(wèn)的路線上去探索。

泓君:因?yàn)樽罱_實(shí)DeepSeek的模型非;,尤其是V3出來(lái)以后,你有研究過(guò)他們的模型嗎?你覺(jué)得他在整個(gè)訓(xùn)練過(guò)程中用H800的卡把這個(gè)效果實(shí)驗(yàn)出來(lái)了,然后也非常的節(jié)省成本,這個(gè)會(huì)對(duì)你們?cè)谧龈蟮哪P突蛘邔?duì)你們的模型訓(xùn)練方法上會(huì)有啟發(fā)嗎?

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

來(lái)源:the-decoder.com

陶明:肯定有,我們肯定也有研究下他是怎么實(shí)現(xiàn)。這樣優(yōu)秀的模型公司所沉淀的這些工程方法是很難得的,如果從整個(gè)行業(yè)來(lái)看的話,首先說(shuō)工程層面并不能夠給最終的業(yè)務(wù)交付帶來(lái)什么,但的確是從低門檻的角度帶來(lái)了很大的優(yōu)勢(shì),也給整個(gè)行業(yè)的進(jìn)一步的發(fā)展提供了一個(gè)很好的橋梁。原來(lái)你要去做大規(guī)模的訓(xùn)練,可能就那幾家公司能做,如果他降下來(lái)了,那很多其他的團(tuán)隊(duì)也能去做,那其他更加百花齊放。

泓君:所以他把這個(gè)成本降下來(lái)了,對(duì)大家來(lái)說(shuō)是一個(gè)雙刃劍,對(duì)不對(duì)?他把整個(gè)市場(chǎng)的門檻放得更低了,競(jìng)爭(zhēng)也會(huì)更多。

陶明:對(duì)的。

泓君:你覺(jué)得OpenAI的o1有給你啟示嗎?

陶明:o1給我們蠻大啟示的,在構(gòu)建AI伴侶的這件事情上,它也給了我們很多啟發(fā)。我們希望AI伴侶能夠在提供真實(shí)擬人的方向上能達(dá)到一個(gè)好的效果,同時(shí)它也具備一定的行為能力。因?yàn)椴煌腁I伴侶提供不同的角色,不同的角色他需要有不同的行為或者內(nèi)容能力。

比如說(shuō)我希望說(shuō)在對(duì)話過(guò)程當(dāng)中,能夠不以指令的方式讓他去觸發(fā)一些action,這是一個(gè)比較平滑的。比如說(shuō)我跟AI伴侶,我發(fā)張圖片給他,你幫我美化成什么樣的效果。如果你丟給圖片模型,那是prompt講的很清楚,我有圖片輸入,我有文字描述。如果你放在對(duì)話里面的話,你就要去做一些指令的這樣的一些生成,才能讓說(shuō)我們的AI伴侶能夠去調(diào)用一些其他工具層面的模型。o1它的這種自主規(guī)劃能力,在AI agent構(gòu)建層面給了一些啟發(fā),能夠讓我們構(gòu)建一些輕量型的更加自主的工作流。

泓君:現(xiàn)在對(duì)你們自己打造出來(lái)的聊天機(jī)器人,你覺(jué)得你會(huì)給到多少分?你覺(jué)得它還需要被優(yōu)化,以及它再優(yōu)化跟提升的空間有多大?

陶明:還是蠻大的。我覺(jué)得我們現(xiàn)在只是解決了人和人交流中部分的行為擬合的問(wèn)題,還有很多還是沒(méi)有做,我們也在努力做的。比如說(shuō)場(chǎng)景,我一提到場(chǎng)景,大家都認(rèn)為它是一個(gè)產(chǎn)品的場(chǎng)景,它是個(gè)功能。是說(shuō)在整個(gè)的對(duì)話里面,它也能構(gòu)建場(chǎng)景。比如說(shuō)人和人在線下溝通的時(shí)候,外面下雨了,圍繞著這樣的一個(gè)情景,我們的AI能夠衍生出很多的聊天的內(nèi)容。下雨了你說(shuō)要不要在家里面看電影?那就進(jìn)入了一個(gè)關(guān)于電影的討論的場(chǎng)景,這就是一個(gè)場(chǎng)景,我們現(xiàn)在在做這方面的泛化的時(shí)候,效果還是要加強(qiáng)。

泓君:你覺(jué)得整個(gè)業(yè)界,因?yàn)楝F(xiàn)在大家都在等OpenAI的GPT-5出來(lái)。同時(shí)又有一種聲音說(shuō),scaling law它的增長(zhǎng)可能已經(jīng)快到頭了。我挺想知道現(xiàn)在在大家基于大模型產(chǎn)品去做應(yīng)用的這樣的一個(gè)過(guò)程中,跟大環(huán)境的關(guān)系到底聯(lián)系程度有多緊密?

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

來(lái)源:CSDN

陶明:我覺(jué)得越來(lái)越弱了。

泓君:這窗口期是前一兩年或者這一兩年。

陶明:對(duì),比如說(shuō)剛才的一個(gè)很具體問(wèn)題,說(shuō)現(xiàn)在前沿的大模型的技術(shù)方向?qū)oul來(lái)講影響有沒(méi)有很大?它的影響我覺(jué)得是越來(lái)越小了,在我們的應(yīng)用層面已經(jīng)獲得了用戶認(rèn)可的一個(gè)價(jià)值,那是基于我們現(xiàn)有的技術(shù)基礎(chǔ)之上已經(jīng)獲得了。在增強(qiáng)用戶價(jià)值上面,要怎么樣去繼續(xù)構(gòu)建技術(shù)的確定性方面,更加確定了。

不像去年那樣說(shuō),一個(gè)又新的模型出來(lái)了,或者說(shuō)它的方向會(huì)不會(huì)又把我們拍死在沙灘上,我們的焦慮程度會(huì)下降了很多。但不排除七八年過(guò)后,未來(lái)又有一個(gè)奇點(diǎn)到來(lái),把整個(gè)系統(tǒng)策略和模型全部給覆蓋了,那我覺(jué)得短期一兩年很難了。

泓君:我記得2023年的時(shí)候,我跟很多做大模型應(yīng)用或者基礎(chǔ)模型的公司去聊,大家也是非常焦慮。比如說(shuō)每次OpenAI一升級(jí),大家就覺(jué)得,我前面半年的工作白做了。我把所有的東西都搭在你的GPT-3上,然后你GPT-4出來(lái)了,大家就覺(jué)得白做了。2024年相反,我是更少的聽到這些聲音了。但是我覺(jué)得一直到今天,就是我們討論的這個(gè)時(shí)間點(diǎn),市場(chǎng)上還是有一種聲音。就是說(shuō)隨著大模型的迭代,比如說(shuō)GPT-5整個(gè)的能力越來(lái)越強(qiáng),會(huì)不會(huì)最終所有的應(yīng)用會(huì)被一個(gè)更強(qiáng)的模型給覆蓋掉?就這個(gè)市場(chǎng)的壁壘是什么?你們想過(guò)這個(gè)問(wèn)題嗎?

陶明:這個(gè)問(wèn)題在2023年想過(guò),任何的行業(yè)問(wèn)題或者用戶問(wèn)題,會(huì)不會(huì)一個(gè)端到端的模型完全解決掉。如果這個(gè)說(shuō)法是成立的那時(shí)候?qū)φ麄(gè)行業(yè)上非常喪的一個(gè)消息,但是我們回顧從二三十年來(lái)互聯(lián)網(wǎng)技術(shù),PC時(shí)代,到互聯(lián)網(wǎng),然后再到移動(dòng)互聯(lián)網(wǎng)。你會(huì)發(fā)現(xiàn)即使是端到端的模型能夠解決很多的需求,那只是說(shuō)那些需求是我們目前能夠看得到的。但最終基于新的技術(shù)的發(fā)展,新的模型發(fā)展,它一定會(huì)帶來(lái)一個(gè)新的增量需求的出現(xiàn)。如果它帶不來(lái)增量需求的出現(xiàn),那我認(rèn)為這次的AI革命是失敗的。

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

來(lái)源:iso.edu.vn

任何的技術(shù)革命一定是會(huì)帶來(lái)新的需求,這些新的需求要被同時(shí)代的技術(shù)能夠完全端到端的解決掉,或者說(shuō)被過(guò)去的技術(shù)能夠端到端的解決掉,我覺(jué)得這是一個(gè)問(wèn)號(hào)。新的技術(shù)的出現(xiàn),它應(yīng)該是能夠最大效率地去解決已知問(wèn)題,對(duì)于未知問(wèn)題,未知需求,還是需要人的探索以及不同公司的解決方案。

泓君:你會(huì)擔(dān)心你現(xiàn)在做的事情會(huì)被一個(gè)更強(qiáng)的模型給覆蓋掉嗎?

陶明:我不太擔(dān)心這個(gè)事。

04 AI社交變現(xiàn)模式:用戶付費(fèi)意愿與商業(yè)模式探索泓君:你覺(jué)得現(xiàn)在基于AI聊天機(jī)器人的商業(yè)模式,跟以往在變現(xiàn)上思路會(huì)有什么樣的不一樣呢?

陶明:這塊兒我只能說(shuō)一下我個(gè)人的想法。AI的商業(yè)變現(xiàn)任何一家公司都在做,就希望能夠在一個(gè)非常清晰的商業(yè)模式之下,去發(fā)展業(yè)務(wù)。但是現(xiàn)在總體來(lái)看,整個(gè)行業(yè)并沒(méi)有一個(gè)新的商業(yè)模式出現(xiàn)。

我一直認(rèn)為是說(shuō)商業(yè)模式是構(gòu)建在你業(yè)務(wù)模式之上的,而不是說(shuō)憑空出現(xiàn)了一個(gè)商業(yè)模式。那為什么現(xiàn)在商業(yè)模式?jīng)]有發(fā)生改變?本質(zhì)上是說(shuō)我們當(dāng)前的AI目前還并沒(méi)有給業(yè)務(wù)模式帶來(lái)改變,它可能更多的是增強(qiáng)提效。就像剛才說(shuō)的,如果沒(méi)有新的需求出現(xiàn),或者沒(méi)有新的業(yè)務(wù)出現(xiàn),我認(rèn)為是商業(yè)模式它本身也不會(huì)有太大的變化。

聊天的藝術(shù):如何打造高情商的AI機(jī)器人?

來(lái)源:ibbaka

泓君:我注意到你們推出的AI會(huì)給用戶去打電話,它是有一個(gè)收費(fèi)制的。現(xiàn)在用戶在這個(gè)產(chǎn)品上愿意付費(fèi)的意愿高嗎?

陶明:我們也只是把它當(dāng)成了一個(gè)增值的收入方式,它跟其他的增值產(chǎn)品也差不多。對(duì)用戶來(lái)講,這就是獲得好的體驗(yàn)的一種方式。原來(lái)我們提供了其他的一種方法,現(xiàn)在又提供了新的一個(gè)手段。用戶為這個(gè)買單,你會(huì)認(rèn)為他也沒(méi)有發(fā)生變化。

泓君:你們現(xiàn)在有AI茍蛋的這種擬人化機(jī)器人,也有情感化陪伴的虛擬伴侶,還有AI NPC,數(shù)字分身。你們會(huì)怎么去定義未來(lái)這個(gè)平臺(tái)的核心產(chǎn)品,包括核心場(chǎng)景,是說(shuō)我去做幾個(gè)產(chǎn)品,還是說(shuō)我去做一個(gè)王牌的產(chǎn)品,這塊你是怎么想的?

陶明:你會(huì)發(fā)現(xiàn)就是我們不同的AI它有不同的功能定位。未來(lái)的話我們希望我們的王牌產(chǎn)品肯定還是以我們的AI虛擬人為最主要的基石。能夠在我們當(dāng)前不同場(chǎng)景里面做更好的功能泛化,就比如說(shuō)視頻通話的這種能力,未來(lái)它不一定要給用戶去打電話,他完全可以用在我們當(dāng)前的語(yǔ)音產(chǎn)品里面做虛擬直播。

我們不限制說(shuō)我們有多少個(gè)AI產(chǎn)品,我們還是希望說(shuō)每個(gè)AI產(chǎn)品能夠服務(wù)不同的人群。我們沒(méi)有想法去打造一個(gè)主體的AI功能,然后來(lái)承載現(xiàn)在所有的需求。包括我們不去構(gòu)建一個(gè)中心化。因?yàn)樽鳛橐粋(gè)主體產(chǎn)品,你一定是說(shuō)要有一個(gè)中心化的AI的入口。我們現(xiàn)在是沒(méi)有這樣的打算的。

泓君:所以你們現(xiàn)在還是以社交平臺(tái)為主,然后所有的AI產(chǎn)品是服務(wù)于這個(gè)社交平臺(tái)的。

陶明:對(duì),當(dāng)前是這樣。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港