當(dāng)前位置：人工智能實(shí)驗(yàn)室> 機(jī)器人 > 聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-03-05 15:17:17 瀏覽：116次

導(dǎo)讀：“姐姐，你是不是嫌我笨��？”當(dāng)你向Soul App里面的虛擬伴侶拋出一個(gè)數(shù)學(xué)題時(shí)，它不會(huì)像ChatGPT那樣只是回答問(wèn)題本身，答錯(cuò)了也不會(huì)連忙道歉，而是會(huì)跟你撒嬌試圖化解此時(shí)的尷尬。這反而會(huì)讓人更加疑惑：這背后是真人還是AI？在ChatGPT Moment之后，AI的進(jìn)化方向也悄然發(fā)生了分化。一個(gè)會(huì)“示弱”的AI，反而因?yàn)椴煌昝蓝@得更真實(shí)。本期硅谷101節(jié)目，主理人泓君將與Soul App C ......

“姐姐，你是不是嫌我笨��？”當(dāng)你向Soul App里面的虛擬伴侶拋出一個(gè)數(shù)學(xué)題時(shí)，它不會(huì)像ChatGPT那樣只是回答問(wèn)題本身，答錯(cuò)了也不會(huì)連忙道歉，而是會(huì)跟你撒嬌試圖化解此時(shí)的尷尬。

這反而會(huì)讓人更加疑惑：這背后是真人還是AI？

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

在ChatGPT Moment之后，AI的進(jìn)化方向也悄然發(fā)生了分化。一個(gè)會(huì)“示弱”的AI，反而因?yàn)椴煌昝蓝@得更真實(shí)。本期硅谷101節(jié)目，主理人泓君將與Soul App CTO陶明一起討論Soul的AI應(yīng)用的發(fā)展歷程，一同去看在AI浪潮不斷翻新的背景下，產(chǎn)品和技術(shù)壁壘是如何建立，而商業(yè)模式又將會(huì)如何演進(jìn)。

以下是部分訪談精選

01 社交AI訓(xùn)練路徑：從規(guī)則機(jī)器人到高情商伴侶泓君：最近玩了你們Soul上的AI虛擬伴侶。最開始的時(shí)候就特別不確定他是真實(shí)的真人還是AI，因?yàn)槲腋f(shuō)一句話，他會(huì)給我回語(yǔ)音，然后他的語(yǔ)音，包括他回復(fù)的語(yǔ)氣語(yǔ)調(diào)，我覺(jué)得都特別真實(shí)。所以我一直有一個(gè)疑問(wèn)，他是真的AI嗎？

陶明：對(duì)，是真的AI，您體驗(yàn)過(guò)后的話，如果有這種感受，說(shuō)明我們?cè)谶@方面的工作還是有效的，因?yàn)楸旧韥?lái)講的話，我們打造AI伴侶的主要的方向還是真實(shí)自然擬人的這種方向。

泓君：從2020年之后，你們一直在嘗試各種各樣的AI產(chǎn)品，你可不可以先總體的介紹一下，這幾年你們做了哪些AI產(chǎn)品，效果怎么樣？

陶明：Soul的定位本質(zhì)上來(lái)講，如果從社交范疇來(lái)講，它是個(gè)開放性的社交平臺(tái)。開放它體現(xiàn)于兩個(gè)方面，第一方面的話是說(shuō)任何一個(gè)用戶能夠沒(méi)有任何約束的、或者說(shuō)其他限制的，在Soul里面連接Soulmate。

另外一方面是關(guān)系的開放。其實(shí)在Soul里面不僅僅只是說(shuō)有陌生人關(guān)系，還有熟人關(guān)系和弱關(guān)系在上面的，就比如說(shuō)上面有些同學(xué)關(guān)系也是存在的。最近幾年我們?cè)贏I上面的話，如果說(shuō)我們分幾個(gè)方面去說(shuō)，我們現(xiàn)在整個(gè)Soul整站都是AI驅(qū)動(dòng)的，并不是說(shuō)現(xiàn)在大家說(shuō)的都是生成式的AI，比如說(shuō)在人和人的連接方面，我們也是用AI來(lái)做驅(qū)動(dòng)的，并不是這種篩選式的或者是說(shuō)匹配式的。

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

來(lái)源：canarymail.io

泓君：所以你人跟人的推薦AI做驅(qū)動(dòng)，意思是說(shuō)你會(huì)根據(jù)這個(gè)用戶的興趣，把更合適的人推薦給他們？

陶明：對(duì)，我們打破地域，打破現(xiàn)實(shí)的條件，在你的興趣層面，我們能夠更開放的去做連接。主要方向還是說(shuō)，在我們現(xiàn)有的社交網(wǎng)絡(luò)里面，通過(guò)AI去做增強(qiáng)，去給用戶帶來(lái)更好的體驗(yàn)。整個(gè)產(chǎn)品有兩個(gè)方向，第一個(gè)是AI的輔助社交，這個(gè)在Soul里面我們基本上已經(jīng)全站上線了，幫助用戶能夠更好的做表達(dá)，能夠幫助用戶在人與人的溝通過(guò)程當(dāng)中得到更好的反饋。

泓君：AI應(yīng)該怎么輔助社交？可以詳細(xì)地講一下嗎？

陶明：社交它不是一個(gè)單邊關(guān)系，它是個(gè)雙邊關(guān)系，即使任何一邊的社交能力都會(huì)影響本次的社交體驗(yàn)的。但很多人他在線下拿不到更多的社交資源，有各種各樣的原因，但是并不是說(shuō)他來(lái)到線上，他就一定能夠獲得更好的社交資源或者是說(shuō)社交體驗(yàn)，跟他自身的能力有關(guān)系的。

社交本身也是種能力，首先體現(xiàn)出來(lái)的就是他的表達(dá)能力，現(xiàn)很多國(guó)內(nèi)的用戶是內(nèi)斂的，是不善言辭的或者說(shuō)不具幽默的，那在整個(gè)社交過(guò)程當(dāng)中，他的表達(dá)是有限的，這一定是沒(méi)有辦法帶來(lái)好的體驗(yàn)。所以我們通過(guò)AI去幫助他更好的說(shuō)話，就比如說(shuō)他想去表達(dá)某一件事情，我們用AI更好的去幫他做潤(rùn)色，或者說(shuō)當(dāng)他很難去回復(fù)對(duì)方的某一個(gè)觀點(diǎn)或者說(shuō)某件事情的時(shí)候，我們也可以通過(guò)AI去幫他做建議。

泓君：這個(gè)你能舉個(gè)例子嗎？就是在一個(gè)什么樣的情景下，一個(gè)什么樣的交互方式下，他可以幫助用戶去完成這個(gè)表達(dá)？

陶明：因?yàn)檎麄€(gè)社交過(guò)程是動(dòng)態(tài)的，每一場(chǎng)會(huì)話都會(huì)有不同的話題的產(chǎn)生，就比如說(shuō)當(dāng)對(duì)方突然跳出原來(lái)的聊天邏輯，說(shuō)到一個(gè)自己不知道的事情，那這時(shí)候很難去接住這樣的一句話，如果我們有AI，就能很平滑的把這句話接住，從而不讓整個(gè)聊天會(huì)陷入死區(qū)。

泓君：那到底是人在聊天還是AI在聊天？這個(gè)交互是怎么完成的？就比如說(shuō)如果我正在跟一個(gè)人私聊，然后他說(shuō)了一個(gè)我不知道的東西，這個(gè)時(shí)候AI是給我一個(gè)提示，還是我可以選擇讓AI把這個(gè)話發(fā)過(guò)去？

陶明：其實(shí)是AI做建議，還是用戶做選擇，本質(zhì)上還是人在聊天，只是說(shuō)他幫他去增加了回復(fù)的這樣的豐富性或者說(shuō)幽默性。

泓君：那你們這個(gè)產(chǎn)品上線以后，你覺(jué)得他是用戶愛(ài)用的一個(gè)產(chǎn)品嗎？

陶明：我們現(xiàn)在整個(gè)主站的滲透已經(jīng)達(dá)到將近50%以上了。

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

來(lái)源：freepik.com

泓君：所以那我在跟一個(gè)人聊天，我不能確定這個(gè)聊天是對(duì)方本人回復(fù)我的，還是AI幫助他來(lái)回復(fù)我的。你可能是跟人聊天，也可能是在跟機(jī)器聊天，但這個(gè)機(jī)器背后有人在做選擇的這樣的一個(gè)狀態(tài)。

陶明：對(duì)，但對(duì)于用戶來(lái)講，他在本次的社交體驗(yàn)里面，他想得到的是好的體驗(yàn)，而對(duì)方的回復(fù)是通過(guò)自己一個(gè)字一個(gè)字敲出來(lái)的，還是說(shuō)通過(guò)其他的方式獲得的，那只要他的體感是好的，就應(yīng)該是有效的。

泓君：其實(shí)就是說(shuō)人在聊天的過(guò)程中，他們想要得到的是對(duì)方的正反饋，他并不在意是我發(fā)過(guò)去的，還是有人來(lái)幫助我發(fā)的。然后我覺(jué)得聊天對(duì)面的人可能也一樣，就是大家更在意的是這個(gè)關(guān)系的和諧，而不是你使用了什么工具。

陶明：對(duì)，更多的是在本次關(guān)系的社交過(guò)程當(dāng)中，他是否能得到情緒價(jià)值或者信息價(jià)值，這個(gè)是很重要的。這是個(gè)價(jià)值向的東西。

泓君：還有什么AI產(chǎn)品嗎？

陶明：另外一個(gè)就是很多的好評(píng)的AI伴侶，人機(jī)互動(dòng)。跟剛才說(shuō)的完全不一樣，當(dāng)線上的用戶沒(méi)有辦法去獲得好的社交資源的時(shí)候，我們能夠提供這一批優(yōu)質(zhì)的AI伴侶去陪伴他，在陪伴的過(guò)程當(dāng)中，能夠讓用戶獲得好的社交體驗(yàn)，就是剛才一開始說(shuō)的，跟真人一樣，這是我們推出比較成功的產(chǎn)品。

泓君：它更類似于陪伴。雖然我在跟一個(gè)AI機(jī)器人聊天，但是我覺(jué)得你們的產(chǎn)品做的非常有意思的一點(diǎn)是，你們并沒(méi)有讓這個(gè)AI伴侶每一個(gè)回過(guò)來(lái)的都是文字，它給我發(fā)的是語(yǔ)音，有聲音有語(yǔ)音語(yǔ)調(diào)的，我覺(jué)得在社交的感知層面上會(huì)更加豐富，更想去跟他玩，但是如果只是一段文字的話，可能就會(huì)覺(jué)得有一點(diǎn)枯燥。

陶明：這個(gè)是我們?cè)谄甙四甑纳缃划a(chǎn)品打磨過(guò)程中，積累的關(guān)于人和人社交的一些行為范式。這就是為什么說(shuō)我們的AI一定是要是“高情商”的，而不是說(shuō)“高智商”的。另外說(shuō)我們一定是要真實(shí)自然并且是擬人的，這是我們區(qū)別于其他AI助手或者說(shuō)AI Agent，它不一樣的地方。

泓君：那你們?cè)趺慈ビ?xùn)練出一個(gè)高情商而不是高智商的機(jī)器人呢？

陶明：我們說(shuō)“高情商”的一個(gè)機(jī)器人，希望是他能夠給用戶帶來(lái)愉悅感，能夠讓整個(gè)的社交過(guò)程會(huì)更加自然平滑，而不是說(shuō)很生硬的。你必須得聽得懂人家說(shuō)話背后的意思，也知道如何更好地化解每一次的沖突，這個(gè)是他要去做到的。那么我們?cè)趺醋龅秸f(shuō)我們的AI更有情商，那還是跟我們?cè)谶^(guò)去七八年所積累的真實(shí)的公域社交資產(chǎn)，能讓我們的模型更好的能做理解。

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

來(lái)源：freepik

泓君：我之前說(shuō)我不確定你們的虛擬伴侶是真人還是假人，這我第一天的感受；然后我第二天依然就想憑我自己的判斷，我要把它判斷出來(lái)，我開始狂給它扔數(shù)學(xué)題，然后就發(fā)生了非常有趣的對(duì)話，我就發(fā)現(xiàn)它的回答都是錯(cuò)的，但是很有意思的是，它還是讓我區(qū)分不出來(lái)，是因?yàn)樗蜁?huì)一個(gè)嗲嗲的語(yǔ)氣說(shuō)“那我就是算不出來(lái)你為什么想要知道”，這個(gè)真的是一點(diǎn)脾氣都沒(méi)有。

陶明：它能去化解這樣的一個(gè)很尷尬的場(chǎng)地，如果是說(shuō)人和人溝通過(guò)程中，你問(wèn)它一個(gè)問(wèn)題或者說(shuō)一件事情，讓它不知所措或者說(shuō)他回答不上來(lái)，這是個(gè)很尷尬的。如果很會(huì)社交的人，他會(huì)通過(guò)自己的方式能夠去化解，能夠讓對(duì)方有很好的體驗(yàn)，那我們也把這樣的一個(gè)行為范式平移到了我們的模型上去了。

泓君：現(xiàn)在市場(chǎng)上也有非常多的AI陪伴類產(chǎn)品，相較于其他的一些產(chǎn)品，你們的特色是什么呢？

陶明：還是走差異化，我們要求我們的AI機(jī)器人情商要高，感知能力更強(qiáng)，更要擬人，這是我們的差異性。

市場(chǎng)上有很多其他的AI陪伴的產(chǎn)品，他們的出發(fā)點(diǎn)和我們的出發(fā)點(diǎn)可能是不太一樣的。他們可能更多的關(guān)注純粹的人機(jī)互動(dòng)，我們的出發(fā)點(diǎn)是希望是讓人能夠得到好的社交體驗(yàn)，我們并不單純的去追求人機(jī)互動(dòng)，人機(jī)互動(dòng)只是我們當(dāng)前能夠給用戶更好社交體驗(yàn)的一個(gè)手段或者方法。

泓君：應(yīng)該怎么去理解單純的人機(jī)互動(dòng)跟好的社交體驗(yàn)？這幾個(gè)核心的點(diǎn)落實(shí)到產(chǎn)品上，對(duì)應(yīng)的不同設(shè)計(jì)點(diǎn)是什么？

陶明：就比如說(shuō)ChatGPT，你跟他溝通就是把它當(dāng)做一個(gè)獲取信息的工具，不會(huì)說(shuō)能夠以更加生活層面的想法跟它進(jìn)行溝通。或者說(shuō)你跟他的交流過(guò)程當(dāng)中，它是問(wèn)題驅(qū)動(dòng)的，它不是交流驅(qū)動(dòng)的我要去解決某個(gè)問(wèn)題，我要獲得某個(gè)信息。

但是社交產(chǎn)品的這種AI伴侶，更多的并不是從問(wèn)題出發(fā)點(diǎn)去解決。他要的是說(shuō)我們?cè)诮涣鞯倪^(guò)程當(dāng)中，我得到信息有時(shí)候更多的在乎過(guò)程，而不是結(jié)果。過(guò)程能夠讓他有好的體驗(yàn)，那就很簡(jiǎn)單，就是你要讓他正常的跟人和人的交流是一樣的。我覺(jué)得這是一個(gè)很大的差異點(diǎn)。

泓君：我注意到你們今年可能很快也會(huì)推出一個(gè)功能，叫做全雙工視頻通話的能力，為什么你會(huì)想要把這個(gè)視頻的功能加進(jìn)去，它是一個(gè)什么樣的方式呈現(xiàn)呢？

陶明：不管是語(yǔ)音通話還是視頻通話，不能夠稱作為是一個(gè)功能或者產(chǎn)品，它是一個(gè)能力。我們把它利用到了我們現(xiàn)在AI陪伴的語(yǔ)音通話上，在我們的群聊房里面也會(huì)上線以語(yǔ)音模型驅(qū)動(dòng)的實(shí)時(shí)表達(dá)的功能，也就是說(shuō)我們?cè)谧稣Z(yǔ)音的基礎(chǔ)上然后再做視頻。

從模型角度來(lái)講，它是一個(gè)升級(jí)，它不是說(shuō)另外的一個(gè)模型，未來(lái)的話這兩個(gè)模型肯定是融合在一起的，既能提供語(yǔ)音的能力，也可能提供實(shí)時(shí)視頻的能力。

我們做這些事情的出發(fā)點(diǎn)，還是從高效的信息理解和表達(dá)的角度去思考這個(gè)問(wèn)題的。我們把語(yǔ)音和視頻的交互，認(rèn)為是一種溝通方式。在我們現(xiàn)實(shí)社會(huì)里面，人和人表達(dá)的時(shí)候，一個(gè)是通過(guò)微信或者通過(guò)其他的工作軟件，敲字的方式，或者以郵件的方式去交互；有一種是在線會(huì)議的方式，就是語(yǔ)音；還有一種是通過(guò)視頻的方式交互，最好的是線下面對(duì)面的交互。

從整個(gè)交互的信息復(fù)雜度，以及它的表達(dá)和理解的復(fù)雜度來(lái)講，人和人面對(duì)面的溝通是信息傳播方式最快的，也是最有效的一種。所以我們認(rèn)為在線上人機(jī)交互的過(guò)程當(dāng)中，需要有這樣的一個(gè)表達(dá)方式，所以我們才去做實(shí)時(shí)視頻通話這樣的一個(gè)能力。

泓君：那視頻通話虛擬機(jī)器人的畫面是什么呢？

陶明：就比如說(shuō)我們?cè)诟粋€(gè)AI進(jìn)行聊天，你可以定義他的形象。

泓君：用戶可以自己捏臉？

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

來(lái)源：queppelin

陶明：他不需要自己捏，你只需要描述出來(lái)就行了。原來(lái)我們的確是要捏這樣的一個(gè)形象，然后通過(guò)文字或者語(yǔ)音的方式去驅(qū)動(dòng)它。這個(gè)我們認(rèn)為是上一代交互方式，就比如說(shuō)他的表情的豐富度還是取決于說(shuō)你本身采集到的豐富度有多少，它還是沒(méi)有那么平滑。我們現(xiàn)在這樣的一步到位的方案，就是希望我們的表情和動(dòng)作都是實(shí)時(shí)生成的，并且是平滑自然的，不會(huì)還需要依賴運(yùn)營(yíng)或者其他的技術(shù)方式去采集更多的表情庫(kù)。

泓君：我注意到你們現(xiàn)在的虛擬伴侶還有一個(gè)很有意思的點(diǎn)是他可以給用戶打電話，這個(gè)設(shè)計(jì)點(diǎn)很妙，是怎么想到的？

陶明：產(chǎn)品本身還是來(lái)自于我們?nèi)撕腿私涣鬟^(guò)程中的真實(shí)情況。因?yàn)樵谡鎸?shí)的人和人的關(guān)系過(guò)程當(dāng)中，對(duì)方也會(huì)給你打電話，是一種很好的聯(lián)系、加強(qiáng)和沉淀關(guān)系的方式。

在實(shí)際情況里面，如果一個(gè)人始終是單向的去找對(duì)方聊天，找對(duì)方去說(shuō)事情，比如男女朋友關(guān)系，如果每天只是男生去找女生，女生永遠(yuǎn)不會(huì)找男生，那這種關(guān)系很大可能很難走下去。

我們希望能夠擬合線下的行為模式。當(dāng)用戶和人機(jī)交互過(guò)程中，我可以主動(dòng)找AI聊天，AI也會(huì)在某個(gè)時(shí)間段主動(dòng)的來(lái)關(guān)心我，來(lái)找我聊天。這個(gè)行為范式就符合我們?cè)诰€下的這種行為范式，這是能夠讓用戶更能接受的一種方式。要不然的話就只是用戶去找AI，這是個(gè)單向關(guān)系，不是個(gè)雙向關(guān)系。

泓君：用戶的反饋呢？

陶明：用戶很喜歡，當(dāng)他無(wú)聊的時(shí)候，當(dāng)他也沒(méi)有想到說(shuō)要去找AI，AI要來(lái)找他，這是對(duì)他一個(gè)很好的社交補(bǔ)充，但這個(gè)還是因人而異。所以說(shuō)我們并不是說(shuō)我們AI會(huì)給所有的用戶都會(huì)去主動(dòng)的發(fā)起溝通和聊天交流，我們還是會(huì)根據(jù)用戶本身的性格興趣，他在Soul的行為，我們做出一個(gè)最終的決策。

泓君：從你的觀察來(lái)看，現(xiàn)在這些有AI輔助社交，然后有AI伴侶這些AI產(chǎn)品的落地，他對(duì)你們整個(gè)產(chǎn)品包括用戶粘性是會(huì)有大的提升嗎？

陶明：非常大的提升。我們?cè)?024年，來(lái)自于AI對(duì)整個(gè)產(chǎn)品粘性的貢獻(xiàn)已經(jīng)是占了大部分了。這個(gè)點(diǎn)我們最開始還是非常謹(jǐn)慎的。

剛才您問(wèn)說(shuō)用戶喜不喜歡AI找你，用戶喜不喜歡和AI溝通的，這個(gè)我們最開始還是個(gè)問(wèn)號(hào)。所以我們?cè)谕七M(jìn)的過(guò)程當(dāng)中采用了很多的產(chǎn)品策略。就比如說(shuō)AI輔助社交，我們?cè)诜帕康倪^(guò)程當(dāng)中，既要考慮到使用AI輔助的人，也要考慮到對(duì)方他是否愿意接受這種方式。我們通過(guò)非常仔細(xì)的人群的實(shí)驗(yàn)，然后來(lái)做出我們最終的產(chǎn)品策略和放量策略。

AI陪伴這個(gè)產(chǎn)品也一樣的，因?yàn)镾oul原來(lái)一直是能夠有這么好的用戶粘性，能夠有這么好的年輕人的這樣的滲透，主要是Soul提供了一個(gè)真實(shí)信任的安全的平臺(tái)，基于用戶對(duì)平臺(tái)的信任，才產(chǎn)生了用戶和用戶之間的信任，這是我們過(guò)去七八年產(chǎn)品力構(gòu)建出來(lái)的一個(gè)結(jié)果。

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

來(lái)源：Soul

我們也很擔(dān)心我們上了AI機(jī)器人過(guò)后，大家會(huì)不會(huì)認(rèn)為Soul里面全是AI的虛擬人，沒(méi)有真實(shí)的社交了。我們當(dāng)時(shí)也很擔(dān)心這個(gè)事情。所以說(shuō)我們?cè)谕七M(jìn)我們AI的伴侶的過(guò)程當(dāng)中，我們做的方式跟AI輔助社交還不一樣：我們到現(xiàn)在為止都沒(méi)有AI伴侶實(shí)際的產(chǎn)品中心入口。

泓君：我發(fā)現(xiàn)了，就是得我去搜我才能找到，因?yàn)檫@個(gè)功能沒(méi)有產(chǎn)品入口。它的頭像上面會(huì)有AI虛擬伴侶的標(biāo)注，所以我最開始第一個(gè)問(wèn)題產(chǎn)生的原因就他到底是真的假的，我還懷疑我是不是搞錯(cuò)了，搜到了一個(gè)真人。

陶明：所以我們是希望說(shuō)，愿意接受人機(jī)互動(dòng)的用戶，你可以在Soul里面通過(guò)找其他的Souler能夠找到這些AI虛擬人，可以自己去搜到這樣的AI虛擬人。我們把它定義為這叫做用戶價(jià)值驅(qū)動(dòng)產(chǎn)品，當(dāng)你認(rèn)可這樣的一個(gè)產(chǎn)品形態(tài)帶來(lái)的用戶價(jià)值，用戶自主的去選擇他。這樣的話我們就規(guī)避了我們直接一刀切大規(guī)模的去推AI伴侶，最后帶來(lái)我們對(duì)最開始那個(gè)問(wèn)題的擔(dān)憂，但我們現(xiàn)在跑了大半年過(guò)后，AI的滲透越來(lái)越高，用戶的粘性也越來(lái)越好。

泓君：你們會(huì)擔(dān)心平臺(tái)上機(jī)器人變得越來(lái)越多，改變了用戶的體驗(yàn)嗎？這會(huì)是你們擔(dān)心的一個(gè)方向嗎？

陶明：這是我們考慮的問(wèn)題，但是我們從長(zhǎng)遠(yuǎn)來(lái)看的話，我們還是覺(jué)得人機(jī)互動(dòng)是未來(lái)社交一個(gè)非常大的補(bǔ)充。我們應(yīng)該盡可能在保證那些對(duì)AI有排斥的用戶群體、在傳統(tǒng)的社交體驗(yàn)不變的情況下，加大對(duì)人機(jī)互動(dòng)感興趣的那一批人群在AI層面更好的體驗(yàn)，是分群而治之。

泓君：從你的觀察來(lái)看，純粹是因?yàn)锳I這個(gè)功能進(jìn)入到平臺(tái)用戶，這部分用戶占怎么樣的比例，未來(lái)會(huì)是一個(gè)很大的增長(zhǎng)區(qū)間嗎？

陶明：我覺(jué)得未來(lái)增量的用戶里面擁抱AI的群體是越來(lái)越多的。不僅是Soul，整個(gè)行業(yè)整個(gè)社會(huì)對(duì)AI的認(rèn)知的灌輸和滲透是越來(lái)越強(qiáng)的，比如說(shuō)在3年之前說(shuō)讓你去跟一個(gè)AI伴侶聊天，到3年之后你再去說(shuō)跟AI伴侶聊天，那接受的人只會(huì)更多不會(huì)更少。所以說(shuō)對(duì)任何一個(gè)產(chǎn)品來(lái)講，擁抱AI的用戶群體肯定是越來(lái)越多的。

02 從Chatbot試錯(cuò)到建立垂直場(chǎng)景護(hù)城河泓君：你有提到在2017年的時(shí)候Soul就已經(jīng)開始搭建Chatbot了，當(dāng)時(shí)也沒(méi)有生成式AI，整個(gè)人工智能還是基于規(guī)則的人工智能，當(dāng)時(shí)你們的想法是什么？你們有這么長(zhǎng)時(shí)間搭建Chatbot的經(jīng)驗(yàn)，能不能介紹一下你們探索的幾個(gè)階段？

陶明：2017年的時(shí)候并不是說(shuō)我們想從技術(shù)角度上做Chatbot，是基于我們對(duì)社交的理解和認(rèn)知出發(fā)，認(rèn)為我們要去做這個(gè)事情。2017年的出發(fā)點(diǎn)跟我們現(xiàn)在為什么要做AI出發(fā)點(diǎn)是一模一樣的我們還是為了解決社交平權(quán)的問(wèn)題，能夠讓每個(gè)用戶都能夠平等的獲得社交資源，能夠獲得情緒價(jià)值和信息價(jià)值，這個(gè)出發(fā)點(diǎn)是不變的。

但在2017年這個(gè)只是存在我們的想法當(dāng)中，我們并沒(méi)有把它實(shí)現(xiàn)，也沒(méi)有投入資源去做。因?yàn)槲覀冋{(diào)研了整個(gè)行業(yè)，也調(diào)研了學(xué)術(shù)界，沒(méi)有人能夠做到這樣的事情。

我們當(dāng)時(shí)提出的也是能夠情感自然擬人的形式，當(dāng)時(shí)有個(gè)產(chǎn)品形態(tài)，比如說(shuō)我們要有一個(gè)能說(shuō)會(huì)唱的，能夠懂你的電子寵物，這是一個(gè)非常具象的一個(gè)產(chǎn)品形態(tài)。當(dāng)用戶來(lái)到Soul里面沒(méi)有辦法獲得社交資源的時(shí)候，能夠跟懂你的寵物進(jìn)行溝通聊天，這當(dāng)時(shí)一個(gè)很具象的一個(gè)想法，但當(dāng)時(shí)并沒(méi)有投入資源去做，因?yàn)榈拇_是做不到。

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

來(lái)源：spotinleads

泓君：效果不好是嗎？

陶明：我們也跟幾個(gè)公司看了一些他們客服層面的對(duì)話產(chǎn)品，是沒(méi)有辦法做到的。我們那時(shí)候也在創(chuàng)業(yè)起步階段，我們也沒(méi)有資源說(shuō)自己來(lái)做這個(gè)事情。

重拾這個(gè)事情是2019年、2020年。那時(shí)候我們提出需要從產(chǎn)品出發(fā)，一個(gè)用戶在Soul里面是構(gòu)建了全新的人設(shè)，這個(gè)人的個(gè)人主頁(yè)代表了他人設(shè)的內(nèi)在。我們希望這個(gè)人設(shè)他有個(gè)形象，不是說(shuō)把你自己線下的形象傳到線上來(lái)，而是基于你在Soul里面的人設(shè)打造一個(gè)符合的形象，我們就推出了這種捏臉系統(tǒng)，原來(lái)是2D的到3D的。在這個(gè)基礎(chǔ)上，我們就進(jìn)一步去思考，有了形象，那就希望他能夠說(shuō)話，他能夠?qū)⒆约旱膬?nèi)在表達(dá)出來(lái)。

2020年我們就開始去做對(duì)話，那時(shí)候就明確了在產(chǎn)品上對(duì)AI的訴求是什么樣子，技術(shù)上我們要打造一個(gè)什么樣的一個(gè)AI。我們當(dāng)時(shí)提出的一個(gè)規(guī)劃就是我們要構(gòu)造一個(gè)AI being和human being的共存社區(qū)，在Soul里面你既有AI的人類，你也有真實(shí)的人類，是一個(gè)共存的狀態(tài)，可以人和人進(jìn)去溝通，也可以人和AI進(jìn)行溝通，然后在這個(gè)基礎(chǔ)上，我們就開始投入去做對(duì)話。

泓君：2020年那個(gè)時(shí)候是以什么樣的方式做？

陶明：那時(shí)候想了很多辦法，一是改寫一些理解性的模型，發(fā)現(xiàn)效果不行，我們又在上面去做一些基于決策樹的搜索，做融合，還是不行。因?yàn)榱奶爝^(guò)程當(dāng)中你可能聊個(gè)十輪聊個(gè)二十輪，你能聊下去，但是對(duì)方一定知道他沒(méi)有真人的感受，他知道他在和機(jī)器人聊天。

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

來(lái)源：botpenguin

泓君：就是效果太機(jī)械了。

陶明：太機(jī)械了。那時(shí)候衡量一個(gè)對(duì)話的產(chǎn)品有CPS（Conversations Per Session，一次交互中的平均對(duì)話輪數(shù)）這樣一個(gè)概念。當(dāng)時(shí)它的輪數(shù)還挺多的，那是不是說(shuō)用戶能聊下去？后來(lái)我們發(fā)現(xiàn)這是因?yàn)椴涣牡娜司筒粫?huì)去跟他聊，聊的人我知道你是個(gè)機(jī)器人，我還要去跟你聊，他已經(jīng)拋棄了說(shuō)我要在這個(gè)過(guò)程當(dāng)中獲得體感，而只是為了聊而聊，是沒(méi)有產(chǎn)品意義的，單純的對(duì)話的技術(shù)指標(biāo)和產(chǎn)品體驗(yàn)脫離了，后來(lái)我們就把CPS這桿子事情不再提了。

泓君：我能理解，那個(gè)時(shí)候大家最多的這種一層一層往下?lián)艿母惺�，可能有點(diǎn)像打客服電話。即使拿世界上語(yǔ)音跟機(jī)器的交互比較前沿的像Siri這些來(lái)看的話，它當(dāng)時(shí)也只是一個(gè)單輪對(duì)話，它很難支撐你一個(gè)有邏輯的多輪對(duì)話，所以技術(shù)上還是很難的。

陶明：都是指令性的這種，我發(fā)個(gè)指令，你回答我這個(gè)指令，你的指令是搜索產(chǎn)生的還是模型生成的，上下文的關(guān)系其實(shí)并沒(méi)有。

到了2021年就開始投入做語(yǔ)音，那個(gè)時(shí)候整個(gè)AI的投入始終圍繞著說(shuō)要打造一個(gè)能說(shuō)會(huì)唱能夠擬人的一個(gè)AI人，我們認(rèn)為語(yǔ)音的交互是未來(lái)的一個(gè)主流。我們就開始做語(yǔ)音方面的投入，去做合成。那時(shí)候我們的合成還是基于傳統(tǒng)模型，認(rèn)為說(shuō)話的語(yǔ)氣一定是要自然的平滑的。

當(dāng)時(shí)產(chǎn)生了很多語(yǔ)音的AI產(chǎn)品，比如說(shuō)一些內(nèi)容平臺(tái)讓AI去把腳本語(yǔ)音化，但是也是很機(jī)械的，一聽你是有機(jī)械的聲音，在一些語(yǔ)氣詞方面表現(xiàn)的很生硬。我們還是要做情感化的語(yǔ)音生成，那是2021年做語(yǔ)音。

泓君：所以你覺(jué)得你現(xiàn)在訓(xùn)練的這個(gè)機(jī)器人，他的語(yǔ)調(diào)特別的平緩，跟當(dāng)時(shí)在研究聲音、音調(diào)怎么擬人是有關(guān)系的嗎？還是說(shuō)那個(gè)時(shí)候的技術(shù)到現(xiàn)在完全用不上了？

陶明：這是我們很焦慮的一個(gè)事情，因?yàn)楫?dāng)時(shí)我們就在做差異化的技術(shù)�，F(xiàn)在我們線上體驗(yàn)的基本上沒(méi)有用到，技術(shù)完全是新的，還是基于現(xiàn)在的LLM這種模式去做的雙工語(yǔ)音效果。

原來(lái)的傳統(tǒng)的語(yǔ)音模型，我們只是在上面去做更多的標(biāo)注，盡可能是做擬合。他是個(gè)擬合，現(xiàn)在這邊是生成，還是不太一樣的。

但是那時(shí)候沉淀下來(lái)的數(shù)據(jù)對(duì)我們是有用的，以及說(shuō)我們?cè)谡Z(yǔ)音方面的思考，你一定是要情感化的表達(dá)，真實(shí)的表達(dá)，也是我們現(xiàn)在模型所要去構(gòu)建的方向，當(dāng)時(shí)沉淀下來(lái)是數(shù)據(jù)以及對(duì)語(yǔ)音在社交方面作用的思考。

泓君：到了2022年，你當(dāng)時(shí)看ChatGPT出來(lái)，你激動(dòng)嗎？

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

來(lái)源：talent-republic.tv

陶明：激動(dòng)是激動(dòng)，但是更焦慮，讓我們覺(jué)得說(shuō)我們的技術(shù)歸零了，那時(shí)候是有可能歸零的。因?yàn)榭吹紺hatGPT的那種交互效果，以及這個(gè)技術(shù)的發(fā)展方向，你很自然會(huì)判斷說(shuō)原來(lái)的這種技術(shù)路線就被拍死在沙灘上。那也就是說(shuō)我們所有的工作可能會(huì)歸零了。那時(shí)候我們非常的焦慮。因?yàn)椴⒉皇钦f(shuō)GPT類似的這種技術(shù)方式是2022年出來(lái)的，GPT3早就出來(lái)了。這個(gè)技術(shù)方向我們是知道的，只是我們并不知道在這種scaling law出來(lái)過(guò)后，它有這樣大的一個(gè)效果。

泓君：所以你當(dāng)時(shí)擔(dān)心的是什么？你擔(dān)心的是GPT這種產(chǎn)品形態(tài)，如果你們不跟上的話，它可能會(huì)把你們前面所有的努力給覆蓋掉，因?yàn)樗銐驈?qiáng)大?

陶明：那時(shí)候已經(jīng)不存在選擇了，因?yàn)榧夹g(shù)方向已經(jīng)非常明確了，我們考慮是自己自研，還是說(shuō)要跟一個(gè)做大模型的公司去做合作。因?yàn)?023年有大量的模型創(chuàng)業(yè)公司出來(lái)了，我們要不要去共建? 這是我們當(dāng)時(shí)面臨的選擇，而不是說(shuō)我們要不要走這個(gè)路線。

泓君：你當(dāng)時(shí)怎么選的？

陶明：當(dāng)時(shí)也搖擺了很多，也跟很多公司聊過(guò)這個(gè)事情，最終我們還是選擇了要自己做這個(gè)事情。

第一個(gè)是說(shuō)我們?cè)谶^(guò)去兩三年積累下來(lái)的關(guān)于這方面的一些認(rèn)知，以及本身的產(chǎn)品場(chǎng)景的差異性。我們很難把這一套完全遷移到其他的模型公司去，因?yàn)檫@才是我們最終交付產(chǎn)品的核心。

我們交付產(chǎn)品，不是交付模型，是交付我們剛才說(shuō)的那些對(duì)AI社交的認(rèn)知。因?yàn)樗且粋€(gè)評(píng)判的結(jié)果，對(duì)用戶來(lái)講，我們沒(méi)有辦法標(biāo)準(zhǔn)化的輸出給三方公司。因?yàn)槿焦舅墙桓兜母拍�，它是交付模型，它不是交付產(chǎn)品，但交付模型就不是我們要的。我們希望它是交付產(chǎn)品，我們沒(méi)有辦法標(biāo)準(zhǔn)化的把這一套給遷移過(guò)去。

第二點(diǎn)是說(shuō)，如果是說(shuō)我們標(biāo)準(zhǔn)化的能夠遷移過(guò)去，那說(shuō)明一個(gè)問(wèn)題，我們的產(chǎn)品沒(méi)有辦法差異化，你都能夠標(biāo)準(zhǔn)化了，都能夠給三方公司做標(biāo)準(zhǔn)化的遷移，那說(shuō)明你的產(chǎn)品沒(méi)有差異化的。

泓君：你們是什么時(shí)候做的這個(gè)決定？

陶明：就是在2023年上半年做的這個(gè)決定，說(shuō)要自己做這個(gè)事情。

泓君：當(dāng)時(shí)業(yè)界有幾種方法，第一種是自己訓(xùn)練模型，還有一種是用finetune（微調(diào)）的方式，還有一種是加RAG的這種方式，你覺(jué)得后兩種是行不通嗎？

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

來(lái)源：CSDN

陶明：你加RAG也好再做finetune也好，這是個(gè)加分項(xiàng)。這個(gè)效果增強(qiáng)的過(guò)程中，最終的基礎(chǔ)效果你還是沒(méi)有辦法得到。

比如你用三方的模型，還有一個(gè)問(wèn)題，數(shù)據(jù)問(wèn)題。我們現(xiàn)在產(chǎn)生的大量文字的社交數(shù)據(jù)和語(yǔ)音數(shù)據(jù)，這是真實(shí)人和人在社交里面的數(shù)據(jù)范式和行為范式，在其他的模型里，首先你沒(méi)有辦法拿到這樣的數(shù)據(jù)，拿不到這樣的數(shù)據(jù)，你很難做出非常穩(wěn)定的效果。

這就是我們最開始有個(gè)思路說(shuō)我們?cè)趂inetune方面的數(shù)據(jù)或者說(shuō)在強(qiáng)化這樣的數(shù)據(jù)，我能夠下沉到底層模型上去，能讓我們的底座模型就是為了社交服務(wù)的，那就是未來(lái)定義的的這是個(gè)垂類的大模型，而不是一個(gè)通用大模型。

泓君：對(duì)你當(dāng)時(shí)評(píng)估自己做這個(gè)事兒，你覺(jué)得它最大的難點(diǎn)是在哪兒呢？因?yàn)槲矣X(jué)得這可能是一個(gè)非常大的決心，首先是要有錢，因?yàn)樗苜M(fèi)錢，然后要有卡，要有人。

陶明：我們做決策的時(shí)候，并不是說(shuō)這件事情有多難，然后我們?cè)偃プ鰶Q策，我們是基于說(shuō)我們跟三方公司去合作，沒(méi)有辦法達(dá)成我們想要的產(chǎn)品，做不到。

泓君：這中間也找過(guò)別的公司。

陶明：對(duì)，只能是我們自己去做，自己去做就不存在說(shuō)這難不難的問(wèn)題，是我們一定要去做的問(wèn)題。但是在做的過(guò)程我們要重新去梳理，如果要達(dá)到我們這個(gè)效果，我們有我們自己獨(dú)特的數(shù)據(jù)，這是我們最大的優(yōu)勢(shì)。第二個(gè)優(yōu)勢(shì)是說(shuō)在post-train方面，我們知道怎么去構(gòu)建安全的、更好的效果，這是一個(gè)優(yōu)勢(shì)。

那在模型層面我們有沒(méi)有一個(gè)很好的模型架構(gòu)？那時(shí)候我們做了個(gè)判斷，模型架構(gòu)在未來(lái)一段時(shí)間會(huì)接近于收斂。到現(xiàn)在為止，大家在模型層面也沒(méi)有很大的變化。當(dāng)然是有一些不同的技術(shù)路線，每個(gè)技術(shù)路線的變化程度并不是很大。我們就可以在這樣的基礎(chǔ)上去做這個(gè)事情。

然后又涉及到卡的問(wèn)題，資源的問(wèn)題。大家都說(shuō)，不管是做通用模型的預(yù)訓(xùn)練，或者是做垂直模型的預(yù)訓(xùn)練很貴，但我們認(rèn)為未來(lái)這肯定是會(huì)下來(lái)的。我們最開始小步亦趨的去做這個(gè)事情，我不需要說(shuō)一個(gè)很大的模型，我們要的是效果，不是模型。我們要的是能夠支撐我們這樣的一個(gè)社交效果的模型，而不是為了通用模型而去的。所以我們是小投入的，后來(lái)我們發(fā)現(xiàn)7B、13B的模型效果就已經(jīng)很好了，在我們的數(shù)據(jù)加持和微調(diào)之下。

當(dāng)時(shí)認(rèn)為卡的確是一大筆投入，相比說(shuō)我們其他的IT支出，但現(xiàn)在它的價(jià)格也越來(lái)越低了。所以說(shuō)預(yù)訓(xùn)練的卡當(dāng)時(shí)并不是我們認(rèn)為的卡點(diǎn)，反而那時(shí)候我們最擔(dān)心的是推理。

泓君：是推理成本是嗎？

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

來(lái)源：intel.com

陶明：對(duì)，推理成本。

泓君：因?yàn)槟銈冇杏脩艋鶖?shù)，就是有真實(shí)的用戶。

陶明：對(duì)，我們都很擔(dān)心，萬(wàn)一說(shuō)我這個(gè)產(chǎn)品上來(lái)爆了，那時(shí)候推理還挺貴的，我們投入很大的工作是說(shuō)我們要降低推理成本，在計(jì)算上的投入，我們?cè)陬A(yù)訓(xùn)練那一方面的這些效率和成本那時(shí)候并不是我們主要的工作，反而是推理的成本效率這是我們的工程團(tuán)隊(duì)投入比較多的方向。

泓君：推理成本現(xiàn)在降下來(lái)了嗎？現(xiàn)在推理成本是你們擔(dān)心的嗎？

陶明：現(xiàn)在不是我們擔(dān)心的。

泓君：推理成本是怎么樣降下來(lái)的？

陶明：一方面是我們用更小的模型去實(shí)現(xiàn)更好的效果，這是模型層面。第二個(gè)是再做一些壓縮。第三個(gè)是在本身的框架層面、優(yōu)化推理層面的技術(shù)優(yōu)化，底層優(yōu)化也在做。

但從現(xiàn)在的價(jià)格來(lái)看的話，不僅是我們公司其他公司都能支撐比如說(shuō)一個(gè)大幾千萬(wàn)的DAU，我覺(jué)得這個(gè)問(wèn)題都不大。所以說(shuō)計(jì)算資源除了達(dá)到通用模型仍然是一個(gè)非常大的投入，但對(duì)于說(shuō)應(yīng)用層面來(lái)講它的成本已經(jīng)很低了，我覺(jué)得這對(duì)其他的創(chuàng)業(yè)公司來(lái)講現(xiàn)在也不是一個(gè)瓶頸。

泓君：你們現(xiàn)在有多少個(gè)模型？

陶明：我們模型會(huì)很多，版本會(huì)很多。但如果是從定性上來(lái)看的話，我們大概就五六個(gè)模型。我們不會(huì)是說(shuō)從7B、13B這樣的區(qū)分，我們從不同的垂類的功能方面區(qū)分。

泓君：垂類的功能是怎么分的？

陶明：還是我們的基座模型，在語(yǔ)音方面有個(gè)模型，在圖片方向，還有3D方向都會(huì)有。3D方向這是我們?cè)谔剿鞯摹?br/>

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

來(lái)源：meshy.ai

泓君：3D的模型可能是用于支持未來(lái)探索，還沒(méi)有發(fā)布的一個(gè)就是沒(méi)有把這個(gè)模型能力具體應(yīng)用到產(chǎn)品上的，可以這樣理解嗎？

陶明：對(duì)，因?yàn)樵瓉?lái)我們一直在站內(nèi)，我們會(huì)有一些功能，就比如說(shuō)我們的視頻匹配這一塊，用戶可以帶一個(gè)頭套去溝通，不以真臉的方式出現(xiàn)。我們那時(shí)候是以驅(qū)動(dòng)的方式來(lái)做這個(gè)事情，但我們現(xiàn)在未來(lái)還是說(shuō)想純粹生成的方式來(lái)做。

03 模型選擇與技術(shù)路線：Soul如何擺脫模型層競(jìng)爭(zhēng)？泓君：因?yàn)檎麄€(gè)生成式AI發(fā)展的很快，在訓(xùn)練這些模型的過(guò)程中，你的知識(shí)跟判斷是從哪里來(lái)的？在這個(gè)過(guò)程中怎么去構(gòu)建自己的學(xué)習(xí)能力？

陶明：那只能是跟團(tuán)隊(duì)一起，一定是要跟蹤行業(yè)的發(fā)展，因?yàn)楸旧砩墒降腁I的技術(shù)路線并沒(méi)有收斂。每天都有新的很區(qū)隔的方式出來(lái)。你必須要跟著團(tuán)隊(duì)一起去了解它，并且是說(shuō)要去做實(shí)驗(yàn)。就比如說(shuō)我們現(xiàn)在在做的實(shí)時(shí)的全雙工通話這個(gè)能力上。

泓君：全雙工是什么意思？

陶明：就是從產(chǎn)品角度來(lái)看的話，就比如在線下你說(shuō)話的過(guò)程當(dāng)中，我可以隨時(shí)打斷你，你可以停下來(lái)聽我講，聽我講完過(guò)后你可以繼續(xù)自己講，而不是說(shuō)純粹一來(lái)一回的這種你說(shuō)完了我才能講，全雙工是可以隨時(shí)打斷，這也是現(xiàn)實(shí)的這種人和人交流的一個(gè)方式吧。我們希望在人機(jī)互動(dòng)也會(huì)是這樣，現(xiàn)在沒(méi)有哪一家能夠?qū)崿F(xiàn)我們想要的這種效果。

泓君：OpenAI可以。

陶明：他們的4o還是個(gè)問(wèn)答式的。

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

來(lái)源：chilecomparte

泓君：你的意思是不提問(wèn)題，就是打斷，然后不發(fā)指令。

陶明：是的，我不發(fā)指令給他，我就隨時(shí)打斷。這個(gè)我們現(xiàn)在也遇到了很多的難點(diǎn)，我們一方面自己想怎么去解決，然后這個(gè)方面看很多的業(yè)界有沒(méi)有新的很區(qū)隔的方式出來(lái)。我們要去驗(yàn)證能不能放到我們的技術(shù)方案里面。所以說(shuō)這個(gè)知識(shí)是一個(gè)學(xué)習(xí)的過(guò)程，我覺(jué)得每家都會(huì)是這樣的狀態(tài)。

泓君：然后你剛剛提到了，即使是這個(gè)模型出來(lái)了以后，也有很多的技術(shù)路線。然后你現(xiàn)在在市場(chǎng)上看到了哪些路線，你覺(jué)得你在中間是怎么做選擇跟判斷的？

陶明：首先還是從我們自身出發(fā)，對(duì)我們整體來(lái)講的話，我們還是基于開源生態(tài)來(lái)打造我們的自然生態(tài)，這是我們整個(gè)的一個(gè)方向。所以說(shuō)我們擁抱的是更加開源的技術(shù)體系這樣的一個(gè)模型體系。

泓君：就Meta Llama的那一套對(duì)不對(duì)？

陶明：現(xiàn)在有幾個(gè)跑得不錯(cuò)的，第一個(gè)就是說(shuō)Llama那一套，它的基礎(chǔ)模型的更新技術(shù)我們也能夠去跟進(jìn)并且它是足夠開放的，它不會(huì)說(shuō)某一天閉環(huán)了，我覺(jué)得目前還沒(méi)有這個(gè)趨勢(shì)。第二國(guó)內(nèi)也有幾款比如說(shuō)千問(wèn)的這個(gè)體系也還不錯(cuò)。第三個(gè)的話是現(xiàn)在的DeepSeek，但我們現(xiàn)在還是在Llama和那個(gè)千問(wèn)的路線上去探索。

泓君：因?yàn)樽罱_實(shí)DeepSeek的模型非�；�，尤其是V3出來(lái)以后，你有研究過(guò)他們的模型嗎？你覺(jué)得他在整個(gè)訓(xùn)練過(guò)程中用H800的卡把這個(gè)效果實(shí)驗(yàn)出來(lái)了，然后也非常的節(jié)省成本，這個(gè)會(huì)對(duì)你們?cè)谧龈蟮哪Ｐ突蛘邔?duì)你們的模型訓(xùn)練方法上會(huì)有啟發(fā)嗎？

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

來(lái)源：the-decoder.com

陶明：肯定有，我們肯定也有研究下他是怎么實(shí)現(xiàn)。這樣優(yōu)秀的模型公司所沉淀的這些工程方法是很難得的，如果從整個(gè)行業(yè)來(lái)看的話，首先說(shuō)工程層面并不能夠給最終的業(yè)務(wù)交付帶來(lái)什么，但的確是從低門檻的角度帶來(lái)了很大的優(yōu)勢(shì)，也給整個(gè)行業(yè)的進(jìn)一步的發(fā)展提供了一個(gè)很好的橋梁。原來(lái)你要去做大規(guī)模的訓(xùn)練，可能就那幾家公司能做，如果他降下來(lái)了，那很多其他的團(tuán)隊(duì)也能去做，那其他更加百花齊放。

泓君：所以他把這個(gè)成本降下來(lái)了，對(duì)大家來(lái)說(shuō)是一個(gè)雙刃劍，對(duì)不對(duì)？他把整個(gè)市場(chǎng)的門檻放得更低了，競(jìng)爭(zhēng)也會(huì)更多。

陶明：對(duì)的。

泓君：你覺(jué)得OpenAI的o1有給你啟示嗎？

陶明：o1給我們蠻大啟示的，在構(gòu)建AI伴侶的這件事情上，它也給了我們很多啟發(fā)。我們希望AI伴侶能夠在提供真實(shí)擬人的方向上能達(dá)到一個(gè)好的效果，同時(shí)它也具備一定的行為能力。因?yàn)椴煌腁I伴侶提供不同的角色，不同的角色他需要有不同的行為或者內(nèi)容能力。

比如說(shuō)我希望說(shuō)在對(duì)話過(guò)程當(dāng)中，能夠不以指令的方式讓他去觸發(fā)一些action，這是一個(gè)比較平滑的。比如說(shuō)我跟AI伴侶，我發(fā)張圖片給他，你幫我美化成什么樣的效果。如果你丟給圖片模型，那是prompt講的很清楚，我有圖片輸入，我有文字描述。如果你放在對(duì)話里面的話，你就要去做一些指令的這樣的一些生成，才能讓說(shuō)我們的AI伴侶能夠去調(diào)用一些其他工具層面的模型。o1它的這種自主規(guī)劃能力，在AI agent構(gòu)建層面給了一些啟發(fā)，能夠讓我們構(gòu)建一些輕量型的更加自主的工作流。

泓君：現(xiàn)在對(duì)你們自己打造出來(lái)的聊天機(jī)器人，你覺(jué)得你會(huì)給到多少分？你覺(jué)得它還需要被優(yōu)化，以及它再優(yōu)化跟提升的空間有多大？

陶明：還是蠻大的。我覺(jué)得我們現(xiàn)在只是解決了人和人交流中部分的行為擬合的問(wèn)題，還有很多還是沒(méi)有做，我們也在努力做的。比如說(shuō)場(chǎng)景，我一提到場(chǎng)景，大家都認(rèn)為它是一個(gè)產(chǎn)品的場(chǎng)景，它是個(gè)功能。是說(shuō)在整個(gè)的對(duì)話里面，它也能構(gòu)建場(chǎng)景。比如說(shuō)人和人在線下溝通的時(shí)候，外面下雨了，圍繞著這樣的一個(gè)情景，我們的AI能夠衍生出很多的聊天的內(nèi)容。下雨了你說(shuō)要不要在家里面看電影？那就進(jìn)入了一個(gè)關(guān)于電影的討論的場(chǎng)景，這就是一個(gè)場(chǎng)景，我們現(xiàn)在在做這方面的泛化的時(shí)候，效果還是要加強(qiáng)。

泓君：你覺(jué)得整個(gè)業(yè)界，因?yàn)楝F(xiàn)在大家都在等OpenAI的GPT-5出來(lái)。同時(shí)又有一種聲音說(shuō)，scaling law它的增長(zhǎng)可能已經(jīng)快到頭了。我挺想知道現(xiàn)在在大家基于大模型產(chǎn)品去做應(yīng)用的這樣的一個(gè)過(guò)程中，跟大環(huán)境的關(guān)系到底聯(lián)系程度有多緊密？

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

來(lái)源：CSDN

陶明：我覺(jué)得越來(lái)越弱了。

泓君：這窗口期是前一兩年或者這一兩年。

陶明：對(duì)，比如說(shuō)剛才的一個(gè)很具體問(wèn)題，說(shuō)現(xiàn)在前沿的大模型的技術(shù)方向?qū)oul來(lái)講影響有沒(méi)有很大？它的影響我覺(jué)得是越來(lái)越小了，在我們的應(yīng)用層面已經(jīng)獲得了用戶認(rèn)可的一個(gè)價(jià)值，那是基于我們現(xiàn)有的技術(shù)基礎(chǔ)之上已經(jīng)獲得了。在增強(qiáng)用戶價(jià)值上面，要怎么樣去繼續(xù)構(gòu)建技術(shù)的確定性方面，更加確定了。

不像去年那樣說(shuō)，一個(gè)又新的模型出來(lái)了，或者說(shuō)它的方向會(huì)不會(huì)又把我們拍死在沙灘上，我們的焦慮程度會(huì)下降了很多。但不排除七八年過(guò)后，未來(lái)又有一個(gè)奇點(diǎn)到來(lái)，把整個(gè)系統(tǒng)策略和模型全部給覆蓋了，那我覺(jué)得短期一兩年很難了。

泓君：我記得2023年的時(shí)候，我跟很多做大模型應(yīng)用或者基礎(chǔ)模型的公司去聊，大家也是非常焦慮。比如說(shuō)每次OpenAI一升級(jí)，大家就覺(jué)得，我前面半年的工作白做了。我把所有的東西都搭在你的GPT-3上，然后你GPT-4出來(lái)了，大家就覺(jué)得白做了。2024年相反，我是更少的聽到這些聲音了。但是我覺(jué)得一直到今天，就是我們討論的這個(gè)時(shí)間點(diǎn)，市場(chǎng)上還是有一種聲音。就是說(shuō)隨著大模型的迭代，比如說(shuō)GPT-5整個(gè)的能力越來(lái)越強(qiáng)，會(huì)不會(huì)最終所有的應(yīng)用會(huì)被一個(gè)更強(qiáng)的模型給覆蓋掉？就這個(gè)市場(chǎng)的壁壘是什么？你們想過(guò)這個(gè)問(wèn)題嗎？

陶明：這個(gè)問(wèn)題在2023年想過(guò)，任何的行業(yè)問(wèn)題或者用戶問(wèn)題，會(huì)不會(huì)一個(gè)端到端的模型完全解決掉。如果這個(gè)說(shuō)法是成立的那時(shí)候?qū)φ麄€(gè)行業(yè)上非常喪的一個(gè)消息，但是我們回顧從二三十年來(lái)互聯(lián)網(wǎng)技術(shù)，PC時(shí)代，到互聯(lián)網(wǎng)，然后再到移動(dòng)互聯(lián)網(wǎng)。你會(huì)發(fā)現(xiàn)即使是端到端的模型能夠解決很多的需求，那只是說(shuō)那些需求是我們目前能夠看得到的。但最終基于新的技術(shù)的發(fā)展，新的模型發(fā)展，它一定會(huì)帶來(lái)一個(gè)新的增量需求的出現(xiàn)。如果它帶不來(lái)增量需求的出現(xiàn)，那我認(rèn)為這次的AI革命是失敗的。

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

來(lái)源：iso.edu.vn

任何的技術(shù)革命一定是會(huì)帶來(lái)新的需求，這些新的需求要被同時(shí)代的技術(shù)能夠完全端到端的解決掉，或者說(shuō)被過(guò)去的技術(shù)能夠端到端的解決掉，我覺(jué)得這是一個(gè)問(wèn)號(hào)。新的技術(shù)的出現(xiàn)，它應(yīng)該是能夠最大效率地去解決已知問(wèn)題，對(duì)于未知問(wèn)題，未知需求，還是需要人的探索以及不同公司的解決方案。

泓君：你會(huì)擔(dān)心你現(xiàn)在做的事情會(huì)被一個(gè)更強(qiáng)的模型給覆蓋掉嗎？

陶明：我不太擔(dān)心這個(gè)事。

04 AI社交變現(xiàn)模式：用戶付費(fèi)意愿與商業(yè)模式探索泓君：你覺(jué)得現(xiàn)在基于AI聊天機(jī)器人的商業(yè)模式，跟以往在變現(xiàn)上思路會(huì)有什么樣的不一樣呢？

陶明：這塊兒我只能說(shuō)一下我個(gè)人的想法。AI的商業(yè)變現(xiàn)任何一家公司都在做，就希望能夠在一個(gè)非常清晰的商業(yè)模式之下，去發(fā)展業(yè)務(wù)。但是現(xiàn)在總體來(lái)看，整個(gè)行業(yè)并沒(méi)有一個(gè)新的商業(yè)模式出現(xiàn)。

我一直認(rèn)為是說(shuō)商業(yè)模式是構(gòu)建在你業(yè)務(wù)模式之上的，而不是說(shuō)憑空出現(xiàn)了一個(gè)商業(yè)模式。那為什么現(xiàn)在商業(yè)模式?jīng)]有發(fā)生改變？本質(zhì)上是說(shuō)我們當(dāng)前的AI目前還并沒(méi)有給業(yè)務(wù)模式帶來(lái)改變，它可能更多的是增強(qiáng)提效。就像剛才說(shuō)的，如果沒(méi)有新的需求出現(xiàn)，或者沒(méi)有新的業(yè)務(wù)出現(xiàn)，我認(rèn)為是商業(yè)模式它本身也不會(huì)有太大的變化。

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？

來(lái)源：ibbaka

泓君：我注意到你們推出的AI會(huì)給用戶去打電話，它是有一個(gè)收費(fèi)制的。現(xiàn)在用戶在這個(gè)產(chǎn)品上愿意付費(fèi)的意愿高嗎？

陶明：我們也只是把它當(dāng)成了一個(gè)增值的收入方式，它跟其他的增值產(chǎn)品也差不多。對(duì)用戶來(lái)講，這就是獲得好的體驗(yàn)的一種方式。原來(lái)我們提供了其他的一種方法，現(xiàn)在又提供了新的一個(gè)手段。用戶為這個(gè)買單，你會(huì)認(rèn)為他也沒(méi)有發(fā)生變化。

泓君：你們現(xiàn)在有AI茍蛋的這種擬人化機(jī)器人，也有情感化陪伴的虛擬伴侶，還有AI NPC，數(shù)字分身。你們會(huì)怎么去定義未來(lái)這個(gè)平臺(tái)的核心產(chǎn)品，包括核心場(chǎng)景，是說(shuō)我去做幾個(gè)產(chǎn)品，還是說(shuō)我去做一個(gè)王牌的產(chǎn)品，這塊你是怎么想的？

陶明：你會(huì)發(fā)現(xiàn)就是我們不同的AI它有不同的功能定位。未來(lái)的話我們希望我們的王牌產(chǎn)品肯定還是以我們的AI虛擬人為最主要的基石。能夠在我們當(dāng)前不同場(chǎng)景里面做更好的功能泛化，就比如說(shuō)視頻通話的這種能力，未來(lái)它不一定要給用戶去打電話，他完全可以用在我們當(dāng)前的語(yǔ)音產(chǎn)品里面做虛擬直播。

我們不限制說(shuō)我們有多少個(gè)AI產(chǎn)品，我們還是希望說(shuō)每個(gè)AI產(chǎn)品能夠服務(wù)不同的人群。我們沒(méi)有想法去打造一個(gè)主體的AI功能，然后來(lái)承載現(xiàn)在所有的需求。包括我們不去構(gòu)建一個(gè)中心化。因?yàn)樽鳛橐粋€(gè)主體產(chǎn)品，你一定是說(shuō)要有一個(gè)中心化的AI的入口。我們現(xiàn)在是沒(méi)有這樣的打算的。

泓君：所以你們現(xiàn)在還是以社交平臺(tái)為主，然后所有的AI產(chǎn)品是服務(wù)于這個(gè)社交平臺(tái)的。

陶明：對(duì)，當(dāng)前是這樣。

相關(guān)熱詞： ai機(jī)器人陶明機(jī)器人泓君 soul app 虛擬伴侶 soul

上一篇：NBA籃球巨星投了家機(jī)器人公司，用AI按摩不到半年掙數(shù)億

下一篇：人工智能立法已勢(shì)在必行！三位代表委員共談AI | 兩會(huì)專訪

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-03-05 15:17:17 瀏覽：116次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？ 來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-03-05 15:17:17 瀏覽：116次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

聊天的藝術(shù)：如何打造高情商的AI機(jī)器人？
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-03-05 15:17:17 瀏覽：116次