過去一年,大模型產(chǎn)品百花齊放,都開始卷價(jià)格和應(yīng)用,對(duì)用戶來說當(dāng)然是好事。但就實(shí)際上手來說,這些產(chǎn)品的表現(xiàn)怎么樣?這篇文章,我們來看看作者的分析。
The world is changing,it’s time we change too.
2024年是AI應(yīng)用元年,從2023年ChatGpt爆火到國(guó)內(nèi)百模大戰(zhàn),到現(xiàn)在AI技術(shù)應(yīng)用在C端、B端百花齊放,新一代互聯(lián)網(wǎng)商業(yè)模式MaaS(Model as a Service模型即服務(wù))應(yīng)運(yùn)而生。
盡管AI應(yīng)用很新潮,過去我們積累的用戶體驗(yàn)設(shè)計(jì)經(jīng)驗(yàn)也未必不管用。過去一年,我們看到了很多基于大語言模型的產(chǎn)品百花齊放,我想聊聊我的觀察。
一、找到切入點(diǎn)
AI產(chǎn)品很多,功能很復(fù)雜,我們需要找到一個(gè)切入點(diǎn),我想從黑箱理論說起。
蘋果公司的黑箱理論:用戶不需要了解系統(tǒng)或功能背后的實(shí)現(xiàn)邏輯,只需要關(guān)注呈現(xiàn)在用戶眼前的交互界面即可。
很有意思的是,大語言模型從技術(shù)上來說本身就存在黑盒特性,這些模型的內(nèi)部工作機(jī)制常常對(duì)我們而言就是一個(gè)“黑盒”。雖然這些模型的代碼、參數(shù)和訓(xùn)練方法是公開透明的,但我們?nèi)匀浑y以追蹤和理解它們?nèi)绾螐奶囟ǖ妮斎肷商囟ǖ妮敵觥?br/>
這種復(fù)雜性源自于模型內(nèi)部多層次的非線性數(shù)據(jù)處理和海量參數(shù)的復(fù)雜交互,使得追溯和理解其決策路徑成為一項(xiàng)巨大挑戰(zhàn)。
就像人類決策是由復(fù)雜的情感、多重動(dòng)機(jī)和豐富的個(gè)人經(jīng)驗(yàn)交織而成的。AI模型同樣如此,盡管我們了解它們的基礎(chǔ)架構(gòu)(類似于人類的基因)和訓(xùn)練過程(類似于人類的教育和經(jīng)歷),但模型如何綜合這些因素以做出特定響應(yīng)仍是復(fù)雜且難以預(yù)測(cè)的。
基于此,從黑盒理論和用戶的角度出發(fā),大語言平臺(tái)本質(zhì)上可以看成三個(gè)模塊,輸入模塊-分析模塊-輸出模塊,由此我們就有了相對(duì)直觀的觀察角度。
二、輸入模塊
輸入通俗地講叫向大語言模型提出“問題”,比較專業(yè)的說法叫“提示”或“指令”,也有一個(gè)專門的工程類別叫“提示工程”;是將信息輸入到大模型中的必要前提。
很多時(shí)候一個(gè)好提示將決定結(jié)果的輸出質(zhì)量,并且一個(gè)問題經(jīng)常是需要多次迭代才能生成最終的結(jié)果,用戶的真實(shí)想法往往和實(shí)際意圖之間差了好遠(yuǎn)。
吳恩達(dá)在《給每個(gè)人的大語言模型課》中說:“我不認(rèn)為有一個(gè)適合每個(gè)人的完美提示,用戶選擇輸入有一個(gè)從“想法”到“提示工程”到“模型回復(fù)”的過程,更有用的是有一個(gè)流程,當(dāng)我自己在使用大模型時(shí),經(jīng)常會(huì)嘗試和迭代,比如如果我不喜歡結(jié)果,我可能會(huì)澄清,如果仍沒有給我想要的確切結(jié)果,我可能會(huì)進(jìn)一步進(jìn)行澄清和迭代!
在輸入模塊,提升用戶體驗(yàn)的核心點(diǎn)就在于如何更高效地幫助用戶從一個(gè)想法,不斷優(yōu)化提示,使其更快速地接近所需答案的過程。
國(guó)內(nèi)外生成式AI技術(shù)平臺(tái)為此做了很多的努力。輸入本身是有成本的,我根據(jù)用戶痛點(diǎn),對(duì)大語言模型平臺(tái)的核心功能點(diǎn)進(jìn)行了梳理。
降低輸入成本
OK,小朋友們,讓我們回到小時(shí)候的語文課堂,當(dāng)我們?cè)诿枋鲆患虑榈臅r(shí)候,通常會(huì)遵循5W1H原則,即什么人在什么時(shí)間點(diǎn)在哪里做了什么事情,是如何做的,為什么做。
同樣的,在向大語言模型輸入提示的時(shí)候,我們依然可以遵循這樣的原則。
但往往,可能是因?yàn)樵谡鎸?shí)的社交場(chǎng)景中,人與人在互相交流前就已經(jīng)事先共享了一部分信息,在描述事情的時(shí)候也不需要那么全面。
大語言模型盡管由海量的數(shù)據(jù)訓(xùn)練出來,但面對(duì)單個(gè)用戶時(shí),雙方其實(shí)并沒有事先共享信息。所以幫助用戶降低輸入成本就比較重要。下面是部分解決辦法:
主動(dòng)理解意圖
當(dāng)面對(duì)交談的對(duì)象語無倫次,東一榔頭西一棒槌地描述的時(shí)候,我們會(huì)反問:“你想說的是不是這個(gè)…意思?”。
在輸入模塊,平臺(tái)幫助用戶做的也是這么一件事情:你想表達(dá)的東西,我?guī)湍惚磉_(dá)一部分,你看看是不是這個(gè)意思。下面我會(huì)舉例:
ChatGpt的對(duì)話框下提供了多個(gè)用戶常見的場(chǎng)景,創(chuàng)建圖片|給我驚喜|總結(jié)文本|分析輸入|分析圖片|幫我寫等。點(diǎn)擊之后推薦對(duì)應(yīng)場(chǎng)景的聯(lián)想問題來幫助完善提問。
用戶選擇代替用戶輸入
豆包和文心一言甚至更貼心地把常用技能模塊細(xì)分到更加具體的使用場(chǎng)景,進(jìn)一步明確用戶的目標(biāo),事先提供對(duì)應(yīng)場(chǎng)景的功能,并且提供對(duì)話模版,用戶只需要在對(duì)應(yīng)窗格中填充文字即可。
Copliot在界面上提供各式各樣的主題卡片,教育用戶如何提問。
Kimi在輸入關(guān)鍵詞時(shí)向用戶推薦更加全面的相關(guān)的提示詞參考,提前理解用戶意圖。并且在后續(xù)的生成結(jié)果中,繼續(xù)提供用戶可能會(huì)提問的問題來引導(dǎo)用戶。
增加輸入?yún)⒖?br/>
當(dāng)有些信息無法用簡(jiǎn)短的語言描述時(shí),比如圖片、文檔、網(wǎng)頁,最簡(jiǎn)單直接的辦法就是直接上傳上去,作為輸入的附加參考。
用戶只需說:“參考這個(gè)內(nèi)容幫我做XXXX事情”,這些附件內(nèi)容會(huì)和文本信息會(huì)一起送進(jìn)大模型黑盒里去。如今上傳文件,上傳圖片,聯(lián)網(wǎng)搜索,語音輸入已經(jīng)成為了生成式AI平臺(tái)的標(biāo)配功能。
自定義智能體
除此之外,盡管大模型很通用,在對(duì)話時(shí),對(duì)于特定領(lǐng)域的業(yè)務(wù),還是需要針對(duì)不同的屬性進(jìn)行定制化,讓大語言模型先有一個(gè)明確的自我定位;比如是一個(gè)數(shù)據(jù)分析專家,或是健身教練,也可能是多角色的集合體AIAGent。
ChatGpt的探索模塊支持使用并創(chuàng)建自己的智能體,針對(duì)特定的使用場(chǎng)景:提高效率|體驗(yàn)交流|價(jià)值創(chuàng)造提供多種多樣的自定義版本的智能體。
Kimi+針對(duì)辦公提效|輔助寫作|社交娛樂|生活實(shí)用的特定場(chǎng)景提供各種各樣的智能體。同樣類似的還有文心一言、360AI、通義千問等。
而豆包比較有趣,在網(wǎng)頁端,還比較正經(jīng),推薦了一些跟提效創(chuàng)作有關(guān)的智能體。
而到了手機(jī)端,豆包自己本身變成了一個(gè)幾乎和其他智能體權(quán)重平等的應(yīng)用,發(fā)現(xiàn)頁中推薦了各種各樣的情緒體驗(yàn)型智能體,主打和各種各樣的明星和數(shù)字人聊天、打電話、談戀愛、玩游戲,獲得陪伴體驗(yàn)。
在集體AI平臺(tái)都在卷AI硬知識(shí)技能時(shí),豆包選擇了將AI和娛樂掛鉤起來,讓AI產(chǎn)品變得有趣,在年輕人的荷爾蒙中發(fā)酵,這是互聯(lián)網(wǎng)流量思維的玩法。
三、分析模塊
在分析模塊,當(dāng)前主流大模型盡管在語言理解和文本生成上表現(xiàn)優(yōu)異,但仍然在一些方面體驗(yàn)不佳:大模型回復(fù)等待時(shí)間長(zhǎng);不允許打斷、插話;存在幻覺等。我將從這三點(diǎn)聊聊體驗(yàn)設(shè)計(jì)在其中的應(yīng)用。
減少等待焦慮
在過去的加載頁面等待研究中,我們有這樣的共識(shí):用戶等待頁面加成功時(shí)的耐心程度一般在2-3秒范圍內(nèi),GooGle研究顯示,大約53%的移動(dòng)設(shè)備用戶會(huì)在加載超過3秒時(shí)離開,每增加1秒延遲,用戶轉(zhuǎn)化率可能下降7%或更多,過長(zhǎng)的等待時(shí)間會(huì)讓用戶感到不耐煩。
耐心時(shí)間范圍
0-2秒:最佳用戶體驗(yàn),加載速度快的頁面會(huì)顯著提升用戶滿意度。
3-5秒:用戶的注意力開始下降。如果加載時(shí)間超過這一范圍,可能會(huì)導(dǎo)致用戶放棄。
6秒以上:用戶放棄的可能性顯著增加。研究顯示,大約53%的移動(dòng)設(shè)備用戶會(huì)在頁面加載超過3秒時(shí)離開。
因此,過去如果系統(tǒng)加載慢,用戶體驗(yàn)師會(huì)設(shè)計(jì)加載動(dòng)畫或進(jìn)度條,優(yōu)先加載關(guān)鍵內(nèi)容等方式來延長(zhǎng)用戶耐心,生成式AI平臺(tái)也通過類似的方法來提升用戶體驗(yàn)。
ChatGPT通過逐步每次都將生成的部分內(nèi)容展示出來,使用戶可以邊閱讀部分邊生成來延長(zhǎng)用戶的忍耐程度。如果你在python中調(diào)用過大模型的API的話,大模型只會(huì)在生成所有文本后返回結(jié)果。你會(huì)發(fā)現(xiàn)大模型在生成長(zhǎng)文本的時(shí)間其實(shí)還蠻長(zhǎng)的。
通義千問和秘塔搜索通過展示加載分段式進(jìn)度條來告知用戶任務(wù)完成程度,降低時(shí)間感知,避免不確定等待。進(jìn)度條的存在也能顯示系統(tǒng)正在正常工作,增強(qiáng)用戶對(duì)平臺(tái)的信任。
Gemin通過logo動(dòng)畫,更加自然的淡入淡出刷新文字的加載動(dòng)畫,來進(jìn)一步體現(xiàn)所搭載的大語言模型性能
提供打斷工具
不允許打斷插話這一點(diǎn)當(dāng)前業(yè)內(nèi)普遍做法都是提供停止輸出工具,功能大多也大同小異。
不過最新的ChatGpt提供的畫布模式,支持了對(duì)分析結(jié)果的具體內(nèi)容進(jìn)行進(jìn)一步地編輯,引導(dǎo)用戶進(jìn)一步細(xì)化結(jié)果。
強(qiáng)化安全意識(shí)
由于大模型的黑箱特性,盡管RAG等數(shù)據(jù)投喂技術(shù)在一定程度上減少了大模型的幻覺,但當(dāng)前業(yè)界最好的大模型推理一致性在97%左右,幻覺度約3%,距離ToB/ToH領(lǐng)域的規(guī)模應(yīng)用,如網(wǎng)絡(luò)規(guī)劃、儀表和電器精準(zhǔn)控制尚有差距。故AI生成能力本身的可信任度依然是需要擔(dān)憂的事情。為此,在用戶體驗(yàn)層面,設(shè)計(jì)的核心點(diǎn)在于增加大模型生成結(jié)果的客觀性。
降低信任預(yù)期
大模型需要告訴用戶生成的內(nèi)容僅具有參考性,也可能會(huì)犯錯(cuò),通常會(huì)在界面對(duì)話框底部強(qiáng)調(diào)。
增加生成內(nèi)容客觀性
通過RAG、LanGChain等技術(shù)與搜索引擎結(jié)合,從多個(gè)來源提取關(guān)鍵信息,實(shí)時(shí)檢索和驗(yàn)證,生成綜合性的回答,減少“幻覺”現(xiàn)象,提升答案的準(zhǔn)確性和可信度。
四、輸出模塊
在輸出模塊,我想聊聊大模型的記憶、反饋、多模態(tài)輸出的體驗(yàn)設(shè)計(jì)。
記憶
如果用python調(diào)用過大模型的API的話,我們會(huì)意識(shí)到大模型本身是沒有記憶的。但是在與用戶的對(duì)話中,平臺(tái)會(huì)將當(dāng)前會(huì)話的上下文信息作為輸入模型的一部分,利用注意力機(jī)制處理這些信息,從而生成與上下文相關(guān)的響應(yīng),使得模型能夠在單詞對(duì)話中保持對(duì)近期信息的記憶,從而提供連貫的回答。
然而,大模型的上下文窗口長(zhǎng)度是有限的,通常在數(shù)千個(gè)標(biāo)記(toKens)范圍內(nèi)。這意味著當(dāng)對(duì)話長(zhǎng)度超過上下文窗口的容量時(shí),早期的信息可能會(huì)被遺忘或忽略。技術(shù)層面研究人員為此提出了多種方法來增強(qiáng)模型的記憶能力。比如循環(huán)記憶、引入外部存儲(chǔ)機(jī)制等,但仍然存在一定的局限性。
于是我觀察到了針對(duì)這一場(chǎng)景的體驗(yàn)設(shè)計(jì):
ChatGpt提供了歸檔功能,通過歸檔功能,ChatGpt可以記住用戶在之前對(duì)話中的偏好、習(xí)慣或重要信息(如興趣愛好、工作方向),從而更接近用戶的需求。
Kimi/通義千問/文心一言則通過設(shè)置常用語功能來應(yīng)對(duì)可能出現(xiàn)短期記憶突然失效的情況。
反饋
說了這么多,生成式AI平臺(tái)的核心競(jìng)爭(zhēng)力說到底依然是大模型本身的推理能力,如今的大模型依然容易繼承和放大訓(xùn)練數(shù)據(jù)中存在的偏差,AI大模型難以避免會(huì)寫出看似合理但不正確或荒謬的答案。大模型開發(fā)過程中很重要的環(huán)節(jié)是數(shù)據(jù)標(biāo)注,會(huì)耗費(fèi)大量的人力物力,ChatGpt的問世離不開背后大量工程師對(duì)模型數(shù)據(jù)微調(diào)校正標(biāo)注的努力。
同時(shí),AI平臺(tái)的模型能力的增強(qiáng)也需要用戶的反饋,通過每天用戶海量的生成結(jié)果,從反饋給平臺(tái)以進(jìn)一步優(yōu)化模型推理能力。越強(qiáng)推理能力的大模型平臺(tái)擁有越多的用戶,越多的用戶越增強(qiáng)大模型推理平臺(tái)的能力。
而這個(gè)反饋入口就在輸出結(jié)果的下方,用戶可以點(diǎn)擊喜歡/不喜歡進(jìn)行問題反饋,幾乎所有的AI平臺(tái)都有這個(gè)看似不起眼,但非常重要的功能。
多模態(tài)輸出
盡管可能我們認(rèn)知里的大語言模型平臺(tái)更多是專注于文本類型輸出,我觀察到國(guó)內(nèi)外很多的大模型平臺(tái)都在往多模態(tài)生態(tài)方向打造,大語言模型正在和文生圖、數(shù)字人、機(jī)器人、文生視頻、內(nèi)容理解、文本處理、社區(qū)等功能融合。背后的邏輯比較復(fù)雜,我將在下一個(gè)模塊再聊。
總結(jié)
AI的發(fā)展雖然很快,但也是經(jīng)歷了漫長(zhǎng)的過程,再偉大的創(chuàng)新,也會(huì)基于人們過往經(jīng)驗(yàn)的總結(jié)。技術(shù)再強(qiáng)大,也是服務(wù)于人的,AI應(yīng)用的風(fēng)在互聯(lián)網(wǎng)上吹了一陣又一陣,但殺手級(jí)的AI應(yīng)用到目前為止仍未出現(xiàn);場(chǎng)景不夠匹配,AI的局限性依然是擋在AI應(yīng)用路上的大山。
作為一個(gè)從業(yè)4年的交互設(shè)計(jì)師,我的心情無比復(fù)雜,不知道多少人和我一樣,眼看著所謂的大機(jī)遇就在眼前,但自己卻無力乘風(fēng),內(nèi)心無比焦慮。外面都在說AI將顛覆整個(gè)互聯(lián)網(wǎng),又說所有的互聯(lián)網(wǎng)產(chǎn)品都可以用AI重做一遍,擔(dān)心自己的飯碗不保,擔(dān)心自己跟不上時(shí)代的浪潮。但要我說,人們?cè)诿鎸?duì)未知時(shí)總是會(huì)放大恐懼,這些都不必過分擔(dān)心。
丘吉爾有一句話:如果你到了地獄,那就繼續(xù)保持前行。
讓我們繼續(xù)前行吧,朋友!
本文由 @為美好而設(shè)計(jì) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)