展會信息港展會大全

追一科技 CEO 吳悅:大模型落地,場景、成本及效果,缺一不可
來源:互聯(lián)網(wǎng)   發(fā)布日期:2023-11-28   瀏覽:984次  

導(dǎo)讀:“下一個發(fā)展趨勢應(yīng)該是NLP對話。”2016年吳悅從騰訊離開時如是說,而這也成為了他離職后創(chuàng)業(yè)的首選方向。 2006年,從中科大碩士畢業(yè)后的吳悅便加入了騰訊。2006年到2011年,在騰訊主要做存儲系統(tǒng)研發(fā)方面,2011年到2016年專攻搜索技術(shù)。 對于為 ......

追一科技 CEO 吳悅:大模型落地,場景、成本及效果,缺一不可

“下一個發(fā)展趨勢應(yīng)該是NLP對話!2016年吳悅從騰訊離開時如是說,而這也成為了他離職后創(chuàng)業(yè)的首選方向。

2006年,從中科大碩士畢業(yè)后的吳悅便加入了騰訊。2006年到2011年,在騰訊主要做存儲系統(tǒng)研發(fā)方面,2011年到2016年專攻搜索技術(shù)。

對于為何一開始聚焦在NLP領(lǐng)域進(jìn)行創(chuàng)業(yè)。追一科技創(chuàng)始人兼CEO吳悅解釋道:“在騰訊既做過基礎(chǔ)架構(gòu),又做過搜索推薦,當(dāng)時我們就覺得NLP技術(shù)的商業(yè)價值非常大。搜索方面,孵化出了Google、百度等大公司,其實這些公司都屬于 NLP 時代比較典型的搜索應(yīng)用。推薦方面,孵化出了頭條等,在這個基礎(chǔ)上,我們判定下一個方向應(yīng)該是NLP對話。”

就這樣,創(chuàng)辦追一科技之后,吳悅便主攻NLP和深度學(xué)習(xí)方向,并相繼推出對話與分析AI應(yīng)用平臺及AIForce數(shù)字員工產(chǎn)品族。其中,AIForce數(shù)字員工產(chǎn)品族就是處理營銷、服務(wù)、運(yùn)營等場景任務(wù)的智能機(jī)器人,也是追一的主要產(chǎn)品矩陣,其包括智能在線機(jī)器人Bot、智能語音機(jī)器人Call、智能助理機(jī)器人Pal、多模態(tài)數(shù)字人Face等。

在當(dāng)時來看,這一系列產(chǎn)品的研發(fā)并非一件易事。所以自成立之初,追一就特別注重新技術(shù)的應(yīng)用,對此,吳悅也特別強(qiáng)調(diào)道,2017年 Transformer 架構(gòu),以及2018年提出的Bert架構(gòu),我們都做了相關(guān)研究。比如圍繞 Transformer 提出了 RoPE旋轉(zhuǎn)位置編碼技術(shù)。被Google、Meta、阿里、百川智能等國內(nèi)外大模型廠商廣泛采用。

當(dāng)談到2022年底爆火的生成式大模型時,吳悅深刻地感知到了原有的技術(shù)架構(gòu)已不能順應(yīng)市場的變化,以及客戶的需求,所以在今年年初,追一科技便嘗試在大模型技術(shù)的基礎(chǔ)上做研究,推出了博文領(lǐng)域大模型,并基于大模型的能力,對現(xiàn)有的軟件產(chǎn)品進(jìn)行重塑。

在大模型熱潮中,追一沒有選擇通用大模型賽道,而是選擇了領(lǐng)域大模型。究其原因,吳悅告訴AI科技評論,大模型的演進(jìn)方向主要有兩個分支:

一是沿著通用大模型的方向發(fā)展,需要不斷打開大模型能力的天花板。比如 OpenAI 或者國內(nèi)的一些大模型廠商是沿著這個方向發(fā)展的。

另一個分支是,圍繞企業(yè)具體的業(yè)務(wù)場景的需求,定制化一個企業(yè)大模型。追一科技在今年年初推出的博文領(lǐng)域大模型屬于第二個分支,就是面向企業(yè)的具體業(yè)務(wù),比如營銷、客服等場景,為企業(yè)定制一個專有大模型。

但是從目前來看,無論是通用模型還是領(lǐng)域模型,其挑戰(zhàn)都非常大。通用大模型的難度主要是規(guī);碾y度,包括參數(shù)量上規(guī)模、數(shù)據(jù)上規(guī)模和算力上規(guī)模帶來的難度。而領(lǐng)域模型考驗的則是直擊客戶業(yè)務(wù)痛點以及洞察客戶需求的能力,但是由于業(yè)務(wù)整個鏈條比較長,所以這是一個非常大的挑戰(zhàn)。

對此,吳悅表示認(rèn)同,同時他也表示,大模型競賽比拼的是綜合實力,從客戶的角度出發(fā),他們在關(guān)注技術(shù)變化的同時,也會關(guān)注安全合規(guī)、成本等因素。而企業(yè)想要在這場科技革命中殺出重圍,則需要具備核心技術(shù)能力,產(chǎn)品化的能力,專業(yè)服務(wù)的能力,各種業(yè)務(wù)咨詢的能力。

“從技術(shù)角度看,大模型確實是一個比較重要的變量,但它不是唯一的變量!眳菒傃a(bǔ)充道。

以下是AI科技評論和吳悅的對話:

混沌之時,GPT掀起AI新范式

AI科技評論:為什么選擇從騰訊出來,自己創(chuàng)業(yè)?

吳悅:2006年,從中科大碩士畢業(yè)后就進(jìn)入了騰訊。2006年到2011年,在騰訊主要做存儲系統(tǒng)研發(fā)方面,2011年到2016年專攻搜索技術(shù)。

2016年選擇出來創(chuàng)業(yè),主要因為既做過基礎(chǔ)架構(gòu),又做過搜索推薦等,當(dāng)時我們就覺得NLP技術(shù)的商業(yè)價值非常大。搜索的話孵化出了Google、百度這樣的大公司,其實這些公司都屬于 NLP 時代比較典型的搜索應(yīng)用。推薦的話,孵化出了頭條等,在這個基礎(chǔ)上,我們就判定下一個方向應(yīng)該是對話,所以2016年出來創(chuàng)業(yè)時就做了對話機(jī)器人,主攻NLP方向。

AI科技評論:從NLP到深度學(xué)習(xí)再到大模型,您怎么看待三者的關(guān)系?

吳悅:有些概念需要重新厘定一下,NLP 屬于自然語言處理,它是人工智能三大方向之一,也是最難的方向。深度學(xué)習(xí)是神經(jīng)網(wǎng)絡(luò),屬于人工智能的一個方法論。人工智能最早解決的是視覺、語音和 NLP 的問題。

大模型是沿著神經(jīng)網(wǎng)絡(luò)這個方向不斷發(fā)展的,2012年2013年是深度學(xué)習(xí)的一個突破,2016 年 AlphaGo 出來,是強(qiáng)化學(xué)習(xí)的突破,2022 年底到2023 年,包括 ChatGPT 其實屬于生成式大模型的突破,這些其實都屬于神經(jīng)網(wǎng)絡(luò)的一個技術(shù)分支的不斷發(fā)展的過程。

AI科技評論:在不同的技術(shù)節(jié)點,追一都做了什么?

吳悅:從公司成立到今天,有三個比較重要的時間節(jié)點。

第一個時間節(jié)點:2016 年創(chuàng)業(yè)時,我們把深度學(xué)習(xí)技術(shù)應(yīng)用到對話機(jī)器人。因為之前的對話機(jī)器人大多是通過搜索或者一些規(guī)則的方式實現(xiàn)。當(dāng)時我們就是先于其他公司,率先把深度學(xué)習(xí)技術(shù)應(yīng)用到對話機(jī)器人中。這是第一個里程碑。

第二個時間節(jié)點:2017年提出的transformer架構(gòu),2018年提出的Bert架構(gòu),這些都屬于大模型技術(shù)爆發(fā)前夜的階段,當(dāng)時我們就圍繞transformer、Bert的架構(gòu),做了相關(guān)研究。比如圍繞transformer 提出了 RoPE旋轉(zhuǎn)位置編碼技術(shù)。當(dāng)時被Google、Meta、阿里、百川智能等國內(nèi)外大模型廠商廣泛采用。這是我們原創(chuàng)式的創(chuàng)新,也是作為一家AI創(chuàng)業(yè)公司為生成式大模型做得一個小貢獻(xiàn)。當(dāng)然在這個階段,圍繞Bert我們也研發(fā)出了ZOne大模型。

第三個時間節(jié)點:2022年年底GPT爆發(fā)后,我們推出了博文領(lǐng)域大模型,專注服務(wù)和營銷領(lǐng)域。我們圍繞四個理念打造博文領(lǐng)域大模型:貼合業(yè)務(wù)、合規(guī)可控、更具溫度、普惠實用。

追一科技 CEO 吳悅:大模型落地,場景、成本及效果,缺一不可

AI科技評論:ZOne模型和現(xiàn)在的模型概念有什么不同?

吳悅:ZOne主要是基于Bert路徑,其屬于表征式大模型的分支。其實大模型本質(zhì)上是模型參數(shù)很大,基本上都是 10 億起步,沿著這個方向衍生出了兩個方向,一個是表征式大模型,典型的就是Bert。另一個就是生成式大模型,典型的就是Open AI的GPT路徑。

AI科技評論:從早期的技術(shù),到現(xiàn)在的GPT,中間在技術(shù)的選擇上有什么挑戰(zhàn)嗎?

吳悅:2018年,這個時間節(jié)點其實是有點混沌的,當(dāng)時就面臨著到底是沿著表征式的方向走,還是生成式的方向走?其實都是不明確的,當(dāng)時大家也都在探索階段。直到2022年年底,2023年年初ChatGPT出來之后,大家感知到可能生成式更具有發(fā)展?jié)摿,所以這個階段大家都選擇全面擁抱生成式大模型。當(dāng)然表征式大模型在真正商業(yè)化落地過程中還是非常有作用的,所以這個方向我們也在延續(xù)做。

開源&閉源之爭,開放式服務(wù)越來越多

AI科技評論:追一很早就開始做大模型研究了,當(dāng)時主要是怎么考慮的?

吳悅:我們在確定做之前,背后是有一個邏輯支撐的。大模型出現(xiàn)后,它的應(yīng)用方向或者它的發(fā)展方向,是有兩個分支的。一是沿著通用大模型的方向發(fā)展,面向的是一些通用型的需求,比如終端用戶的需求,這個過程需要不斷打開大模型能力的天花板。典型的比如 OpenAI 或者國內(nèi)的一些大模型廠商是沿著這個方向發(fā)展的。

另一個分支是,我們認(rèn)為是圍繞企業(yè)的需求,或者圍繞著企業(yè)業(yè)務(wù)的具體場景的需求,定制化一個企業(yè)大模型。所以我們在今年年初推出的博文領(lǐng)域大模型屬于第二個分支,也就是我們選擇面向企業(yè)的具體業(yè)務(wù),比如客服、營銷等場景,為企業(yè)定制一個垂直領(lǐng)域大模型。

AI科技評論:所以可以理解為追一走的領(lǐng)域模型的路徑,自研還是基于開源做微調(diào)?

吳悅:博文領(lǐng)域大模型的研發(fā)也是階段性的。我們現(xiàn)在的方向是兩條路并行走,因為我們的出發(fā)點是構(gòu)建一個一體化的可落地的大模型。

從落地的角度來看,有兩個選擇,一是圍繞著開源模型,在上面做知識注入,能力增強(qiáng)等。另外一個邏輯就是從底層向上構(gòu)建一個一體化的大模型。

從當(dāng)前階段來看,第一個階段落地會更快一些,第二個階段要慢一些,因為完全自研,會涉及到投入,風(fēng)險等問題,所以我們還是比較謹(jǐn)慎地看待這件事兒。(更多關(guān)于大模型行業(yè)的相關(guān)話題,歡迎添加微信 ericahss1224,互相交流,互通有無)

AI科技評論:在選擇開源模型時,是并行都在用還是選一家?

吳悅:我們是并行都在用,重點在于知識注入層面,能力強(qiáng)化層面,需要做比較多專業(yè)性的工作。這樣才能夠把大模型的能力充分挖掘出來。

AI科技評論:您認(rèn)為開源會不會成為主流模式?或者大部分企業(yè)其實更期待更多開源大模型的出現(xiàn)?

吳悅:我覺得沿著企業(yè)級方向,可能會越來越開放,沿著通用人工方向,可能還是會堅持閉源。

現(xiàn)在大家都在說開源模型,我覺得下一步的方向不僅僅是開源模型越來越多,可能會有更多開放式的服務(wù)出現(xiàn),比如數(shù)據(jù)開源、算法開源、甚至很多基層框架都是可以開源的。

AI科技評論:通過半年多的實踐,您認(rèn)為做大模型的難點是什么?

吳悅:從客戶的角度出發(fā),以我們自身為例,我們服務(wù)的是中大型客戶,這類企業(yè)往往會有兩方面的考量:一是技術(shù)層面,二是業(yè)務(wù)層面。

從技術(shù)層面來看,中大型企業(yè)對大模型技術(shù)和產(chǎn)品的要求往往是非常嚴(yán)格的。比如安全方面,他們希望整體的數(shù)據(jù)是安全的,整體的對外提供的服務(wù)是合規(guī)的,另外還要保證大模型的輸入輸出是完全可控的。

從業(yè)務(wù)層面來看,真正要把大模型技術(shù)在客戶的業(yè)務(wù)場景中做落地的話,其實是需要構(gòu)建一個閉環(huán)的,他們要求的不僅是技術(shù)的能力,還包括如何把技術(shù)產(chǎn)品化,產(chǎn)品化完之后還需要做實施交付,這也會涉及到后續(xù)持續(xù)維護(hù)等專業(yè)服務(wù),最重要的是,還要足夠了解業(yè)務(wù)的需求,以及需求的洞察能力,這些能力其實都是非常重要的。(更多關(guān)于大模型行業(yè)的相關(guān)話題,歡迎添加微信 ericahss1224,互相交流,互通有無)

大模型落地,場景、成本及效果,缺一不可

AI科技評論:基于大模型的能力,追一的產(chǎn)品已經(jīng)實現(xiàn)重塑了嗎?

吳悅:正在逐步完成重塑中,要想全面落地到客戶業(yè)務(wù)場景中去使用,明年年初能實現(xiàn)。我們現(xiàn)有的6款機(jī)器人產(chǎn)品已經(jīng)是非常成熟的商業(yè)化產(chǎn)品,從2016年到現(xiàn)在已經(jīng)服務(wù)了幾百家頭部客戶,現(xiàn)在我們在嘗試把大模型的能力融入到這6款產(chǎn)品中,貼合客戶業(yè)務(wù)去做產(chǎn)品重塑,或者通過洞察客戶業(yè)務(wù)的方式,通過大模型解決過去的產(chǎn)品沒有解決的問題。

追一科技 CEO 吳悅:大模型落地,場景、成本及效果,缺一不可

AI科技評論:從今年年初就開始做,為什么明年才能全面落地?

吳悅:要給客戶做逐步推進(jìn),因為把大模型的能力加進(jìn)來,大模型本身是有幻覺、黑盒或者一些其他不可控的表現(xiàn),那就需要我們通過訓(xùn)練,自己做一個領(lǐng)域的強(qiáng)模型,幫客戶避免這樣的問題。

對于客戶來說,過去的產(chǎn)品已經(jīng)和他們的業(yè)務(wù)系統(tǒng),做了比較深的綁定,一個大客戶,每天的訪問量能達(dá)到幾百萬甚至上千萬,在大模型這個大的技術(shù)變革面前,他們是非常謹(jǐn)慎的。對于他們來說,業(yè)務(wù)的穩(wěn)定是第一位的。所以還需要一個逐步灰度引入或者遷移的過程。

對于我們來說,首先我們要把頂層設(shè)計考慮清楚。就是到底應(yīng)該怎么植入大模型,短、中、長期的規(guī)劃是什么樣的?時間計劃是什么樣的?規(guī)劃性的工作其實我們已經(jīng)做了大半年,基本做完了,接下來就是落地到客戶業(yè)務(wù)場景中開展使用的工作。

AI科技評論:雖然落地難,但說服客戶的成本是不是比以前低了?畢竟大家都知道大模型是能解決一些問題的。

吳悅:在這個過程中,我們說服客戶是要分幾個階段的。第一個階段,是讓感興趣的人愿意跟你聊這個話題。ChatGPT爆火,經(jīng)過一些科普,我覺得只要是有大模型想法的客戶,他就愿意跟你聊。所以第一階段算是破冰了。

但是跟客戶進(jìn)一步聊的時候,他會問你的這套產(chǎn)品到底能給我?guī)硎裁矗拷Y(jié)合我的業(yè)務(wù),到底能夠幫我解決什么問題?和我現(xiàn)有的 AI 系統(tǒng)相比,到底能夠帶來多大收益?需要增加多少成本?這個問題我覺得是比較核心和關(guān)鍵的,所以這也是我們剛剛講的點,就我們要去做調(diào)研,要做技術(shù)邊界的定義,要做合理的計劃,現(xiàn)在大多是在這個階段。

AI科技評論:您怎么理解重塑?重塑是不是意味著要替換掉原來的底層架構(gòu)?

吳悅:大模型是一項新技術(shù),確實能夠解決一些之前的技術(shù)所不能解決的問題。比如一句話多意圖的問題,但是我們要進(jìn)行大模型落地的話,其實也會引入一些新的問題,比如幻覺問題,可控生成問題,成本問題等,這些都是我們需要重點考慮的。好比電動車的技術(shù)雖然好,但大家都還會有里程的焦慮。

對于生成式大模型來說,我們覺得有兩個焦慮,一是幻覺的焦慮,二是算力(成本)的焦慮。在這個技術(shù)體系里面,其實我們需要根據(jù)對客戶需求的理解,以及對整個技術(shù)的設(shè)計選擇合適的路徑,看哪些問題適合用傳統(tǒng)系統(tǒng)解決。哪一些適合用生成式大模型解決。

我們針對客戶普遍關(guān)注的大模型的成本問題,提出了“增程”技術(shù)理念,具體來說,就是通過大小模型協(xié)同,共同支持客戶需求,通過一個“增程器”組件,根據(jù)用戶或者實際處理任務(wù)的不同,來做動態(tài)配置和組合,讓大模型出現(xiàn)在最應(yīng)該出現(xiàn)的地方,提升模型效果的同時,實現(xiàn)了性價比最大化。

追一科技 CEO 吳悅:大模型落地,場景、成本及效果,缺一不可

AI科技評論:那對于客戶關(guān)心的問題,怎么解決?畢竟還是逃不掉快速落地的問題?

吳悅:第一,比較重要的是要解決本地化部署的問題,所以博文領(lǐng)域大模型是要做本地化部署的,類似公有云和私有云的區(qū)別。

第二,解決成本的問題,因為我們開發(fā)的產(chǎn)品,在一些中大型企業(yè)中已經(jīng)有了比較廣泛和深入的應(yīng)用。就像前面所說,如果全面換成大模型的訪問,規(guī)模可能會從之前的上百萬到上千萬,成本是非常高的。

第三,到底能給客戶帶來多大的收益?這就需要對企業(yè)的業(yè)務(wù)有比較深入的洞察,能挖掘到業(yè)務(wù)的痛點,然后再提出一個既可以本地化部署,又成本可控的解決方案。這是我們發(fā)現(xiàn)或者所看到的一些點。

AI科技評論:在落地過程中,有沒有自己的一套方法論?

吳悅:首先,之前的產(chǎn)品其實是廣泛解決客戶的問題,但在落地過程中,我們也發(fā)現(xiàn)這些產(chǎn)品和技術(shù)是存在一些短板。這些問題是不是就可以通過大模型解決?這是我們做大模型落地的一個重要抓手,因為我們知道大模型的能力邊界。

然后,我們已經(jīng)有了這樣的產(chǎn)品落地,所以跟客戶,特別是頭部客戶形成了一個很好的聯(lián)動。在這個過程中,結(jié)合追一對大模型的理解和認(rèn)知,加上和頭部客戶共同挖掘,哪些是之前我們沒做到過的,沒有提供過的服務(wù),這時,我們會重點看能不能通過大模型能不能延展到一些新的場景,這是目前我們做大模型落地的方法。

跨越大模型發(fā)展平緩期,靠的是深入業(yè)務(wù)

AI科技評論:現(xiàn)在大模型進(jìn)入到平緩期,您怎么看?

吳悅:大模型現(xiàn)在有兩個發(fā)展方向,一是通用大模型,沿著通用的需求,沿著通用 AI 的方向發(fā)展;二是圍繞著具體的應(yīng)用場景出發(fā),比如圍繞企業(yè)某個場景做AI應(yīng)用落地。目前,大模型技術(shù)確實已經(jīng)到了應(yīng)用階段。所以大家都在關(guān)注怎么把這個技術(shù)去做落地了。

AI科技評論:現(xiàn)在國內(nèi)做大模型的企業(yè)有三類:通用模型,領(lǐng)域模型,AI創(chuàng)新應(yīng)用,您認(rèn)為三者的難度分別體現(xiàn)在哪些方面?

吳悅:首先,三者難度是不一樣的。通用大模型是規(guī);系碾y度,包括參數(shù)量上規(guī)模、數(shù)據(jù)上規(guī)模和算力上規(guī)模帶來的難度。

應(yīng)用層,如果是簡單的AI創(chuàng)新應(yīng)用,那么應(yīng)用層相對獨立,基于通用大模型,也足以滿足。如果是復(fù)雜的AI創(chuàng)新應(yīng)用,例如追一在做的服務(wù)和營銷領(lǐng)域的軟件產(chǎn)品,那么領(lǐng)域模型和應(yīng)用層是很難分割的,他們之間是捆綁的迭代節(jié)奏,難度在于深入到客戶的具體業(yè)務(wù),深入了解具體場景和需求點,反推出大模型的能力需求,大模型的能力項和應(yīng)用層產(chǎn)品功能一一對應(yīng)。大模型的迭代帶來產(chǎn)品的功能的不斷豐富。

AI科技評論:如何提高競爭力,保持優(yōu)勢?

吳悅:競爭是一個綜合方面的考量。從客戶的角度看,其實客戶關(guān)注的是技術(shù)如何落地,以及他們考慮的安全、合規(guī)、可控等等,當(dāng)然也包括成本因素,有些客戶可能也會關(guān)注,你能不能做好產(chǎn)品化的落地,提供相應(yīng)的專業(yè)服務(wù),然后和他們做業(yè)務(wù)的共創(chuàng),所以客戶是全面的考量。

從企業(yè)的角度看,我們認(rèn)為做好一個企業(yè),需要具備核心技術(shù)能力,產(chǎn)品化的能力,專業(yè)服務(wù)的能力,各種業(yè)務(wù)咨詢的能力。目前,從技術(shù)角度看,大模型確實是一個比較重要的變量,但它不是唯一的變量。

(本站(公眾號:本站)本站本站)

本站原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

贊助本站

相關(guān)熱詞:

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港