“不要期待有了AI之后就能一劍封喉!
來(lái)源|多知
作者|徐晶晶
興奮。
未知。
這是高途聯(lián)合創(chuàng)始人羅斌面對(duì)當(dāng)下DeepSeek引發(fā)的這一輪AI技術(shù)浪潮時(shí)的心境。
興奮,是因?yàn)榭吹靡姷拇_定性,“拉長(zhǎng)周期來(lái)看,DeepSeek帶來(lái)了巨大的變量,創(chuàng)造了新的可能性!
不過(guò),這份確定性又是模糊的、未知的!按笾路较蚴悄芸吹靡姷模钦麄(gè)路徑、節(jié)奏是模糊的、非共識(shí)的,這其中存在很大的不確定性和未知性。這也意味著,一種壓力!
2月12日,高途正式宣布接入DeepSeek大模型,不過(guò),其對(duì)DeepSeek的關(guān)注要比后者大范圍步入公眾視野更早。
高途透露了接入DeepSeek后帶來(lái)的一些顯著變化:
比如,內(nèi)部協(xié)同工具AI助手在接入后,截至目前,日訪問(wèn)量提升了200%,預(yù)計(jì)在2月中旬完成內(nèi)部業(yè)務(wù)系統(tǒng)和協(xié)作平臺(tái)全面打通之后,訪問(wèn)量將會(huì)進(jìn)一步增加。
再比如,在用戶產(chǎn)品側(cè),以DeepSeek為技術(shù)核心的高中數(shù)學(xué)測(cè)評(píng)準(zhǔn)確率提升了15%,而后高中AI選科規(guī)劃服務(wù)也借由AI助力實(shí)現(xiàn)了服務(wù)質(zhì)量提高。
在高途官宣接入的當(dāng)天,多知就DeepSeek相關(guān)話題對(duì)話了高途聯(lián)合創(chuàng)始人羅斌。
羅斌嚴(yán)謹(jǐn)?shù)亟o出了一些判斷和預(yù)期:
1.DeepSeek-R1大模型的準(zhǔn)確率已達(dá)到在教育場(chǎng)景相對(duì)可用的狀態(tài)。
2.今天的大模型還處在整個(gè)AI能力進(jìn)化的相對(duì)早期階段,如果成熟狀態(tài)是100分,那么今天的這些大模型最好的狀態(tài)也就是5-10分的水平,離終態(tài)還很遙遠(yuǎn)。
3.在基座模型不斷迭代時(shí),對(duì)每家公司來(lái)說(shuō),更重要的是要找到一種機(jī)制,以便在大廠的基座模型快速迭代的過(guò)程中,能及時(shí)跟上這一波變化,并在每次變化的過(guò)程中,能及時(shí)把新的能力結(jié)合進(jìn)來(lái),為自己所用。
4.回到教育這個(gè)場(chǎng)景,至少在我們現(xiàn)在能看見的一個(gè)周期內(nèi),AI能力本身是一個(gè)關(guān)鍵要素,但不是一個(gè)決定性的要素。不要期待有了AI之后就能一劍封喉。
5.如果有了更強(qiáng)大的大模型能力,過(guò)去拍搜的這種模式就會(huì)發(fā)生變化,就不需要提前去生產(chǎn)積累自己的題庫(kù),現(xiàn)在是一種實(shí)時(shí)解答的方式,通過(guò)大模型就能夠達(dá)到一個(gè)非常高的準(zhǔn)確率了。
6.教育AI的iPhone時(shí)刻一定會(huì)發(fā)生,但時(shí)間、形式不確定。教育公司要想在應(yīng)用AI層面改變格局,至少需要3-5年的周期。
7.眾多學(xué)習(xí)環(huán)節(jié)里,AI能替代的,其一,是一個(gè)相對(duì)簡(jiǎn)單的學(xué)習(xí)任務(wù)。其二,AI更適合于學(xué)生主動(dòng)來(lái)發(fā)起、AI來(lái)接聽響應(yīng)的場(chǎng)景。而需要由我們來(lái)主動(dòng)地管理和影響學(xué)生的這個(gè)部分,今天的AI還做不到。
8.小型的創(chuàng)業(yè)公司,在某些單點(diǎn)上、在某些形態(tài)的產(chǎn)品上,有可能獲得一波特殊的機(jī)會(huì)。但是如果回到重交付、端到端、以學(xué)習(xí)結(jié)果為導(dǎo)向的領(lǐng)域里,這里的機(jī)會(huì)對(duì)于創(chuàng)業(yè)公司而言,挑戰(zhàn)還是非常大的。
01
DeepSeek-R1大模型的準(zhǔn)確率已達(dá)到“在教育場(chǎng)景相對(duì)可用的狀態(tài)”
多知:DeepSeek將如何影響教育行業(yè)未來(lái)的發(fā)展?會(huì)帶來(lái)哪些顛覆性的改變?
羅斌:第一個(gè)變化,DeepSeek這波算是完成了一次比較好的市場(chǎng)教育,提升了大眾對(duì)于AI能力的關(guān)注度,也讓普通用戶使用AI工具的滲透率得到了提升。
第二個(gè)變化,結(jié)合公開信息和我們內(nèi)部驗(yàn)證來(lái)看,DeepSeek-R1的模型做了一些創(chuàng)新(包括引入了更強(qiáng)的推理能力)后,在一些教育場(chǎng)景下的應(yīng)用效果確實(shí)有很大的提升。這種提升意味著,從應(yīng)用的角度來(lái)說(shuō),它的準(zhǔn)確率已經(jīng)達(dá)到了一個(gè)相對(duì)可用的狀態(tài)。
教育行業(yè)的容錯(cuò)率比較低。原來(lái),大模型的準(zhǔn)確率并沒有達(dá)到可用狀態(tài)。但是今天,以DeepSeek-R1為代表的這些模型的能力迅速提升,讓整個(gè)可用性變得更高,也讓更多的場(chǎng)景引入這一大模型的能力變得更加可行。
舉例來(lái)說(shuō),在我們內(nèi)部高中數(shù)學(xué)的一個(gè)題庫(kù)上,之前我們用原有模型測(cè)試,準(zhǔn)確率最佳情況是能做到74%。我們現(xiàn)在拿DeepSeek-R1結(jié)合內(nèi)部級(jí)數(shù)據(jù)測(cè)了一下,經(jīng)過(guò)調(diào)優(yōu)之后,準(zhǔn)確率大概能到90%。這還是其在高中數(shù)學(xué)的知識(shí)體系里的表現(xiàn)。如果知識(shí)點(diǎn)下沉到初中、小學(xué),DeepSeek-R1的準(zhǔn)確率會(huì)提升得更顯著,可能接近于真人的狀態(tài)。
第三個(gè)變化,讓更多企業(yè)堅(jiān)定了對(duì)AI的投入。之前很多企業(yè)對(duì)AI還沒有形成很好的共識(shí),畢竟AI的投入成本比較高,也需要專業(yè)人才。但今天很多企業(yè)意識(shí)到了,必須要擁抱AI。
回到教育場(chǎng)景下,它可能會(huì)帶來(lái)的變化主要是在兩個(gè)方向:
一個(gè)方向是為學(xué)生創(chuàng)造更好的價(jià)值。
從產(chǎn)品的角度來(lái)講,目前行業(yè)里的教學(xué)環(huán)境,大部分還是通過(guò)以真人老師為主來(lái)跟學(xué)生進(jìn)行交付。有了DeepSeek能力的輔助后,老師和學(xué)生在整個(gè)教學(xué)過(guò)程中的反應(yīng)的速度、平均的專業(yè)度、效率、服務(wù)群體的規(guī)模,都能得到大幅提升。
這帶來(lái)的一個(gè)變化是,原來(lái)必須要由專業(yè)的真人老師來(lái)提供一些教學(xué)服務(wù),今天通過(guò)大模型的輔助,不管是教學(xué)、練習(xí)還是答疑,直接通過(guò)AIToC或者通過(guò)AI輔助老師來(lái)ToC這兩種情況下,整個(gè)效果和效率都能夠有顯著的提升。
另一個(gè)方向是改善企業(yè)內(nèi)部的運(yùn)營(yíng)效率。不管是市場(chǎng)營(yíng)銷、銷售轉(zhuǎn)化或服務(wù)的環(huán)節(jié),效率都會(huì)有顯著提升。
必須要明確的是,雖然以DeepSeek為代表的大模型現(xiàn)在很火,但是總體來(lái)講,它們還是在整個(gè)AI能力進(jìn)化的相對(duì)早期階段,如果成熟狀態(tài)是100分,那么今天的這些大模型最好的狀態(tài)也就是5-10分的水平,離終態(tài)還很遙遠(yuǎn),在短周期內(nèi),我們還不能對(duì)它的節(jié)奏和價(jià)值期待過(guò)高。
02
在基座模型快速迭代的過(guò)程中,教育公司也要讓自有模型及時(shí)跟上變化
多知:市面上很多教育公司已經(jīng)有自研的大模型,同時(shí)接入了DeepSeek,怎么看其未來(lái)的路徑?
羅斌:如今,DeepSeek是一個(gè)更強(qiáng)大的基座模型,無(wú)論是把自己原有的模型或數(shù)據(jù)和DeepSeek結(jié)合,還是以DeepSeek模型作為基座,重新去訓(xùn)練新的自有模型,每家公司會(huì)用不同的路徑來(lái)做。
但我的基本觀點(diǎn)是,今天大模型的底層生態(tài),如果只是5-10分的水平,那么在未來(lái)的半年、一年、兩年、三年,底層的大模型還會(huì)有突飛猛進(jìn)的變化。
今天各家在這樣的場(chǎng)景下構(gòu)建起的自有模型的能力提升速度,跟大廠的模型提升速度相比,完全不在一個(gè)量級(jí)。
在這種情況下,對(duì)每家公司來(lái)說(shuō),更重要的是要找到一種機(jī)制,以便在大廠的基座模型快速迭代的過(guò)程中,能及時(shí)跟上這一波變化,并在每次變化的過(guò)程中,能及時(shí)把新的能力能結(jié)合進(jìn)來(lái),為自己所用。
03
不要期待有了AI之后就能一劍封喉
多知:當(dāng)教育公司普遍擁抱DeepSeek,大家的差異化、本質(zhì)區(qū)別將體現(xiàn)在哪里?
羅斌:不管是以DeepSeek為代表開源的基座模型,還是一些大廠的閉源模型,它都會(huì)有某種方式開放給整個(gè)社會(huì)使用。所以在底層的基礎(chǔ)的能力上,是相對(duì)標(biāo)化的、是平等的,大家在這個(gè)地方不會(huì)有明顯的差異。
但可能會(huì)存在差異的地方是什么呢?
第一個(gè)維度就是在模型的本身。
各家根據(jù)自己的需要,嘗試建垂直模型、小模型或者專屬模型,這樣能更好地適配不同應(yīng)用場(chǎng)景。比如高途有考研業(yè)務(wù),也有公考業(yè)務(wù),可能用于考研業(yè)務(wù)的模型和用于考公業(yè)務(wù)的模型就不太一樣。這里可能存在差異化的模型的版本。
各家在專屬模型的建設(shè)能力和水平上實(shí)際上是有差異的。
第二個(gè)維度是在應(yīng)用層。
關(guān)于基座模型,教育公司們不會(huì)有顯著的差異。但在應(yīng)用層,可能變化會(huì)更多一些,F(xiàn)在的模型,更多的還是偏系統(tǒng)1的這種模型,還不具備非常強(qiáng)的推理、調(diào)度或者真正意義上的智能。
未來(lái),大家也在提,比如大套型套小模型的方式,或者是通用模型嵌套專有模型的方式,包括未來(lái)有市面上有這么多的模型,怎樣做混用,不同的場(chǎng)景下可能調(diào)用不同的模型,另外,包括人機(jī)怎么結(jié)合,老師和AI怎樣協(xié)作,讓整個(gè)過(guò)程能夠變得更加高效和專業(yè),這個(gè)地方可能各家的做法會(huì)有差異。
還有一個(gè)就是怎樣做運(yùn)營(yíng)。同樣的一個(gè)能力,在不同的團(tuán)隊(duì)里面,你的推廣、宣傳、運(yùn)營(yíng),可能會(huì)導(dǎo)致最終的使用的廣度、深度、效果上,也會(huì)有明顯的差距。
第三個(gè)維度是在產(chǎn)品層。
站在學(xué)員的角度,學(xué)員需要的產(chǎn)品是一個(gè)解決方案。他并沒有那么在意你提供的是真的AI還是別的什么。
所以結(jié)合AI的能力后,每家提供的解決方案,是不一樣的。但是從學(xué)員角度看,他需要更好的體驗(yàn),更好的效果和更好的性價(jià)比。因此,在產(chǎn)品上,變化會(huì)更大。
最后一個(gè)維度是組織能力。
同樣的一種AI能力,隨著時(shí)間的演進(jìn),大家的迭代方向和迭代速度是會(huì)有差異的。
拉長(zhǎng)周期來(lái)看,不管是從產(chǎn)品層面還是從運(yùn)營(yíng)層面,都會(huì)形成更加明顯的差異。
這里面,人才的影響是比較大的。
總結(jié)來(lái)講,底層能力、標(biāo)準(zhǔn)化的這些能力,大家是類似的。但是回到教育這個(gè)場(chǎng)景,至少在我們現(xiàn)在能看見的一個(gè)周期內(nèi),AI能力本身是一個(gè)關(guān)鍵要素,但不是一個(gè)決定性的要素。更重要的還是在產(chǎn)品、在應(yīng)用等方面,可能需要結(jié)合AI來(lái)做重新的思考設(shè)計(jì)。面向未來(lái)的一個(gè)周期(3-5年)來(lái)做這樣的布局和迭代,可能是更加重要的。
不要期待有了AI之后就能一劍封喉,這件事情不太會(huì)發(fā)生。
04
大模型實(shí)時(shí)解答,正在消解拍搜解題產(chǎn)品的題庫(kù)門檻
羅斌:原來(lái)學(xué)生有一道題不會(huì)做,他要么問(wèn)老師,要么就用拍搜工具。拍搜工具內(nèi)部是要做大量題庫(kù)的生產(chǎn)和累積的,但今天看起來(lái),如果有了更強(qiáng)大的大模型能力,過(guò)去拍搜的這種模式就會(huì)發(fā)生變化,就不需要提前去生產(chǎn)積累自己的題庫(kù),現(xiàn)在是一種實(shí)時(shí)解答的方式。
所以我的感覺是,未來(lái)在解題的這個(gè)部分,你問(wèn)AI一道標(biāo)準(zhǔn)化的題,AI給你進(jìn)行解題這件事,會(huì)變得比較標(biāo)準(zhǔn)化了,通過(guò)大模型就能夠達(dá)到一個(gè)非常高的準(zhǔn)確率了。相當(dāng)于拍搜題庫(kù)這件事不會(huì)有絕對(duì)的門檻了。當(dāng)然可能每一家自己做出來(lái)這個(gè)模型,通過(guò)不同的數(shù)據(jù)和調(diào)優(yōu)以后,可能還會(huì)有一定的準(zhǔn)確率的差異。但這個(gè)差異就沒有那么大了。
原來(lái)可能你手里有一億的題庫(kù),人家手里可能只有一千萬(wàn)的題庫(kù),差異可能會(huì)特別大。但有了更強(qiáng)大的大模型能力,以后可能的差異是,你的準(zhǔn)確率可能是93%,人家的準(zhǔn)確率可能是91%?赡苤皇沁@種層面的一個(gè)區(qū)別。但是在覆蓋率上,可能大家都能夠做到非常高的覆蓋率。
05
學(xué)習(xí)環(huán)節(jié)里,相對(duì)簡(jiǎn)單的任務(wù)和交互,更容易被AI替代
多知:DeepSeek會(huì)不會(huì)取代一些現(xiàn)有的學(xué)習(xí)產(chǎn)品?
羅斌:如果把整個(gè)學(xué)習(xí)進(jìn)行拆解,不管是面向?qū)W生,還是站在企業(yè)內(nèi)部的角度,有很多環(huán)節(jié)。
哪些環(huán)節(jié)受到AI的影響更大呢?可能是相對(duì)簡(jiǎn)單的任務(wù),相對(duì)簡(jiǎn)單的交互,在這種邏輯下,更容易發(fā)生。但如果它是一個(gè)長(zhǎng)周期的、多任務(wù)的、復(fù)雜的鏈條,AI在里面產(chǎn)生很大作用的難度會(huì)比較大一些。
所以,第一個(gè),AI替代的應(yīng)該是一個(gè)相對(duì)簡(jiǎn)單的這種學(xué)習(xí)任務(wù)。第二個(gè)是,它更適合于學(xué)生主動(dòng)來(lái)發(fā)起、AI來(lái)接聽響應(yīng)的場(chǎng)景。而需要由我們來(lái)主動(dòng)地管理和影響學(xué)生的這個(gè)部分,今天的AI還做不到。這是因?yàn),AI的能力還不夠,也很難讓學(xué)生真正遵從AI的指令。
所以從這兩個(gè)角度來(lái)講,AI能夠在里面發(fā)揮作用的一些環(huán)節(jié)還是可以羅列的:
第一種場(chǎng)景,在企業(yè)內(nèi)部的一個(gè)場(chǎng)景下,通過(guò)AI來(lái)輔助做一些內(nèi)容的生產(chǎn),做一些知識(shí)庫(kù)的建設(shè),包括做一些內(nèi)部的問(wèn)答平臺(tái)搭建,這是可以做得到的。
第二種場(chǎng)景,一些簡(jiǎn)單的對(duì)話場(chǎng)景,比如像客服、拍搜(學(xué)生問(wèn)一個(gè)問(wèn)題,你要給他一個(gè)答案,這種就是用戶過(guò)來(lái)之后就去尋找一個(gè)答案的這樣一種邏輯,跟標(biāo)準(zhǔn)化的DeepSeek的用法類似。你給一個(gè)輸入,它會(huì)反饋你一個(gè)輸出,提供一些專業(yè)的內(nèi)容解答)這種類型的場(chǎng)景下,AI的能力會(huì)越來(lái)越強(qiáng)。
第三種場(chǎng)景,在一些特定的練習(xí)場(chǎng)景下,AI是可以承擔(dān)這樣一個(gè)角色的。舉個(gè)例子,英語(yǔ)對(duì)話練習(xí),市面上有很多的產(chǎn)品在做類似的一個(gè)事情,這也是比較簡(jiǎn)單的對(duì)話性的任務(wù),或者是你需要他給你針對(duì)一個(gè)特定的題目做一下講解,講特定的一道題,簡(jiǎn)單的教學(xué)或者是對(duì)練,是可以通過(guò)AI來(lái)做一定的替換的。
但是除了這三種情況以外,對(duì)于其他的比較復(fù)雜的這種任務(wù),以及這種需要老師和學(xué)生進(jìn)行強(qiáng)互動(dòng),強(qiáng)引導(dǎo),甚至帶有一定的管控屬性的任務(wù)和場(chǎng)景,AI在里面更多的只能起到一個(gè)簡(jiǎn)單的輔助的作用,也很難真的替代真人來(lái)完成這些邏輯。
06
教育AI的iPhone時(shí)刻一定會(huì)發(fā)生,但時(shí)間、形式不確定
多知:隨著AI的快速發(fā)展,未來(lái)教育行業(yè)的格局會(huì)發(fā)生怎樣的大變化?
羅斌:教育行業(yè)格局如果要發(fā)生大的變化,一定要有一個(gè)重要的變量會(huì)不會(huì)有真正意義上新形態(tài)的產(chǎn)品出現(xiàn)。教育+AI里會(huì)不會(huì)有一個(gè)iPhone時(shí)刻,像當(dāng)年iPhone橫空出世一樣,帶來(lái)根本性的產(chǎn)品的變化和升級(jí)?