每經(jīng)記者:鄭雨航 實(shí)習(xí)記者 宋欣悅每經(jīng)編輯:蘭素英
長(zhǎng)期以來(lái),人工智能(AI)領(lǐng)域奉行“數(shù)據(jù)規(guī)模越大越好”的信念,但近期業(yè)界卻傳出大模型進(jìn)化遭遇“數(shù)據(jù)墻”的消息。
據(jù)報(bào)道,OpenAI、谷歌和Anthropic在開(kāi)發(fā)新一代模型時(shí)遭遇瓶頸,無(wú)法實(shí)現(xiàn)此前那樣的突破性進(jìn)展。圖靈獎(jiǎng)得主楊立昆(Yann LeCun)和OpenAI前首席科學(xué)家伊爾亞蘇茨克維(Ilya Sutskever)等業(yè)界大佬直言,規(guī)模法則(Scaling Law)已觸及天花板。
受訪者供圖
美國(guó)技術(shù)研究公司EpochAI預(yù)測(cè),互聯(lián)網(wǎng)上可用的高質(zhì)量文本數(shù)據(jù)可能會(huì)在2028年耗盡。
“數(shù)據(jù)墻”是否真實(shí)存在,未來(lái)的AI將走向何處?如果真有“數(shù)據(jù)墻”,大模型研發(fā)企業(yè)又該如何找尋新的出路?就此,《每日經(jīng)濟(jì)新聞》記者(以下簡(jiǎn)稱NBD)近日專訪了清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系長(zhǎng)聘副教授崔鵬。
崔鵬表示,目前大模型還是以大規(guī)模數(shù)據(jù)驅(qū)動(dòng)為范式的,而數(shù)據(jù)總有用完的一天,肯定會(huì)碰上“數(shù)據(jù)墻”。在他看來(lái),數(shù)據(jù)問(wèn)題只是目前AI面臨的一小部分難題。更大的問(wèn)題在于,目前的AI缺少泛化能力,使其缺乏安全可信性。
他認(rèn)為,未來(lái)3~5年將是打造安全、可信AI的黃金期,因?yàn)閱渭円揽恳?guī)模法則或者蠻力法(Brute Force,指用大量計(jì)算資源和窮舉所有可能的方式來(lái)解決問(wèn)題),邊際收益已經(jīng)逐漸降低,必須尋找新的突破點(diǎn)。
而在談及AI助推行業(yè)升級(jí)的話題時(shí),他表示,我國(guó)資源稟賦最為突出的領(lǐng)域其實(shí)是工業(yè)。AI與工業(yè)場(chǎng)景相結(jié)合,反而是我們很重要的一步“先手棋”。
崔鵬于2010年獲得清華大學(xué)博士學(xué)位,長(zhǎng)期聚焦因果推斷與AI的融合研究,在國(guó)際上自主提出并發(fā)展了因果啟發(fā)的穩(wěn)定學(xué)習(xí)理論方法體系,在智慧醫(yī)療、工業(yè)制造及互聯(lián)網(wǎng)經(jīng)濟(jì)等領(lǐng)域?qū)崿F(xiàn)重要應(yīng)用。崔鵬已在AI及數(shù)據(jù)挖掘領(lǐng)域頂級(jí)國(guó)際期刊和會(huì)議上發(fā)表論文百余篇,并先后獲得7項(xiàng)國(guó)際會(huì)議及期刊最佳論文獎(jiǎng),還(曾)擔(dān)任IEEE TKDE、IEEE TBD、ACM TIST、ACM TOMM等國(guó)際頂級(jí)期刊的編委。
“數(shù)據(jù)墻”確實(shí)存在,AI最大瓶頸是安全可信
NBD:您認(rèn)為目前AI發(fā)展是否到了一個(gè)瓶頸?是否存在所謂的“墻”呢?
崔鵬:這一代AI的技術(shù)路徑,總體上仍遵循大規(guī)模數(shù)據(jù)驅(qū)動(dòng)的范式,依賴于算法、算力和數(shù)據(jù)這三要素。而目前,基本所有互聯(lián)網(wǎng)中的高質(zhì)量數(shù)據(jù),都已經(jīng)投喂給了大模型。除此之外,大模型還吸收了大量的人工標(biāo)注數(shù)據(jù)。如果一直維持規(guī)模法則這樣的范式,到一定階段,AI肯定是會(huì)撞上“數(shù)據(jù)墻”的。
如果從底層的學(xué)習(xí)機(jī)理和學(xué)習(xí)機(jī)制來(lái)看,當(dāng)前AI的泛化能力實(shí)際上是缺失的。也就是說(shuō),AI只能處理在訓(xùn)練階段已經(jīng)見(jiàn)過(guò)的類似案例,對(duì)于未見(jiàn)過(guò)類似的案例則難以應(yīng)對(duì)。
泛化能力的缺失導(dǎo)致了一個(gè)嚴(yán)重的問(wèn)題:當(dāng)我們將AI應(yīng)用于開(kāi)放場(chǎng)景時(shí),模型往往會(huì)在未被充分訓(xùn)練過(guò)的場(chǎng)景下“胡說(shuō)八道”。這構(gòu)成了AI面臨的最大技術(shù)瓶頸在安全可信方面的能力缺失,也就是說(shuō),目前的AI既不夠安全也不夠可信。
NBD:那我們應(yīng)該如何解決AI的安全可信問(wèn)題呢?
崔鵬:目前來(lái)看,有三個(gè)層面:探索新的學(xué)習(xí)機(jī)理,建立新的數(shù)據(jù)科學(xué)體系,還要能夠提出新的評(píng)估手段。做到三位一體,才能夠真正解決AI的安全和可信問(wèn)題。
首先,傳統(tǒng)的機(jī)器學(xué)習(xí)基于“獨(dú)立同分布”的假設(shè),認(rèn)為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)是相似的。這種假設(shè)給予機(jī)器學(xué)習(xí)明確的優(yōu)化目標(biāo),但在實(shí)際應(yīng)用中,這種假設(shè)可能會(huì)帶來(lái)一些問(wèn)題,比如過(guò)擬合(模型過(guò)于依賴訓(xùn)練數(shù)據(jù),無(wú)法應(yīng)對(duì)新情況)或擬合無(wú)關(guān)的信息。特別是在大規(guī)模數(shù)據(jù)中,變量之間可能存在虛假的關(guān)聯(lián),從而影響到模型的準(zhǔn)確性。相比之下,因果統(tǒng)計(jì)會(huì)更加關(guān)注變量之間的因果關(guān)系(即明確哪些因素真正影響結(jié)果),能夠更好地應(yīng)對(duì)數(shù)據(jù)分布變化帶來(lái)的問(wèn)題。
其次,我們需要轉(zhuǎn)變對(duì)數(shù)據(jù)的處理方式,發(fā)展新的數(shù)據(jù)科學(xué)體系,從被動(dòng)積累數(shù)據(jù)轉(zhuǎn)變?yōu)橹鲃?dòng)獲取有效數(shù)據(jù),并使數(shù)據(jù)與智能形成互動(dòng)的反饋循環(huán)數(shù)據(jù)產(chǎn)生智能,智能又能夠定向告訴我們應(yīng)該去產(chǎn)生或者收集什么樣的數(shù)據(jù)。
第三是建立新的評(píng)估體系,以準(zhǔn)確刻畫模型的能力邊界和風(fēng)險(xiǎn)。通過(guò)評(píng)估來(lái)明確模型風(fēng)險(xiǎn)可能存在的具體情境,在明確這些風(fēng)險(xiǎn)后,我們就應(yīng)當(dāng)避免在那些高風(fēng)險(xiǎn)情境下使用AI模型來(lái)完成任務(wù)。
當(dāng)AI遇上高風(fēng)險(xiǎn)行業(yè),得分99.99也是不夠的
NBD:市面上不乏許多表現(xiàn)出色的模型,但為何在高風(fēng)險(xiǎn)行業(yè),仍然鮮見(jiàn)AI的廣泛應(yīng)用呢?
崔鵬:現(xiàn)在關(guān)于AI有兩個(gè)論調(diào),一種觀點(diǎn)認(rèn)為,AI的發(fā)展已經(jīng)達(dá)到一個(gè)前所未有的高度,諸如AGI(通用人工智能)和ASI(超級(jí)智能)等概念開(kāi)始被廣泛討論。然而,另一種觀點(diǎn)認(rèn)為,現(xiàn)在的AI,其實(shí)并沒(méi)有在嚴(yán)肅行業(yè)里真正解決實(shí)際問(wèn)題。
AI在實(shí)際應(yīng)用中的落地面臨諸多困難,因?yàn)锳I的泛化能力無(wú)法得到保證,那么其在開(kāi)放場(chǎng)景下的安全性和可信性就無(wú)法得到保證。為什么我們敢用人去解決這些風(fēng)險(xiǎn)比較高的任務(wù)呢?就是因?yàn)橄噍^于現(xiàn)在的AI,人的可信性肯定要高很多。
對(duì)于AI,市面上有各種各樣的評(píng)測(cè)和榜單,但其實(shí)這些都是對(duì)模型整體能力的刻畫,但它并不足以精確描繪出模型在具體應(yīng)用場(chǎng)景下的能力邊界。
那么,即便模型拿到99分,甚至是99.99分的高分,也可能不足以說(shuō)明它在實(shí)際應(yīng)用中是安全可信的。因?yàn)槲覀儫o(wú)法確切知曉,其風(fēng)險(xiǎn)究竟會(huì)處于何種情況之下。因此,對(duì)于AI而言,確實(shí)需要建立一套新的評(píng)估體系,準(zhǔn)確評(píng)估和界定模型的能力邊界,這一點(diǎn)至關(guān)重要。
未來(lái)3~5年是打造安全、可信AI的黃金期
NBD:在2024年世界互聯(lián)網(wǎng)大會(huì)烏鎮(zhèn)峰會(huì)網(wǎng)絡(luò)安全技術(shù)發(fā)展與國(guó)際合作論壇上,有業(yè)內(nèi)人士將AI安全危機(jī)總結(jié)為“三化”,即:黑箱化(指AI系統(tǒng)內(nèi)部的決策過(guò)程對(duì)用戶和開(kāi)發(fā)者來(lái)說(shuō)是不透明的)、黑產(chǎn)化(導(dǎo)致深度偽造泛濫成災(zāi))和武器化(導(dǎo)致黑客攻擊愈演愈烈)。您認(rèn)為在解決“AI黑箱”的問(wèn)題上,有哪些比較有效的技術(shù)手段呢?
崔鵬:從技術(shù)層面來(lái)看,AI實(shí)際上正逐步趨向于“黑箱化”發(fā)展。但是從性能角度來(lái)講,AI的能力也在不斷增強(qiáng)。因此,在一定程度上,可以說(shuō)我們讓渡了對(duì)模型的控制權(quán),換取了其性能上的提升。
一種新技術(shù)的出現(xiàn),到底是不是需要它完全透明、可解釋,其實(shí)也是一個(gè)問(wèn)題。因?yàn)楸举|(zhì)上來(lái)講,一項(xiàng)技術(shù)是否能夠?yàn)閺V大消費(fèi)者所接受,并不取決于它是不是可解釋、是不是透明的,而取決于它是不是安全可信的。
比如,人們敢開(kāi)車,不是因?yàn)槊總(gè)人都懂發(fā)動(dòng)機(jī)的發(fā)動(dòng)原理;人們敢坐飛機(jī),也不是因?yàn)槊總(gè)人都懂空氣動(dòng)力學(xué)。
所謂“可解釋性”,實(shí)際上是指能夠被人類所理解。而人類的解釋邏輯往往基于因果。因此,如果機(jī)器的推理邏輯與人類的推理邏輯能夠?qū)R,那整個(gè)工作機(jī)制對(duì)于人類而言,就是可解釋的。
NBD:您認(rèn)為我們什么時(shí)候能夠構(gòu)建好安全可信的AI呢?
崔鵬:我認(rèn)為,未來(lái)3~5年將是打造安全、可信AI的黃金期,F(xiàn)在AI又到了一個(gè)十字路口,按照(已知)技術(shù)路徑來(lái)走,大家會(huì)越來(lái)越清楚AI的最終發(fā)展形態(tài)。因此,會(huì)有更多的人關(guān)注AI的安全可信,因?yàn)閱渭円揽恳?guī)模法則或蠻力法,邊際收益已經(jīng)逐漸降低,必須尋找新的突破點(diǎn)。
實(shí)際上,目前已有一些相對(duì)成熟的技術(shù)手段,能夠在一定程度上解決這些問(wèn)題。底層的基礎(chǔ)理論體系已經(jīng)構(gòu)建出來(lái)了,關(guān)鍵技術(shù)也有了,接下來(lái)要解決的就是如何將這些技術(shù)與實(shí)際應(yīng)用場(chǎng)景進(jìn)行打磨和對(duì)齊。因此我認(rèn)為,解決這個(gè)問(wèn)題所需的時(shí)間并不會(huì)太長(zhǎng)。
但是,在安全可信的機(jī)制這一層面,相對(duì)于歐美國(guó)家,我們的投入和關(guān)注量都是相對(duì)少的。
如果我們觀察美國(guó)的科研規(guī)劃或頂尖學(xué)者們的研究方向,會(huì)發(fā)現(xiàn)他們實(shí)際上是“兩條腿在走”。一方面,是靠大規(guī)模算力、大規(guī)模數(shù)據(jù)來(lái)打造更強(qiáng)大的模型。與此同時(shí),他們也在積極探索另一條路,即如何保障AI的安全性和可信性。
“安全可信”會(huì)是2025年AI發(fā)展的一個(gè)重要趨勢(shì)。在當(dāng)前階段乃至我國(guó)大的戰(zhàn)略中,“安全可信”都占據(jù)著舉足輕重的地位。如果這一步棋走好了,或許不能說(shuō)是“彎道超車”,但可以說(shuō)是“換道超車”。
AI與工業(yè)結(jié)合,將成為重要的“先手棋”
NBD:AI與自動(dòng)化的結(jié)合正改變一些傳統(tǒng)行業(yè)。您認(rèn)為AI會(huì)如何推動(dòng)這些行業(yè)的智能升級(jí)呢?具體的應(yīng)用場(chǎng)景又會(huì)有哪些呢?
崔鵬:這一波大模型出來(lái)以后,它的主要應(yīng)用場(chǎng)景是互聯(lián)網(wǎng)。但從我國(guó)的資源稟賦講,互聯(lián)網(wǎng)可能并不一定是最有比較優(yōu)勢(shì)的“戰(zhàn)場(chǎng)”。我國(guó)資源稟賦最為突出的領(lǐng)域其實(shí)是工業(yè)。無(wú)論是制造業(yè)的數(shù)據(jù)量、質(zhì)量和規(guī)模,還是我們的支持力度,都遠(yuǎn)超其他國(guó)家。AI與工業(yè)場(chǎng)景相結(jié)合,反而是我們很重要的一步“先手棋”。
第四次工業(yè)革命的核心在于利用AI解決這些嚴(yán)肅行業(yè)的生產(chǎn)力問(wèn)題,用智能去賦予工業(yè)更高的生產(chǎn)效率。
在此背景下,智能化將是一個(gè)必然趨勢(shì)。因?yàn)槿俗畈簧瞄L(zhǎng)的就是處理大規(guī)模、高維度的數(shù)據(jù),在面對(duì)復(fù)雜任務(wù)時(shí),是遠(yuǎn)遠(yuǎn)跟不上需求的。而大模型一天就能處理幾十萬(wàn)本書(shū)的信息,與人的能力完全不在一個(gè)量級(jí)。從這個(gè)角度來(lái)看,AI是大有可為的。
我們現(xiàn)在正在做的一項(xiàng)工作是通過(guò)分析設(shè)備的故障代碼,利用AI技術(shù)精準(zhǔn)定位故障點(diǎn),大幅度節(jié)約人力成本,提高生產(chǎn)效率。那這對(duì)于工業(yè)生產(chǎn)而言,無(wú)疑解決了非常大的問(wèn)題。
每日經(jīng)濟(jì)新聞