1956年,一群數(shù)學(xué)家和工程師聚首達特茅斯學(xué)院,制定了一項建設(shè)人工智能的遠大計劃。他們希望對計算機進行編程,使其能夠推理、規(guī)劃、導(dǎo)航、處理自然語言并進行翻譯,感知周邊世界,還可以展現(xiàn)創(chuàng)造力和直覺。這在當時看來,似乎野心過大。然而時至今日,計算機已經(jīng)在國際象棋中戰(zhàn)勝人類,智能手機為我們提供旅行指南,聊天機器人能夠起草論文,應(yīng)用程序幾乎可以即時進行語言翻譯。凱洛格學(xué)院的金融學(xué)教授塞爾吉奧雷貝洛表示:“我們在人工智能領(lǐng)域已經(jīng)取得了長足的進步,但這些進步是在多年的失敗之后才實現(xiàn)的!痹诮谝粓鲇蓜P洛格高管教育和《凱洛格洞察》主辦的網(wǎng)絡(luò)研討會上,雷貝洛從宏觀經(jīng)濟學(xué)家的視角回顧了人工智能過去的經(jīng)驗教訓(xùn),以幫助我們準備好迎接人工智能今后在社會中迅速擴大的作用。
一夜成名可能需要幾十年的準備
人工智能的早期戰(zhàn)略之一是創(chuàng)建專家系統(tǒng)。目標是向計算機程序提供盡可能多的知識,使其成為“專家”,從而使用這些信息來執(zhí)行相關(guān)任務(wù)。美國國防部在冷戰(zhàn)期間曾經(jīng)采用這種策略,試圖發(fā)明一種機器,能夠快速把捕獲的俄語短語翻譯成英語。計算機科學(xué)家向機器輸入了大量的單詞、規(guī)則和定義,然后讓它逐一翻譯單詞。然而,機器往往無法捕捉語言中的細微差異,以至于翻譯不夠準確。例如,將《圣經(jīng)》中的“你們的靈魂固然愿意,肉體卻軟弱了”這句話翻譯成俄語,然后再譯回英語,就變成了“威士忌雖然烈,肉卻腐爛了”。幾十年后,谷歌翻譯的團隊仍然在翻譯中使用專家人工智能這一概念。因此譯文往往過于直白,忽略了語言的微妙之處,也就不足為奇。直到谷歌在2016年放棄了這種方法,其人工智能翻譯才發(fā)生騰飛。該團隊利用神經(jīng)網(wǎng)絡(luò)一次處理整個句子,使用上下文來完善翻譯結(jié)果。雷貝洛稱,這種成功并非一蹴而就,而是經(jīng)過多年的反復(fù)試驗,人工智能翻譯才達到今天的水平!拔覀儸F(xiàn)在看到生成式人工智能的成功也有點類似。它看似一夜成名,但其實花了50多年來打造。”雷貝洛補充道,這些進步在很大程度上得益于政府對人工智能研究的長期資助!拔覀兘裉炜梢匀〉眠@樣的成就,是因為過去50年來盡管一再失敗,但政府還是一直堅持資助這項研究。”
直覺能夠引導(dǎo)你走向明智的風(fēng)險
計算機科學(xué)家李飛飛在職業(yè)生涯早期擔任斯坦福大學(xué)的助理教授,當時她就意識到阻礙人工智能發(fā)展的原因。她的直覺告訴她:“缺少的是數(shù)據(jù)!崩棕惵逭f:“如果你有更多的數(shù)據(jù)和處理數(shù)據(jù)的計算能力,就可能得到神奇的結(jié)果!崩铒w飛受到啟發(fā),投入所有資源來追求這一直覺。因此,她和她的博士生開始手動標記圖像,從而創(chuàng)建足夠龐大的數(shù)據(jù)集來訓(xùn)練算法,希望人工智能最終可以理解圖像!八龥Q定做一件冒險性十足的事情!崩棕惵逭f李飛飛為這項任務(wù)投入了大約兩年半的時間,而不是專注于更有把握、能夠幫助她更容易獲得終身教職的項目。這場**最終導(dǎo)致ImageNet的創(chuàng)建,這是一個包含數(shù)百萬張圖像的公共數(shù)據(jù)集。由“人工智能教父”杰弗里辛頓領(lǐng)導(dǎo)的另一個計算機科學(xué)家團隊利用這個數(shù)據(jù)集,開發(fā)出一種可以標記圖像并描述其內(nèi)容的算法。該團隊在2012年的一場人工智能競賽中,使用他們的算法分析一組新圖像,徹底打敗了其他算法。雷貝洛表示:“改善極其顯著。這是一個驚人的突破,也是現(xiàn)代人工智能的分水嶺!睆哪菚r起,人們開始競相獲取足夠的數(shù)據(jù)來培養(yǎng)這些永不滿足的算法。他們開始認識到,人工智能的發(fā)展更多依賴于通過大數(shù)據(jù)來擴展算法,而不是在算法中積累知識。人工智能隨后的進步之所以成為可能,是因為一位剛進職場的科學(xué)家決定冒險一搏。
我們說要堅持幾十年嗎?試試一個世紀吧
然而,雷貝洛指出,并非所有人工智能的嘗試都能夠如此迅速地開花結(jié)果。有些嘗試面臨著巨大的障礙,需要幾十年、甚至一個世紀的時間才取得進展。數(shù)學(xué)家安德雷馬爾可夫曾經(jīng)投入多年時間研究一個早期語言模型,他在1921年給圣彼得堡科學(xué)院寫了一封信,告知他的研究有所突破。馬爾可夫一直在研究一種用來寫詩的算法。但有一個問題,他沒有辦法親自到科學(xué)院展示他的研究成果。于是科學(xué)院給他寄了一雙靴子以示幫助,但是尺碼不合適。馬爾可夫始終未能成行進行演示。大約一年后,他就去世了。近一個世紀之后,一群谷歌計算機科學(xué)家在2017年使用一種新型的神經(jīng)網(wǎng)絡(luò)(transformer)解決了馬爾可夫研究的問題,該網(wǎng)絡(luò)最終成為當今流行的大語言模型(LLM)(比如ChatGPT)的基礎(chǔ)!叭绻覀儧]有在1921年丟失那篇論文,也許現(xiàn)在(在大語言模型方面)取得的突破就會來的更早!崩棕惵逭f,“無論如何……神經(jīng)網(wǎng)絡(luò)現(xiàn)在取得了驚人的成果!北M管人工智能已經(jīng)有長足的發(fā)展,但仍然有許多問題尚待解決;糜X是一種常見的現(xiàn)象,亦即人工智能虛構(gòu)了部分信息。這一缺陷令許多團體望而生畏。例如,在發(fā)現(xiàn)一名律師向法官遞交了一份由人工智能撰寫、其中充斥了虛構(gòu)案件的辯護狀后,一些律師事務(wù)所甚至禁止員工在工作中使用大語言模型。但雷貝洛認為,因為恐懼而決定停止使用人工智能工具是個錯誤,只會讓人們走回頭路。他說:“人們很擔憂人類會被人工智能取代。但是我要說,最先被取代的就是那些不知如何使用人工智能的人。取代他們的不是人工智能,而是懂得如何使用人工智能的人。”警惕炒作
在人工智能發(fā)展的眾多里程碑中,雷貝洛認為“迄今為止最令人驚嘆的成就是在生物學(xué)領(lǐng)域,”也就是人工智能在理解蛋白質(zhì)結(jié)構(gòu)方面的應(yīng)用。截至2019年,科學(xué)家們已經(jīng)確定了大約17萬種蛋白質(zhì)的結(jié)構(gòu),這是一個巨大的成就,因為光是折疊一個蛋白質(zhì)就是一個需要耗費數(shù)年、值得撰寫博士論文的項目。然而在2020年,人工智能程序AlphaFold確定了超過兩億種蛋白質(zhì)的獨特結(jié)構(gòu)。“顯然,我們正處于一個新的開端!崩棕惵逭f,“但同時,也存在很多吹捧和炒作。”人們會有一種印象,認為“人工智能是一種神奇的萬能工具”。但他指出,事實卻截然不同。以ChatGPT為例。在普通用戶的眼中,它像是一種單一而復(fù)雜的算法,可以勝任從撰寫文本到音頻處理等眾多任務(wù)。但在幕后,它是一套專門的算法,它們在單獨執(zhí)行特定任務(wù)時非常出色,但在其他大多數(shù)任務(wù)上卻表現(xiàn)的很糟糕!坝袝r人們會認為人工智能看似一套美麗閃亮的銅管!崩棕惵灞硎,“但事實上,它更像我的地下室,其中所有東西都是用膠帶來修理。人工智能中有很多膠帶補丁!比藗冞擔心人工智能會遇到瓶頸,并且OpenAI新推出的大語言模型Orion不一定比其前身ChatGPT更好。對于谷歌的Gemini和Anthropic最新版本的聊天機器人Claude,也存在類似的傳言。雷貝洛說:“數(shù)據(jù)擴展是否會繼續(xù)成為人工智能巨大改進的源泉,還是我們正在進入一個收益遞減的時代……沒有人知道。”但是我們不應(yīng)據(jù)此就不慶祝目前的成就,因為“我們最近取得的成就確實相當驚人!保ㄘ敻恢形木W(wǎng))在財富Plus,網(wǎng)友們對這篇文章發(fā)表了許多有深度和思想的觀點。一起來看看吧。也歡迎你加入我們,談?wù)勀愕南敕。今日其他熱議話題: