(來(lái)源:MIT Technology Review)
我們都明白“谷歌”一下是什么意思。你只需在搜索框中輸入幾個(gè)關(guān)鍵詞,便會(huì)得到一系列藍(lán)色鏈接,指向最相關(guān)的結(jié)果。頁(yè)面頂部可能會(huì)顯示一些簡(jiǎn)短的解釋,或者呈現(xiàn)地圖、體育比分、視頻內(nèi)容等。但本質(zhì)上,這一過程只是從互聯(lián)網(wǎng)上提取已有的信息,并以某種結(jié)構(gòu)化的方式展示給你。
然而,這一切正面臨變化,我們正處于一個(gè)全新的轉(zhuǎn)折點(diǎn)。
自上世紀(jì) 90 年代以來(lái),搜索引擎?zhèn)鬟f信息的方式正在經(jīng)歷前所未有的變革。不再需要依賴關(guān)鍵詞搜索,也不必在鏈接中逐一點(diǎn)擊篩選。我們正步入對(duì)話式搜索的新時(shí)代。這意味著,你無(wú)需再輸入關(guān)鍵詞,而是用自然語(yǔ)言提出真實(shí)的問題。你獲得的將不再是鏈接,而是更多直接的答案。這些答案由生成式人工智能實(shí)時(shí)創(chuàng)作,基于整個(gè)互聯(lián)網(wǎng)的信息,以更加直觀的方式呈現(xiàn)給你。
谷歌,這家在過去 25 年中一直主導(dǎo)搜索領(lǐng)域的公司,正努力在這一變革中保持領(lǐng)先。2023 年 5 月,谷歌開始測(cè)試?yán)闷?LLM 對(duì)搜索查詢進(jìn)行智能回應(yīng),提供類似于專家或可信賴朋友所給出的答案。這項(xiàng)功能被稱為 AI 概覽。谷歌首席執(zhí)行官 Sundar Pichai 在接受 MIT Technology Review 采訪時(shí),將其形容為“我們長(zhǎng)期以來(lái)對(duì)搜索所做的最重大革新之一”。
AI 概覽從根本上改變了谷歌可以解答的查詢類型,F(xiàn)在,你可以向它提出諸如:“下個(gè)月我去日本旅行一周,會(huì)住在東京,但想安排一些一日游活動(dòng)。附近有哪些節(jié)慶活動(dòng)?鐮倉(cāng)的沖浪條件如何?有沒有不錯(cuò)的樂隊(duì)在表演?”這樣復(fù)雜的問題。谷歌會(huì)直接給出答案,而不僅僅是提供 Reddit 等網(wǎng)站的鏈接,而是整合當(dāng)前信息的直接解答。
更重要的是,如今你可以嘗試那些過去幾乎無(wú)法找到答案的問題,并獲得準(zhǔn)確的回應(yīng)。你無(wú)需清晰地表達(dá)自己在尋找什么。只需簡(jiǎn)單描述院子里出現(xiàn)的鳥類、冰箱的異常狀況,或汽車發(fā)出的奇怪聲音,谷歌就能從原本分散在互聯(lián)網(wǎng)各處的信息中整合出幾乎像人類解釋般的答案。這種體驗(yàn)令人驚嘆,一旦習(xí)慣了這種搜索方式,就很難回到以往的模式。
而且,這種變革并不僅限于谷歌。OpenAI 的 ChatGPT 已經(jīng)可以聯(lián)網(wǎng),能夠更精準(zhǔn)地獲取最新的答案。微軟在 9 月推出了 Bing 的生成式搜索結(jié)果,Meta 也開發(fā)了自己的版本。初創(chuàng)公司 Perplexity 同樣在推動(dòng)類似的技術(shù),秉持著“快速行動(dòng),打破常規(guī)”的理念。這些企業(yè)正在競(jìng)相成為下一個(gè)信息檢索的主導(dǎo)者“下一個(gè)谷歌”,這場(chǎng)競(jìng)爭(zhēng)背后牽涉著數(shù)萬(wàn)億美元的利益。
然而,并非所有人都對(duì)這種變化感到興奮。出版商對(duì)此感到極度恐慌。這一趨勢(shì)加劇了人們對(duì)“零點(diǎn)擊”未來(lái)的擔(dān)憂那是一個(gè)搜索引薦流量將消失的時(shí)代,而這種流量自谷歌誕生前便是互聯(lián)網(wǎng)的重要支柱。
去年 6 月,當(dāng)我在手機(jī)上收到 Perplexity 應(yīng)用的推送通知時(shí),我第一次對(duì)未來(lái)的搜索方式有了直觀的感受。Perplexity 是一家試圖重塑網(wǎng)絡(luò)搜索體驗(yàn)的初創(chuàng)公司。除了提供對(duì)查詢問題的深入解答外,它還會(huì)利用來(lái)自不同來(lái)源的信息,通過人工智能整合成完整的文章,報(bào)道當(dāng)天的新聞。
那天,它向我推送了一篇由埃里克施密特撰寫的關(guān)于一家新興無(wú)人機(jī)公司的報(bào)道。我立刻認(rèn)出了這篇文章。就在本周早些時(shí)候,《福布斯》曾獨(dú)家報(bào)道過這則新聞,但內(nèi)容是收費(fèi)的。Perplexity 推送的報(bào)道中配圖與之的一模一樣,文章的語(yǔ)言和結(jié)構(gòu)也極為相似。實(shí)際上,這幾乎是同一篇報(bào)道,只不過現(xiàn)在互聯(lián)網(wǎng)上的任何人都可以免費(fèi)閱讀。我給一位參與原始報(bào)道的編輯朋友發(fā)了短信,詢問《福布斯》是否與這家初創(chuàng)公司達(dá)成了內(nèi)容轉(zhuǎn)載協(xié)議。但答案是否定的。他對(duì)此感到震驚、憤怒,當(dāng)然也很困惑。而他并不是唯一有這種反應(yīng)的人。目前,《福布斯》、《紐約時(shí)報(bào)》和康泰納仕都已向 Perplexity 發(fā)出停止侵權(quán)的通知。新聞集團(tuán)更是提起訴訟,要求賠償由此帶來(lái)的損失。
人們擔(dān)心,這些由 LLM 驅(qū)動(dòng)的新技術(shù)將對(duì)我們共同認(rèn)知的基本現(xiàn)實(shí)產(chǎn)生深遠(yuǎn)影響,這可能預(yù)示著傳統(tǒng)權(quán)威答案時(shí)代的終結(jié)。
這正是出版商們最害怕的噩夢(mèng)場(chǎng)景:人工智能正在吸納他們精心制作的優(yōu)質(zhì)內(nèi)容,重新包裝后推送給用戶,而這種呈現(xiàn)方式幾乎不給讀者任何點(diǎn)擊原文的理由。事實(shí)上,Perplexity 在其“關(guān)于”頁(yè)面上列出的首要優(yōu)勢(shì)之一,正是“跳過鏈接”,直接提供答案。
然而,這個(gè)問題遠(yuǎn)不止影響出版商的利益,甚至也不僅關(guān)乎我個(gè)人的關(guān)注。
人們同樣擔(dān)心,這些由大型語(yǔ)言模型驅(qū)動(dòng)的新技術(shù)會(huì)對(duì)我們共同認(rèn)知的基本現(xiàn)實(shí)帶來(lái)怎樣的影響。大語(yǔ)言模型有編造信息的傾向它們可能生成看似真實(shí)卻毫無(wú)根據(jù)的內(nèi)容。此外,生成式人工智能可以針對(duì)同一個(gè)問題,每次都給出全然不同的答案,甚至?xí)鶕?jù)對(duì)不同用戶的理解,提供個(gè)性化的回應(yīng)。這種不確定性可能預(yù)示著傳統(tǒng)標(biāo)準(zhǔn)答案時(shí)代的終結(jié)。
但別誤會(huì),這正是搜索的未來(lái)。只要親自嘗試,你就會(huì)明白其中的不同。
當(dāng)然,我們?nèi)匀幌Mㄟ^搜索引擎瀏覽網(wǎng)頁(yè),發(fā)現(xiàn)新的、有趣的信息來(lái)源。但鏈接正在逐漸退居次要位置。人工智能能夠利用來(lái)自全網(wǎng)的實(shí)時(shí)數(shù)據(jù),為幾乎任何問題提供合理、直接的答案,這種方式帶來(lái)了更優(yōu)質(zhì)的用戶體驗(yàn)。尤其是相比近年來(lái)網(wǎng)絡(luò)搜索的發(fā)展趨勢(shì),這一變化顯得尤為明顯。如果說搜索引擎尚未完全失效,那么至少它變得更加混亂,信息導(dǎo)航也愈發(fā)困難。
誰(shuí)還愿意使用搜索引擎的傳統(tǒng)語(yǔ)言來(lái)查找信息?當(dāng)可以直接獲得答案時(shí),誰(shuí)還愿意逐個(gè)瀏覽鏈接?甚至更進(jìn)一步地想,當(dāng)答案觸手可及時(shí),誰(shuí)還愿意主動(dòng)學(xué)習(xí)?
最初的搜索工具是 Archie,這是第一個(gè)真正意義上的互聯(lián)網(wǎng)搜索引擎。它能夠抓取那些曾經(jīng)隱藏在遠(yuǎn)程服務(wù)器深處的文件,但它并不會(huì)告訴你這些文件的具體內(nèi)容,只是簡(jiǎn)單地列出文件名。它無(wú)法預(yù)覽圖片,沒有結(jié)果排序,甚至幾乎沒有界面。但這是一種突破性的開始,且表現(xiàn)得相當(dāng)不錯(cuò)。
隨后, Tim Berners-Lee 創(chuàng)造了萬(wàn)維網(wǎng),各種網(wǎng)頁(yè)如雨后春筍般涌現(xiàn)。Mosaic 主頁(yè)、互聯(lián)網(wǎng)電影數(shù)據(jù)庫(kù)、Geocities、Hampster Dance、Web Rings、Salon、eBay、CNN、聯(lián)邦政府網(wǎng)站,甚至還有來(lái)自土耳其某個(gè)人的個(gè)人主頁(yè),這些內(nèi)容豐富了互聯(lián)網(wǎng)的早期生態(tài)。
隨著網(wǎng)頁(yè)內(nèi)容的激增,我們漸漸發(fā)現(xiàn)自己無(wú)從下手。面對(duì)浩如煙海的信息,我們迫切需要一種更高效的方式來(lái)導(dǎo)航,真正找到所需的內(nèi)容。
于是,1994 年,楊致遠(yuǎn)創(chuàng)建了雅虎,一個(gè)基于網(wǎng)站分類目錄的導(dǎo)航平臺(tái)。它迅速成為數(shù)百萬(wàn)人的上網(wǎng)主頁(yè)。而且……確實(shí)還不錯(cuò)。坦白說,回頭來(lái)看,我們當(dāng)時(shí)可能覺得它比實(shí)際效果更好。
然而,互聯(lián)網(wǎng)仍在快速發(fā)展、擴(kuò)張,每天都有大量新信息涌入網(wǎng)絡(luò)。此時(shí),我們需要的不再是簡(jiǎn)單的按類別羅列網(wǎng)站,而是能夠真正全面查看和索引所有內(nèi)容的工具。到了 90 年代末,各類搜索引擎應(yīng)運(yùn)而生,用戶可以在 AltaVista、AlltheWeb、WebCrawler 和 HotBot 等平臺(tái)中自由選擇。這些搜索引擎的出現(xiàn)無(wú)疑是一次巨大的飛躍,至少在最初,它們確實(shí)讓信息檢索變得更加高效。
但隨著搜索引擎的興起,人們開始嘗試?yán)盟鼈儙?lái)的巨大流量。這些流量極具價(jià)值,網(wǎng)絡(luò)出版商依靠它來(lái)銷售廣告,零售商則借此吸引消費(fèi)者關(guān)注他們的產(chǎn)品。為了獲取更多曝光,有時(shí)網(wǎng)站會(huì)在頁(yè)面上堆砌大量關(guān)鍵詞或無(wú)意義的文字,僅僅是為了讓頁(yè)面在搜索結(jié)果中排名更靠前。這樣的做法帶來(lái)了糟糕的用戶體驗(yàn)。
直到谷歌的出現(xiàn),一切才發(fā)生了改變。1998 年,谷歌正式推出,其革命性影響不可言喻。谷歌不僅僅是掃描網(wǎng)頁(yè)內(nèi)容,它還分析哪些網(wǎng)站鏈接到某個(gè)頁(yè)面,以此判斷內(nèi)容的相關(guān)性。簡(jiǎn)單來(lái)說:一個(gè)內(nèi)容在其他網(wǎng)站被引用得越多,谷歌就越認(rèn)為它可靠,排名也會(huì)隨之上升。這一突破性的算法讓谷歌在提供相關(guān)搜索結(jié)果方面遠(yuǎn)超其他技術(shù)。
(來(lái)源:MIT Technology Review)
25 年來(lái),谷歌一直主導(dǎo)著搜索市場(chǎng)。對(duì)大多數(shù)人而言,谷歌幾乎就是搜索的代名詞。(谷歌的市場(chǎng)主導(dǎo)地位目前也正受到美國(guó)和歐盟多項(xiàng)法律調(diào)查的關(guān)注。)
然而,谷歌首席搜索科學(xué)家 Pandu Nayak 指出,谷歌早已不再只是提供一串藍(lán)色鏈接。
“搜索結(jié)果不僅包括傳統(tǒng)的網(wǎng)頁(yè)鏈接,還有圖片、視頻和新聞的特別內(nèi)容。我們提供直接答案、詞典釋義、體育賽事結(jié)果、知識(shí)圖譜相關(guān)的信息,以及精選摘要等功能。”他說。同時(shí)他還列舉了谷歌多年來(lái)為更高效、直接地回答用戶問題所采取的一系列創(chuàng)新舉措。
確實(shí)如此,谷歌隨著時(shí)間的推移不斷演變,越來(lái)越像一個(gè)集成的問答平臺(tái)。它不斷增加各種工具,讓用戶可以直接獲取答案無(wú)論是比賽的實(shí)時(shí)比分、咖啡館的營(yíng)業(yè)時(shí)間,還是來(lái)自 FDA 網(wǎng)站的內(nèi)容片段而不必跳轉(zhuǎn)到可能包含答案的其他網(wǎng)站。
但一旦你使用過 AI 概覽,就會(huì)立刻意識(shí)到它與以往的功能截然不同。
以精選摘要為例,谷歌有時(shí)會(huì)從網(wǎng)頁(yè)中提取一段內(nèi)容,并將其突出顯示在搜索結(jié)果的頂部。這些內(nèi)容是直接引用自原始來(lái)源的。而知識(shí)面板也是如此,它們依托于公共數(shù)據(jù)庫(kù)和谷歌的知識(shí)圖譜生成,后者儲(chǔ)存了數(shù)萬(wàn)億條關(guān)于世界各類事實(shí)的信息。
盡管這些信息可能存在不準(zhǔn)確之處,但它們的來(lái)源是明確的,也是可追溯和可修正的。這些數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中,用戶可以自行查證。然而,如今的情況已經(jīng)發(fā)生了變化:AI 概覽每次生成的內(nèi)容都是全新的,基于大語(yǔ)言模型的文本預(yù)測(cè)與網(wǎng)絡(luò)索引動(dòng)態(tài)結(jié)合而成。
“我認(rèn)為這是一個(gè)激動(dòng)人心的時(shí)刻。我們顯然已經(jīng)完成了對(duì)世界的索引,并在此基礎(chǔ)上通過知識(shí)圖譜建立了深刻的理解。我們一直在利用大型語(yǔ)言模型和生成式人工智能來(lái)加深對(duì)這些內(nèi)容的把握!盨undar Pichai 在接受 MIT Technology Review 采訪時(shí)表示,“但現(xiàn)在,我們能夠利用它進(jìn)行內(nèi)容生成和創(chuàng)作!
因此,搜索體驗(yàn)不再像是在查詢一個(gè)數(shù)據(jù)庫(kù),而更像是在向一位非常聰明、博覽群書的“朋友”請(qǐng)教問題。不過需要注意的是,這位“朋友”如果不知道答案,有時(shí)也會(huì)隨口編造一些內(nèi)容。
“我們的使命是整合全球信息!惫雀杷阉髦鞴 Liz Reid 在加利福尼亞州山景城總部對(duì)我說道,“但實(shí)際上,有很長(zhǎng)一段時(shí)間,我們所做的只是整理網(wǎng)頁(yè)。這與整合全球信息或讓信息真正有用、可供訪問并不是一回事!
這個(gè)“可訪問性”的概念正是谷歌在 AI 概覽中真正關(guān)注的重點(diǎn)。在與谷歌高管的對(duì)話中,這一觀點(diǎn)反復(fù)被提及:通過引入語(yǔ)言模型來(lái)輔助提供答案,谷歌能夠更有效地處理更復(fù)雜、更開放式的查詢,而且可以通過自然語(yǔ)言來(lái)完成。
這種能力對(duì)于未來(lái)的搜索體驗(yàn)至關(guān)重要,尤其是在搜索方式逐漸超越文本查詢的趨勢(shì)下。例如,Google Lens 允許用戶通過拍照或上傳圖片來(lái)獲取更多信息,它會(huì)利用人工智能生成的答案來(lái)解釋你所看到的內(nèi)容。谷歌甚至已經(jīng)展示了對(duì)實(shí)時(shí)視頻進(jìn)行查詢的技術(shù)能力,這進(jìn)一步拓寬了信息獲取的方式。
當(dāng)沒有確切答案時(shí),人工智能模型依然可能自信地給出看似權(quán)威的回答。對(duì)于谷歌而言,這可能是一個(gè)嚴(yán)峻的問題,畢竟在過去 20 年里,谷歌一直以可靠性著稱,而對(duì)我們其他人來(lái)說,這種情況甚至可能帶來(lái)真正的風(fēng)險(xiǎn)。
正如 Sundar Pichai 所說:“我們無(wú)疑正處于一段旅程的起點(diǎn)。相比過去十年,人們將能夠提出更復(fù)雜的問題并獲得答案!
然而,這種進(jìn)步伴隨著潛在的危險(xiǎn)。最關(guān)鍵的一點(diǎn)是:大型語(yǔ)言模型可能會(huì)誤導(dǎo)用戶。它們會(huì)產(chǎn)生“幻覺”,生成錯(cuò)誤或虛假的信息。當(dāng)沒有準(zhǔn)確答案時(shí),人工智能模型仍可能輕率而自信地提供看似合理的回應(yīng)。這不僅對(duì)谷歌構(gòu)成挑戰(zhàn),也對(duì)所有依賴這些技術(shù)的人帶來(lái)了不小的風(fēng)險(xiǎn)。
2024 年 5 月,AI 概覽在全美范圍內(nèi)推出,但效果并不理想。長(zhǎng)期以來(lái)一直被視為全球“咨詢臺(tái)”的谷歌,竟然向用戶建議吃石頭、在披薩上涂膠水等荒謬的答案。這些回應(yīng)大多源于所謂的“對(duì)抗性查詢”用戶刻意設(shè)計(jì)的問題,目的是讓谷歌出錯(cuò)。然而,無(wú)論原因如何,這些結(jié)果都顯得不盡如人意。
對(duì)此,谷歌迅速采取了補(bǔ)救措施,例如停止引用來(lái)自 Reddit 等網(wǎng)站的用戶生成內(nèi)容,因?yàn)橐恍╇x奇的答案正是來(lái)源于這些平臺(tái)。
盡管建議吃石頭的荒唐錯(cuò)誤引發(fā)了廣泛關(guān)注,但更具潛在危害的是那些不太明顯的錯(cuò)誤。例如,在為這篇文章做研究時(shí),我詢問谷歌 MIT Technology Review 是什么時(shí)候創(chuàng)刊的。谷歌很“自信”地回答:“ MIT Technology Review 將于 2022 年底上線!边@個(gè)錯(cuò)誤對(duì)我來(lái)說顯而易見,但對(duì)于一個(gè)對(duì)這份出版物毫不了解的人來(lái)說,這樣的信息可能不會(huì)引起懷疑。
我在谷歌和 OpenAI 的 ChatGPT 搜索中都遇到過類似的例子。這些回答雖然偏離事實(shí),卻不足以立即被識(shí)別為錯(cuò)誤。谷歌希望,隨著時(shí)間的推移,它能夠依靠對(duì)優(yōu)質(zhì)信息來(lái)源的持續(xù)優(yōu)化,逐步改善這些問題。
“當(dāng)生成 AI 概覽時(shí),我們會(huì)從搜索結(jié)果中提取確鑿的信息,并盡可能確保這些結(jié)果來(lái)源于可靠渠道。這些機(jī)制的實(shí)施,旨在確保即使用戶只是瀏覽 AI 概覽而不深入點(diǎn)擊,我們也希望他們能獲得可靠、值得信賴的答案。”Pandu Nayak 表示。
然而,在之前提到的案例中,谷歌錯(cuò)誤地回答 MIT Technology Review 將于 2022 年底上線,這一錯(cuò)誤信息似乎源于一篇關(guān)于該出版物電子郵件通訊的報(bào)道而該通訊確實(shí)于 2022 年推出。但大模型從根本上誤解了這條信息。這正是谷歌依靠人工評(píng)估者來(lái)檢測(cè)其搜索結(jié)果準(zhǔn)確性的原因之一。盡管評(píng)分并不會(huì)直接糾正或控制某條 AI 概覽的內(nèi)容,但它們有助于訓(xùn)練模型生成更準(zhǔn)確的答案。不過,人類評(píng)分者也有可能出錯(cuò),谷歌正在積極解決這一問題。
Nayak 解釋道:“觀察實(shí)驗(yàn)結(jié)果的評(píng)估者可能不會(huì)發(fā)現(xiàn)模型的幻覺(錯(cuò)誤信息),因?yàn)樗犉饋?lái)很自然。所以在評(píng)估設(shè)置上必須下功夫,確保當(dāng)模型產(chǎn)生幻覺時(shí),有人能夠識(shí)別出來(lái)并指出問題。
新的搜索
谷歌已將其 AI 概覽推廣至全球 100 多個(gè)國(guó)家,覆蓋超過 10 億用戶。然而,它正面臨來(lái)自新興企業(yè)的激烈競(jìng)爭(zhēng),這些公司正在重新思考搜索引擎的運(yùn)作方式。
(來(lái)源:MIT Technology Review)
當(dāng)我與 Sundar Pichai 談?wù)撨@一問題時(shí),他對(duì)谷歌在使用 LLM 生成響應(yīng)的同時(shí)仍能保持準(zhǔn)確性表現(xiàn)出樂觀態(tài)度。這是因?yàn)?AI 概覽不僅依托于谷歌的旗艦大型語(yǔ)言模型 Gemini,還融合了知識(shí)圖譜以及谷歌認(rèn)為在網(wǎng)絡(luò)上具有高信譽(yù)度的信息來(lái)源。
Pichai 表示:“這始終是一個(gè)概率問題。我們所做的是在可信度、真實(shí)性和質(zhì)量方面達(dá)到我所謂的幾個(gè)‘九’標(biāo)準(zhǔn)。我會(huì)說是 99.5% 的可靠性。我認(rèn)為這就是我們始終堅(jiān)持的標(biāo)準(zhǔn),AI 概覽也不例外!彼a(bǔ)充道,“問題在于,我們是否能夠再次在大規(guī)模上做到這一點(diǎn)?我相信我們可以!
然而,還有一種潛在風(fēng)險(xiǎn):用戶會(huì)向谷歌提出各種奇怪甚至敏感的問題。正如有人說的,如果你想了解一個(gè)人最隱秘的秘密,只需查看他們的搜索歷史。有時(shí),人們會(huì)搜索內(nèi)容非常陰暗,甚至涉及非法信息。對(duì)于谷歌來(lái)說,挑戰(zhàn)不僅在于在用戶需要幫助時(shí)準(zhǔn)確地提供答案,更在于在面對(duì)可能帶來(lái)危害的查詢時(shí)謹(jǐn)慎行事,避免通過 AI 概覽生成潛在有害的信息。
“如果你問‘我該如何制造炸彈?’,搜索結(jié)果中可能會(huì)有相關(guān)內(nèi)容,因?yàn)檫@是一個(gè)開放的網(wǎng)絡(luò),任何人都可以訪問各種信息。”谷歌搜索主管 Liz Reid 表示,“但我們不需要一個(gè) AI 概覽來(lái)告訴你如何制造炸彈,對(duì)吧?我們認(rèn)為這根本不值得提供!
然而,對(duì)于依賴谷歌搜索流量的下游用戶而言,真正的風(fēng)險(xiǎn)可能就在他們自身。以出版商為例,幾十年來(lái),他們一直依靠搜索引擎將用戶引導(dǎo)至自己的網(wǎng)站。如果用戶在搜索結(jié)果頁(yè)面就能獲得所有想要的信息,他們還有什么理由點(diǎn)擊進(jìn)入原始來(lái)源呢?
市場(chǎng)研究公司 SparkToro 的聯(lián)合創(chuàng)始人 Rand Fishkin 對(duì)所謂的“零點(diǎn)擊搜索”進(jìn)行了研究。隨著谷歌越來(lái)越多地直接提供答案,用戶無(wú)需點(diǎn)擊鏈接即可滿足需求的搜索比例不斷上升。菲什金認(rèn)為,AI 概覽將進(jìn)一步加劇這一趨勢(shì)。
他表示:“如果你的業(yè)務(wù)依賴谷歌帶來(lái)的流量,并且這種流量是業(yè)務(wù)增長(zhǎng)的關(guān)鍵動(dòng)力,那么你會(huì)在短期和長(zhǎng)期都陷入困境!
“不要驚慌。”這是 Sundar Pichai 傳達(dá)的信息。他認(rèn)為即便在 AI 概覽的時(shí)代,人們?nèi)匀幌Mc(diǎn)擊鏈接,深入探索各種類型的信息搜索。
“基本原則是,人們來(lái)這里是為了尋找信息。他們并不總是期望谷歌直接給出答案!盤ichai 說,“有時(shí)候是這樣,但在絕大多數(shù)情況下,搜索只是一個(gè)起點(diǎn)!
與此同時(shí),谷歌搜索主管 Liz Reid 認(rèn)為,AI 概覽能夠幫助用戶提出更復(fù)雜的問題,進(jìn)一步深入了解他們真正需要的信息。這種能力甚至可能對(duì)某些出版商和小型企業(yè)有所幫助,尤其是那些專注于利基市場(chǎng)的內(nèi)容創(chuàng)作者和公司。她解釋道:“你實(shí)際上能夠接觸到新的受眾,因?yàn)槿藗儸F(xiàn)在可以更具體地表達(dá)他們的需求,這樣專業(yè)領(lǐng)域的從業(yè)者就不需要在通用查詢中與大型網(wǎng)站競(jìng)爭(zhēng)排名!
與此同時(shí),OpenAI 的產(chǎn)品負(fù)責(zé)人 Nick Turley 在一次 Zoom 會(huì)議上展示了即將推出的 ChatGPT 網(wǎng)絡(luò)搜索工具時(shí)說道:“我要從一件有風(fēng)險(xiǎn)的事情開始!彼姓J(rèn)自己通常會(huì)提前做準(zhǔn)備,但這次決定直接幫我現(xiàn)場(chǎng)搜索。“這總是一個(gè)高風(fēng)險(xiǎn)的演示,因?yàn)槿藗兺ǔ?huì)對(duì)互聯(lián)網(wǎng)上關(guān)于他們的信息很敏感!
他在搜索框中輸入了我的名字,原型搜索引擎隨即返回了幾句話,類似于演講者的簡(jiǎn)歷。它準(zhǔn)確識(shí)別了我的身份和當(dāng)前角色,甚至突出顯示了我?guī)啄昵白珜懙囊黄赡苁俏易钪奈恼。?jiǎn)而言之,這次的回答是正確的。
幾周后,OpenAI 將搜索功能正式整合進(jìn)了 ChatGPT,利用來(lái)自網(wǎng)絡(luò)的信息來(lái)豐富語(yǔ)言模型生成的答案。如果模型判斷回答會(huì)因最新信息而更完整,它會(huì)自動(dòng)進(jìn)行網(wǎng)絡(luò)搜索,并將檢索到的內(nèi)容整合到回應(yīng)中,同時(shí)提供相關(guān)鏈接,方便用戶深入了解。如果模型沒有主動(dòng)搜索,用戶也可以選擇手動(dòng)觸發(fā)網(wǎng)絡(luò)搜索。雖然 Open AI 沒有透露有多少用戶正在使用其網(wǎng)絡(luò)搜索功能,但它表示,ChatGPT 每周大約有 2.5 億用戶,所有人都有可能接觸到這一功能。
“網(wǎng)絡(luò)上的內(nèi)容量極其龐大,許多信息都是實(shí)時(shí)更新的。你當(dāng)然希望ChatGPT能夠利用這些最新的信息來(lái)優(yōu)化答案,成為你更強(qiáng)大的超級(jí)助手。”
OpenAI 首席產(chǎn)品官 Kevin Weil
Rand Fishkin 表示,這些新型人工智能輔助搜索目前尚未對(duì)谷歌的搜索主導(dǎo)地位構(gòu)成真正威脅!八坪醪]有侵蝕傳統(tǒng)網(wǎng)絡(luò)搜索的市場(chǎng)份額!彼f。
盡管 OpenAI 聲稱并不打算在搜索領(lǐng)域與谷歌直接競(jìng)爭(zhēng)坦白說,這聽起來(lái)更像是在管理外界的期望但實(shí)際上,它的策略已經(jīng)有些接近。OpenAI 解釋說,網(wǎng)絡(luò)搜索主要是用來(lái)補(bǔ)充語(yǔ)言模型的知識(shí)庫(kù),因?yàn)槟P偷臄?shù)據(jù)通常有時(shí)間限制,可能是幾個(gè)月甚至更久以前的信息。因此,雖然 ChatGPT 可能擅長(zhǎng)解釋復(fù)雜概念,比如西海岸進(jìn)攻戰(zhàn)術(shù)的運(yùn)作方式,但它長(zhǎng)期以來(lái)都無(wú)法告訴用戶舊金山 49 人隊(duì)的最新比分,F(xiàn)在,這個(gè)局限已經(jīng)被打破。
OpenAI 首席產(chǎn)品官 Kevin Weil 表示:“我一直在思考,我們?nèi)绾巫?ChatGPT 能夠回答你提出的每一個(gè)問題?我們?nèi)绾巫屗谀愕娜粘I钪凶兊酶佑杏茫窟@正是搜索的意義所在。”他補(bǔ)充道:“網(wǎng)絡(luò)上的信息量驚人,很多事情都在實(shí)時(shí)發(fā)生。你當(dāng)然希望 ChatGPT 能夠利用這些實(shí)時(shí)信息來(lái)改進(jìn)答案,成為你更強(qiáng)大、更貼心的超級(jí)助手!
如今,ChatGPT 已能夠針對(duì)時(shí)事新聞、股票價(jià)格等幾乎實(shí)時(shí)的信息生成響應(yīng)。盡管 ChatGPT的界面一直相對(duì)簡(jiǎn)潔,但整合的搜索結(jié)果卻為用戶帶來(lái)了豐富的多媒體內(nèi)容包括圖像、圖表,甚至視頻。這種信息呈現(xiàn)方式與傳統(tǒng)的對(duì)話體驗(yàn)相比,顯得更加多樣化,也帶來(lái)了截然不同的用戶體驗(yàn)。
OpenAI 首席產(chǎn)品官 Kevin Weil 認(rèn)為,與谷歌等競(jìng)爭(zhēng)對(duì)手相比,ChatGPT 在創(chuàng)新和自主性方面擁有更大的空間,甚至比其合作伙伴微軟的 Bing 還要自由。谷歌和 Bing 都依賴廣告業(yè)務(wù)來(lái)盈利,而 OpenAI 并不依賴廣告。OpenAI 的收入主要來(lái)自直接使用其產(chǎn)品的開發(fā)者、企業(yè)和個(gè)人用戶。盡管如此,OpenAI 仍處于高額投入階段。據(jù)一些報(bào)道,到 2026 年,OpenAI 預(yù)計(jì)將虧損高達(dá) 140 億美元。
不過,OpenAI 有一個(gè)優(yōu)勢(shì):它無(wú)需像谷歌那樣在搜索結(jié)果中插入廣告。這讓它能夠更專注于優(yōu)化用戶體驗(yàn)和信息質(zhì)量,而不是平衡廣告收入與用戶需求之間的矛盾。
(來(lái)源:MIT Technology Review)
與谷歌類似,ChatGPT 同樣從網(wǎng)絡(luò)出版商處收集信息,進(jìn)行總結(jié)并整合到其答案中。但不同的是,OpenAI 還與部分出版商達(dá)成了財(cái)務(wù)協(xié)議,允許其獲取內(nèi)容并將這些信息納入生成結(jié)果中。
然而,問題在于,為了實(shí)現(xiàn) OpenAI 所設(shè)想的比語(yǔ)言模型更實(shí)時(shí)、更新更快的搜索體驗(yàn),ChatGPT 仍需從各種出版商和未建立合作關(guān)系的信息來(lái)源獲取數(shù)據(jù)。對(duì)此,OpenAI 的媒體合作負(fù)責(zé)人 Varun Shetty 向 MIT Technology Review 表示,OpenAI 不會(huì)對(duì)其合作的出版商給予任何特殊待遇。
OpenAI 解釋稱,模型會(huì)根據(jù)具體查詢,從網(wǎng)絡(luò)中篩選出最值得信賴、最有用的來(lái)源?蛇@也會(huì)帶來(lái)一些奇怪的結(jié)果。例如,當(dāng) OpenAI 產(chǎn)品負(fù)責(zé)人 Nick Turley 演示名字搜索功能時(shí),ChatGPT 提到了我多年前為 Wired 撰寫的一篇關(guān)于黑客攻擊的文章,這篇文章至今仍是我最廣泛閱讀的作品之一。但 ChatGPT 并沒有鏈接到 Wired 的原始報(bào)道,而是鏈接到了 The Verge 對(duì)該文章的簡(jiǎn)短改寫版。
當(dāng)我向他詢問為何模型會(huì)選擇特定來(lái)源時(shí),他并不能給出明確的解釋,因?yàn)檫@些選擇完全是模型自主做出的。公司可以通過識(shí)別他們認(rèn)為更優(yōu)質(zhì)的答案來(lái)引導(dǎo)模型改進(jìn),但最終的決策仍然由模型本身完成。
“而且在很多情況下,它會(huì)出錯(cuò),這正是我們正在努力改進(jìn)的地方,”O(jiān)penAI 產(chǎn)品負(fù)責(zé)人 Nick Turley 說道!皩⒛P椭苯尤谌胨阉鞣答佈h(huán)中,這是一種與傳統(tǒng)搜索引擎截然不同的工作機(jī)制。”
確實(shí)如此!無(wú)論 OpenAI 的 GPT-4o、谷歌的 Gemini,還是 Anthropic 的 Claude,這些大型語(yǔ)言模型都在解釋復(fù)雜問題方面表現(xiàn)得非常出色。但它們?yōu)楹芜x擇某個(gè)特定來(lái)源、如何篩選信息,甚至如何組織和表達(dá)答案,這些背后的邏輯依然非常神秘。當(dāng)然,這些模型能夠解釋很多復(fù)雜的概念,但當(dāng)涉及到解釋它們自己如何得出答案時(shí),它們往往無(wú)法給出清晰的解釋。
大約十年前,也就是 2016 年,谷歌首席執(zhí)行官Sundar Pichai曾寫道,谷歌正從“移動(dòng)優(yōu)先”轉(zhuǎn)向“AI 優(yōu)先”的戰(zhàn)略。他預(yù)測(cè):“在未來(lái) 10 年,我們將邁入一個(gè)以人工智能為中心的世界。計(jì)算將無(wú)處不在無(wú)論是在家中、工作場(chǎng)所、車?yán)镞是旅途中與所有這些設(shè)備和界面的互動(dòng)將變得更加自然和直觀,更重要的是,更加智能!
如今,這一愿景正逐步成為現(xiàn)實(shí),但人工智能在信息篩選和呈現(xiàn)方式上仍存在許多不確定性和亟待解決的問題。
我們已經(jīng)接近那個(gè)未來(lái)幾乎觸手可及。這是一個(gè)既熟悉又陌生的階段,且只會(huì)變得更加復(fù)雜和奇異。尤其值得注意的是,原本看似截然不同的行為和需求正逐漸融合:查詢搜索引擎、向模型發(fā)出提示、查找我們拍攝的照片、決定我們想閱讀、觀看或聆聽的內(nèi)容,甚至請(qǐng)求查看那些我們從未拍攝但依然渴望看到的照片。所有這些體驗(yàn)正在悄然交匯。
我們現(xiàn)在從生成式人工智能中得到的搜索結(jié)果,更應(yīng)被視為一個(gè)起點(diǎn),而非終點(diǎn)。也許,真正重要的已經(jīng)不再是“搜索”本身,而是搜索為人工智能模型開發(fā)者提供了一條將實(shí)時(shí)信息融入輸入和輸出的路徑。這一變化開啟了無(wú)限的可能性,預(yù)示著人工智能將更加深入地融入我們的日常生活,塑造我們獲取、理解和互動(dòng)信息的方式。
OpenAI 的首席產(chǎn)品官 Kevin Weil 表示:“能夠理解和訪問互聯(lián)網(wǎng)的 ChatGPT 不再只是總結(jié)搜索結(jié)果。它可能會(huì)主動(dòng)為你完成某些任務(wù)。我認(rèn)為這是一個(gè)非常令人興奮的未來(lái)。你可以想象,這個(gè)模型能夠?yàn)槟泐A(yù)訂航班、下單點(diǎn)餐,甚至在未來(lái)自動(dòng)完成各種日常任務(wù)。一旦模型學(xué)會(huì)如何有效地使用互聯(lián)網(wǎng),它就會(huì)變得不可或缺!
這正是人們長(zhǎng)期以來(lái)談?wù)摰?Agentic Future:人工智能模型通過實(shí)時(shí)獲取和處理互聯(lián)網(wǎng)數(shù)據(jù),正逐步接近全面實(shí)現(xiàn)這一愿景。
想象一下,幾周后你即將出行。一個(gè)實(shí)時(shí)聯(lián)網(wǎng)的 AI 智能體可以根據(jù)對(duì)你個(gè)人偏好和行程安排的理解,自動(dòng)預(yù)訂航班、酒店,甚至提前安排好餐廳預(yù)約,整個(gè)過程無(wú)需你的干預(yù)。另一個(gè) AI 智能體可能實(shí)時(shí)監(jiān)測(cè)你家中的污水系統(tǒng),檢測(cè)潛在的健康風(fēng)險(xiǎn),并自動(dòng)為你預(yù)約體檢和治療。再比如,你無(wú)需費(fèi)心搜索汽車發(fā)出的奇怪噪音,因?yàn)槟愕能囕d AI 智能體已經(jīng)識(shí)別出問題并幫你預(yù)約了維修服務(wù)。
正如 Sundar Pichai 所說:“人工智能并不總是只是搜索并給出答案。有時(shí),它會(huì)主動(dòng)采取行動(dòng)。有時(shí),你會(huì)直接在現(xiàn)實(shí)世界中與它互動(dòng)。這一切都體現(xiàn)了‘普遍援助’的理念!
與此同時(shí),這些設(shè)備提供答案的方式也在快速演變。例如,今天的谷歌不僅能夠搜索文本、圖片,甚至是視頻內(nèi)容,它還可以生成這些內(nèi)容。想象一下,如果這種能力與多種格式和設(shè)備的搜索功能相結(jié)合,將會(huì)帶來(lái)怎樣的體驗(yàn)。比如,你可以說:“告訴我眼前樹上的湯氏鶯長(zhǎng)什么樣!被蛘甙l(fā)出更復(fù)雜的請(qǐng)求:“用我現(xiàn)有的家庭照片和視頻,制作一部關(guān)于我們明年前往波多黎各度假的電影預(yù)告片,別忘了包含我們要參觀的所有頂級(jí)餐廳和地標(biāo)景點(diǎn)!
Sundar Pichai 提到:“我們目前主要在輸入端進(jìn)行這方面的工作!彼傅氖枪雀枘壳霸趫D像和視頻搜索上的能力!暗阋部梢韵胂螅谳敵龆送瑯訒(huì)有這樣的發(fā)展!
谷歌已經(jīng)通過 NotebookLM 展示了這類未來(lái)體驗(yàn)的雛形。這款工具允許用戶上傳大量文本,并將其轉(zhuǎn)換成對(duì)話形式的播客內(nèi)容。他設(shè)想,這種將一種輸入轉(zhuǎn)化為多種輸出的能力,未來(lái)將徹底改變?nèi)藗兣c信息互動(dòng)的方式。
在今年夏天的開發(fā)者大會(huì)上,谷歌展示了一款名為 Project Astra 的工具,這標(biāo)志著人工智能與現(xiàn)實(shí)世界互動(dòng)的一次重大突破。這款工具利用手機(jī)和智能眼鏡內(nèi)置的攝像頭和麥克風(fēng),能夠?qū)崟r(shí)理解用戶周圍的一切環(huán)境無(wú)論是在線還是離線,是聲音還是視覺信息。Astra 不僅可以感知環(huán)境,還能以多種方式回憶并回應(yīng)用戶的需求。
例如,Astra 可以掃描一張一級(jí)方程式賽車的草圖,不僅準(zhǔn)確識(shí)別賽車模型,還能詳細(xì)解釋其各個(gè)部件的功能和用途。
但可以想象,這種技術(shù)未來(lái)會(huì)發(fā)展得更加先進(jìn)。設(shè)想一下,如果我想觀看一段關(guān)于如何修理自行車的視頻,但這段視頻并不存在。理論上,基于人工智能輔助生成搜索,Astra 可以在互聯(lián)網(wǎng)的各個(gè)角落提取相關(guān)信息,并即時(shí)生成一段教程視頻,向我演示如何進(jìn)行修理,就像今天它可以用文字為我解釋問題一樣。
當(dāng)你將整個(gè)人類知識(shí)體系那些曾經(jīng)因語(yǔ)言和格式而彼此隔離的內(nèi)容,如地圖、商業(yè)注冊(cè)信息、產(chǎn)品 SKU、音頻、視頻、數(shù)字?jǐn)?shù)據(jù)庫(kù)、舊書、圖片,甚至所有曾被出版、追蹤和記錄的信息匯集進(jìn)一個(gè)模型中時(shí),新的可能性便開始顯現(xiàn)。這個(gè)模型或許無(wú)法完全準(zhǔn)確地理解所有信息,但它具備整合、重組并以各種方式重新呈現(xiàn)這些內(nèi)容的能力,力求為用戶提供有用的答案。這種能力,遠(yuǎn)遠(yuǎn)超越了傳統(tǒng)的索引方式。
這正是我們即將面對(duì)的現(xiàn)實(shí),也即將親眼所見的未來(lái)。隨著谷歌將這種技術(shù)推向數(shù)十億用戶,許多人將首次體驗(yàn)與對(duì)話式人工智能的互動(dòng)。這將帶來(lái)什么樣的影響?我們將如何改變獲取和使用信息的方式?一切都在快速發(fā)展,變化正在加速。堅(jiān)持住,緊跟變化的步伐。
原文鏈接:
https://www.technologyreview.com/2025/01/06/1108679/ai-generative-search-internet-breakthroughs/