展會信息港展會大全

分析師的黃昏?OpenAI推出AI Agent“深度研究”,主打“金融、科學(xué)、政策和工程等領(lǐng)域”
來源:互聯(lián)網(wǎng)   發(fā)布日期:2025-02-04 15:32:55   瀏覽:311次  

導(dǎo)讀:本文作者:蔣紫涵來源:硬AIOpenAI推出AI Agent“深度研究”,分析師要失業(yè)了?當(dāng)?shù)貢r間2月2日,OpenAI在直播中宣布推出一款全新的AI代理(AI agent),名稱叫做“深度研究”(Deep Research),旨在幫助用戶利用ChatGPT進(jìn)行深入、復(fù)雜的研究。OpenAI表示,該功能專為“在金融、科學(xué)、政策和工程等領(lǐng)域從事高強(qiáng)度知識工作的人員”設(shè)計,提供全面、精準(zhǔn)、可靠的研究支持,并且, ......

本文作者:蔣紫涵

來源:硬AI

OpenAI推出AI Agent“深度研究”,分析師要失業(yè)了?

當(dāng)?shù)貢r間2月2日,OpenAI在直播中宣布推出一款全新的AI代理(AI agent),名稱叫做“深度研究”(Deep Research),旨在幫助用戶利用ChatGPT進(jìn)行深入、復(fù)雜的研究。

分析師的黃昏?OpenAI推出AI Agent“深度研究”,主打“金融、科學(xué)、政策和工程等領(lǐng)域”

OpenAI表示,該功能專為“在金融、科學(xué)、政策和工程等領(lǐng)域從事高強(qiáng)度知識工作的人員”設(shè)計,提供全面、精準(zhǔn)、可靠的研究支持,并且,該功能同樣適用于需要進(jìn)行細(xì)致調(diào)研的大宗消費(fèi)決策,例如汽車、家電、家具購買等。

簡單來說,ChatGPT的“深度研究”功能適用于那些不只想要快速獲取答案或摘要,而是需要綜合考慮多個網(wǎng)站及其他信息來源,不斷深入挖掘直到找到最合適的答案的任務(wù)。

分析師的黃昏?OpenAI推出AI Agent“深度研究”,主打“金融、科學(xué)、政策和工程等領(lǐng)域”

Altman寫道:

“它可以去互聯(lián)網(wǎng),做復(fù)雜的研究和推理,然后給你一份報告。它真的很好,可以完成需要數(shù)小時/數(shù)天且花費(fèi)數(shù)百美元的任務(wù)!

“它計算量很大且速度很慢,但它是第一個可以執(zhí)行如此廣泛復(fù)雜、有價值的任務(wù)的AI系統(tǒng)!

分析師的黃昏?OpenAI推出AI Agent“深度研究”,主打“金融、科學(xué)、政策和工程等領(lǐng)域”

對此,網(wǎng)友們躍躍欲試,有人“已經(jīng)準(zhǔn)備好使用它了”,還有人自報賬號請求先一步用上ChatGPT的“深度研究”功能:

分析師的黃昏?OpenAI推出AI Agent“深度研究”,主打“金融、科學(xué)、政策和工程等領(lǐng)域”

分析師的黃昏?OpenAI推出AI Agent“深度研究”,主打“金融、科學(xué)、政策和工程等領(lǐng)域”

也有人提出疑問,ChatGPT的“深度研究”功能比谷歌的“深度研究”功能更強(qiáng)嗎?會不會存在隱私問題?能不能把報告中每句話的首字母大寫?

分析師的黃昏?OpenAI推出AI Agent“深度研究”,主打“金融、科學(xué)、政策和工程等領(lǐng)域”

分析師的黃昏?OpenAI推出AI Agent“深度研究”,主打“金融、科學(xué)、政策和工程等領(lǐng)域”

分析師的黃昏?OpenAI推出AI Agent“深度研究”,主打“金融、科學(xué)、政策和工程等領(lǐng)域”

限定發(fā)布,未來將拓展至更多用戶

Altman表示,ChatGPT的“深度研究”功能目前僅向ChatGPT Pro訂閱用戶開放,每月限額100次查詢,隨后將逐步推廣至Plus和Team用戶,最終擴(kuò)展至企業(yè)級(Enterprise)用戶。預(yù)計Plus版本將在約一個月后推出,并且未來付費(fèi)用戶的查詢限制將“顯著提高”。

分析師的黃昏?OpenAI推出AI Agent“深度研究”,主打“金融、科學(xué)、政策和工程等領(lǐng)域”

對此,許多網(wǎng)友表示,200美元/月的ChatGPT Pro訂閱費(fèi)用太貴了:

不是免費(fèi)的誰在意啊。

分析師的黃昏?OpenAI推出AI Agent“深度研究”,主打“金融、科學(xué)、政策和工程等領(lǐng)域”

還有網(wǎng)友猜測道,等之后實(shí)現(xiàn)了AGI,是不是要每月收取2000美金,限額使用10次?

分析師的黃昏?OpenAI推出AI Agent“深度研究”,主打“金融、科學(xué)、政策和工程等領(lǐng)域”

其實(shí),Altman表示,免費(fèi)用戶也能使用,但額度非常少。

分析師的黃昏?OpenAI推出AI Agent“深度研究”,主打“金融、科學(xué)、政策和工程等領(lǐng)域”

需要注意的是,“深度研究”功能目前僅在特定地區(qū)推出,OpenAI尚未公布該功能何時向英國、瑞士及歐洲經(jīng)濟(jì)區(qū)(EEA)用戶開放。

目前,ChatGPT 深度研究的輸出僅限于文本格式。不過,OpenAI計劃在未來增加嵌入式圖像、數(shù)據(jù)可視化及其他“分析型”輸出。此外,OpenAI還表示,未來將支持接入“更多專業(yè)化的數(shù)據(jù)源”,包括“訂閱制”數(shù)據(jù)庫和內(nèi)部資源。

研究精度如何?AI仍存局限

分析師要大面積失業(yè)了嗎?關(guān)鍵在于,ChatGPT“深度研究”功能的精準(zhǔn)度能否滿足專業(yè)研究需求?畢竟,AI并不完美,仍然存在“幻覺”(hallucination)問題,即生成錯誤或虛假信息的可能性。

考慮到這一點(diǎn),OpenAI透露,每次深度研究的輸出都將“完整記錄,附帶清晰的引用來源及推理摘要,便于用戶參考和驗(yàn)證信息”。

不過,分析認(rèn)為,這一舉措是否足以避免AI誤導(dǎo)用戶仍待觀察此前,OpenAI在ChatGPT內(nèi)推出的AI搜索功能(ChatGPT Search)已被曝出存在錯誤回答的問題。TechCrunch評測發(fā)現(xiàn),ChatGPT Search在某些查詢上甚至不如谷歌搜索可靠。

增強(qiáng)精準(zhǔn)度:使用專門優(yōu)化的o3版本AI模型

為了提高深度研究的準(zhǔn)確性,OpenAI采用了一種特殊版本的o3“推理”AI 模型,該模型經(jīng)過強(qiáng)化學(xué)習(xí)(reinforcement learning)訓(xùn)練,專門針對“需要使用瀏覽器和Python工具的實(shí)際任務(wù)”。

OpenAI表示,該版本的o3模型“針對網(wǎng)頁瀏覽和數(shù)據(jù)分析進(jìn)行了優(yōu)化”,可以“利用推理能力搜索、解讀和分析互聯(lián)網(wǎng)海量文本、圖片及PDF,并根據(jù)新獲取的信息靈活調(diào)整策略!

該模型還可以瀏覽用戶上傳的文件,繪制并迭代調(diào)整圖表,在回答中嵌入生成的圖表及網(wǎng)頁圖片,并引用來源中的具體句子或段落。

為了測試該模型的效果,OpenAI采用了一項(xiàng)名為“人類終極考試”(Humanity’s Last Exam)的評估方法,該測試涵蓋3000多道高難度學(xué)術(shù)問題,遠(yuǎn)超其他AI評估基準(zhǔn),以確保測試難度始終領(lǐng)先于模型的進(jìn)步水平。

ChatGPT“深度研究”功能所使用的o3模型在測試中的準(zhǔn)確率為26.6%這一成績看似不高,但相比之下,已經(jīng)遠(yuǎn)超其他AI模型的得分:

谷歌 Gemini Thinking:6.2%

xAI Grok-2:3.8%

OpenAI GPT-4o:3.3%

不過,盡管如此,OpenAI仍然承認(rèn),ChatGPT“深度研究”功能存在局限性,可能會出現(xiàn)錯誤推斷、誤解權(quán)威信息與謠言的情況,并且,在面對不確定性時往往無法明確表述。

本文來自華爾街見聞,歡迎下載APP查看更多

贊助本站

相關(guān)熱詞: openai 深度研究

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港