IT之家 1 月 15 日消息,科技媒體 TechCrunch 昨日(1 月 14 日)發(fā)布博文,報(bào)道稱 OpenAI 最新推理模型 o1 在推理過(guò)程中,會(huì)使用中文、波斯語(yǔ)等多種語(yǔ)言“思考”,引發(fā)了 AI 界的關(guān)注和猜測(cè)。
網(wǎng)友 @RishabJainK 于 1 月 9 日在 X 平臺(tái)發(fā)布推文,表示即便提示詞中僅輸入英文,在推理過(guò)程中,也會(huì)使用中文等其他語(yǔ)言,截圖顯示“提議新創(chuàng)意”。OpenAI 尚未解釋或回應(yīng) o1 的這種行為。
專家推測(cè)IT之家附上一些專家的推測(cè)如下:Hugging Face CEO Clément Delangue 等專家指出,o1 等推理模型的訓(xùn)練數(shù)據(jù)集中包含大量中文,可能導(dǎo)致 o1 使用中文進(jìn)行推理。
Google DeepMind 的研究員 Ted Xiao 認(rèn)為,OpenAI 等公司使用第三方中文數(shù)據(jù)標(biāo)注服務(wù),o1 切換到中文是“中文語(yǔ)言對(duì)推理的影響”的一個(gè)例子,數(shù)據(jù)標(biāo)注(標(biāo)簽)幫助模型理解數(shù)據(jù)。
一些專家認(rèn)為,o1 可能只是在使用其認(rèn)為最有效的語(yǔ)言來(lái)解決“幻覺(jué)”等問(wèn)題。阿爾伯塔大學(xué)的 AI 研究員 Matthew Guzdial 表示,模型并不知道什么是語(yǔ)言,或者語(yǔ)言之間的差異,所有文本對(duì)它來(lái)說(shuō)都是一樣的,模型使用 token(詞、音節(jié)或單個(gè)字符)進(jìn)行處理,而不是直接處理單詞。