中國的 OpenAI,出現了。
作者 | 宛辰編輯| 靖宇
對標 OpenAI o1 正式版的國產大模型來了!1 月 20 日晚,DeepSeek(深度求索)公司發(fā)布推理模型 DeepSeek-R1 正式版,同步開源模型權重,并允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。網友熱評:這,才是真正的OpenAI。能力相當于一個月 200 美元的 ChatGPT o1 版本,卻完全免費。不止如此,DeepSeek 一同開源的還有「技術報告」,那些訓練 R1 時踩過的坑、做過的事通通講給你聽,只為鋪平 AGI 的路。第一時間閱讀這份技術報告后,英偉達高級研究科學家 Jim Fan 帶來了新鮮解讀,值得我們大聲齊讀:
「我們生活在這樣一個時代:由非美國公司保持 OpenAI 最初的使命做真正開放的前沿研究、為所有人賦能。這似乎講不通,但戲劇性的往往最有可能發(fā)生。DeepSeek-R1 不僅開源了大量模型,還泄露了所有訓練秘密。他們可能是第一個顯示 RL(強化學習)飛輪發(fā)揮主要作用、持續(xù)增長的 OSS 項目。影響可以通過『內部實現了 ASI』或『草莓計劃』等神話名稱來實現。也可以通過簡單地轉儲原始算法和 matplotlib 學習曲線來產生影響!怪袊 DeepSeek,正在實現趕超 OpenAI 的使命。