界面新聞記者 | 查沁君
界面新聞編輯 | 文姝琪
2023年夏季,一條隱秘的行業(yè)情報在技術圈流傳:私募巨頭幻方量化持有的英偉達A100顯卡數量突破萬張,這個數字僅次于BAT等科技巨頭。
“當時業(yè)內都在猜測,一家量化交易公司為何需要如此龐大的算力儲備。”好未來(NYSE:TAL)CTO田密對界面新聞稱。
這個謎題在2024年1月揭曉幻方正式推出自研大模型DeepSeek,其迭代速度震驚業(yè)界:1月發(fā)布V1版,5月推出V2版,目前已迭代至V3與R1版本,并在這個春節(jié)成功出圈,與電影《哪吒2》一同成為“國產之光”。
在這場由DeepSeek掀起的AI浪潮中,教育科技公司也不想錯過這趟快車。
好未來、網易有道、云學堂、中公教育、猿輔導、編程貓、讀書郎等一眾教育機構密集接入DeepSeek,從線上教育到職業(yè)培訓,從個性化學習到企業(yè)員工培訓,DeepSeek在教育生態(tài)的卡位戰(zhàn)中已經占據了一個無法忽視的重要位置,行業(yè)人士甚至將之稱為“教育AI真正的諾曼底時刻”。
量變到質變
對于DeepSeek的“橫空出世”,田密并不對此感到意外,團隊從最一開始的V1版本就在追蹤其進展,并應用到好未來旗下業(yè)務中。
目前教育公司普遍采取的策略,并非從零訓練通用大模型,而是基于全球頂尖開源模型,疊加行業(yè)數據做后訓練。在DeepSeek V3版本發(fā)布后,田密緊鑼密鼓地安排團隊啟動“雙線作戰(zhàn)”。
一方面,模型團隊基于DeepSeek做后訓練提升學而思九章大模型的能力;另一方面,應用團隊快速接入其API至學習機等產品,同時公司內部客服、視頻腳本、講義生成等環(huán)節(jié)也在測試提效。
效果令人驚喜,“V3版本大幅領先其它開源模型,甚至產生量變到質變的變化”。
其它教育公司也感受到DeepSeek帶來的變化。據網易有道(NYSE:DAO)提供的內部評測數據顯示,DeepSeek-R1在有道K12測試集上的準確率高達88%。
網易有道首席科學家段亦濤指出,DeepSeek-R1憑借完善的計算基礎設施、高效的DualPipe訓練框架、低精度訓練的創(chuàng)新應用,以及稀疏連接、合理分層設計等架構優(yōu)化,實現模型性能的大幅提升與成本的有效控制。
尤為值得一提的是,DeepSeek-R1采用的“強化學習”技術,摒棄了傳統的PRM方法,直接以結果為導向進行獎勵,促使AI學會更高效地思考,并展現出初步的反思能力。
高途(NYSE:GOTU)聯合創(chuàng)始人羅斌在接受多知網采訪時透露,該公司接入DeepSeek后也收獲了一些顯著變化:比如,內部協同工具AI助手在接入后,日訪問量提升200%。
在用戶產品側,高途高中數學測評準確率從此前最佳情況的74%提升至90%左右,如果知識點下沉到初中、小學,DeepSeek-R1的準確率會提升得更顯著,可能接近于真人的狀態(tài)。
答疑是推理模型在教育領域應用的關鍵場景。過去與模型溝通對提示詞工程要求高,需精心撰寫提示詞才能得到較好答案,但現在DeepSeek具備深度思考和聯網能力,與它溝通像正常人說話一樣表達需求,它就能完成任務。
不同于以往的通用大模型,DeepSeek-R1展現了理科天賦,在數學、編程和推理等關鍵領域表現優(yōu)異。
網易有道CEO周楓認為,這對于教育應用非常關鍵,可以說教學過程中最大的場景,最難的問題都依賴理科大模型的能力。“理科大模型的成熟將大大拓展AI在教育和其它行業(yè)中的應用”。
在編程領域,編程貓自稱是全國首個將編程軟件與DeepSeek深度整合的人工智能品牌,目前該公司旗下編程貓全套編程軟件矩陣接入DeepSeek,覆蓋圖形化編程、Python及C++三大核心教學場景。
以編程貓自研的圖形化編程軟件源碼編輯器為例,當孩子提出創(chuàng)意想法“我想做個飛機大戰(zhàn)游戲”,傳統做法是由AI先生成一套代碼,孩子只需按部就班地跟著仿寫,再進行運行測試,動手跟著做即可。
而在接入了DeepSeek大模型的AI助手后,整體的學習思維邏輯開始轉變,孩子需要在軟件內置的AI助手中提出創(chuàng)意,AI助手不再直接輸出代碼,而是將創(chuàng)意拆解為可實現的任務模塊,引導學生通過問答交互自主構建游戲邏輯框架,深度實現孩子與AI協同共創(chuàng)編程作品。
“本質上是兩套自主技術體系的化學反應,讓AI重構交互方式,同時也驅動教育評估體系發(fā)生根本性變革!本幊特埾嚓P負責人談及該公司與DeepSeek的融合。
首先是教學模式的改變,讓學生從“學工具”到“練思維”的轉變,以“創(chuàng)造性主題”取代“編程知識點”為課程核心;其次,教育者角色將不再是傳統的“傳道授業(yè)解惑”,而是引導孩子將AI落地為現實生活的實際應用。最終落腳回到學生能力的培養(yǎng)。
在編程貓看來,學生能力的培養(yǎng)將是超越編程的深層價值,編程作為“實現創(chuàng)意的語法”,最終目的不是培養(yǎng)程序員,而是培養(yǎng)學生擁有理解非線性因果關系的復雜系統思維、正向循環(huán)“失敗-洞察-突破”的韌性創(chuàng)造力、解決具體問題的技術人文素養(yǎng)和快速適應未來人機協作的核心能力,培養(yǎng)駕馭“生物智能×人工智能”的復合型人才。
與其他領域不同,教育領域對內容的準確性、安全性有著更高的要求。猿輔導尤為強調了這一點,該公司表示,猿力大模型由專業(yè)教研團隊基于新課改的教學目標,對模型的回答內容進行調優(yōu),對符合青少年兒童的內容有著更專業(yè)的邊界設定。
例如,當孩子試圖與大模型聊“王者榮耀”等游戲內容時,小猿將不會直接回答,而是引導孩子回歸學習或閱讀內容本身。
DeepSeek的爆發(fā)式增長也帶來甜蜜的煩惱。日活躍用戶突破2000萬后,DeepSeek官網搜索功能可用率驟降,暴露出云資源儲備的短板。
“我們不得不自建搜索引擎接口,將必應搜索結果實時喂給模型,同時接入各大云廠商及官方原版的API,若一家不穩(wěn)定可迅速切換!碧锩芊Q。
行業(yè)也隨即展開自救:華為、360等廠商提供安全防護,手機廠商協助流量分流,形成獨特的“中國式協作生態(tài)”。
重構競爭格局
對于整個行業(yè)來說,DeepSeek的橫空出世,實質性地改變了教育AI的競爭邏輯。
“過去基于60分基礎模型能做到90分就是優(yōu)勢,現在對手拿著90分的基座稍作優(yōu)化就能達到93分,差距被不斷縮小!碧锩芴寡。
換言之,過往行業(yè)格局中,頭部企業(yè)憑借算力投入和算法積累,能在60分的開源基座上打造出90分的垂直模型,形成顯著技術壁壘。但當基礎模型直接躍升至90分水平時,各家的優(yōu)化空間被壓縮至5-8分的狹窄區(qū)間。
這種技術平權現象,使得中小教育科技公司首次獲得與行業(yè)巨頭同臺競技的機會,不過,若想超越可能還要多花些力氣。
有行業(yè)人士對界面新聞表示,頭部教企過往積累的教育數據是核心資產,也是訓練各家垂直大模型最關鍵的來源,即使Deepseek提高了行業(yè)整體基準線,但頭部企業(yè)仍保有數據優(yōu)勢。
田密認為,這整體是好事,有助于催生AI原生應用。一直以來大家期待的大模型時代的原生AI產品尚未誕生,而隨著DeepSeek開源技術的提升,將降低應用開發(fā)成本,讓更多原本無法嘗試的事情變?yōu)榭赡,從而加速大模型時代原生APP的涌現。
周楓也認為,高質量開源和低價模型會帶來AI的大繁榮!敖芪乃广U摗币环N經濟現象,指隨著技術進步導致資源使用效率提高,資源消耗量反而增加的現象。這是DeepSeek將給千行萬業(yè)帶來的一大變化,中國團隊將AI的成本降低,必將加速行業(yè)發(fā)展,很快將有更多的AI使用,更多的算力需求,更多的就業(yè)機會,和更快的科技和經濟的進步。
對于應用層來說,更大的難點在于,如何激活模型的專業(yè)能力。
以AI老師為例,如何讓它扮演專業(yè)教育老師,輔助撰寫講義、課件等,這不是技術難題,而是業(yè)務難題,即如何將通用大模型與自身領域專業(yè)知識更好結合,以得到更專業(yè)的結果。
盡管DeepSeek作為通用大模型已足夠優(yōu)秀,但在田密看來,該公司旗下業(yè)務涉及的專用場景仍采用的是其自研九章大模型,通用場景才會選用DeepSeek。
如學而思學習機內置智能助手“小思”的泛聊問答功能,將從其它的通用大模型換成DeepSeek,但拍照搜題、批改、答疑、精準學等專用功能,用的是九章大模型。
新東方優(yōu)編程董事長朱宇在接受多知網采訪時同樣提到,用DeepSeek很難直接去教學,還是會有幻覺,有錯誤的題型,甚至有錯誤的答案。教育公司做微調之后,效果會更好。
減少幻覺有兩種解決方式:一是用DeepSeek的解決方案來訓練和微調模型,訓練成本降低了很多,二是輸出的環(huán)節(jié)也要做調整。比如,一些題目的分析要做調整,再喂到模型中去調整輸出。
DeepSeek的崛起,正在重新定義AI在教育中的角色,關于大模型是否將替代老師輔導學生的討論也未曾斷過。
在田密看來,過去一年多來,大模型用于教學仍存在諸多問題,比如會產生幻覺講錯知識,不能適配學生年級,存在超綱講解情況,對話互動存在自問自答,不能很好理解或推理用戶輸入。
“通用大模型應用于行業(yè)還有很大差距,從優(yōu)秀的DeepSeek到出色的AI老師,還有很多工作要做,不能過于樂觀!碧锩芊Q。
他以自動駕駛為例,教育行業(yè)的L5是能完全替代人類老師的全自動AI老師,目前大模型的發(fā)展只是讓行業(yè)從“L2輔助駕駛”提升到“2.5”的水平,距離L3、L4仍有距離。
這些技術瓶頸的背后,是教育場景的特殊性對AI提出的獨特挑戰(zhàn),也同樣意味著,教育AI的進化不僅是算法問題,更是對學習科學本質的理解問題。
當技術參數競賽逐漸讓位于場景創(chuàng)新競賽時,教育公司的核心命題不再是“如何做出更好的模型”,而是“如何創(chuàng)造不可替代的教育價值”。
那些能夠將AI的認知優(yōu)勢與教育規(guī)律深度融合,在規(guī)模化與個性化之間找到平衡點的機構,終將在這次技術浪潮中實現從工具革新到教育范式的跨越。