界面新聞記者 | 龍力
作為一名投資者,李萌很久之前就關(guān)注到量化私募巨頭幻方量化在研究大模型,但是直到今年年初DeepSeek爆火以后,才試用到這款大模型,“原來量化私募做出來的大模型竟然這么好用”。
自從DeepSeek爆火以后,不少頭部量化私募表示要加碼布局AI領(lǐng)域。
界面新聞注意到,近期蒙璽投資、寬德私募、鳴石私募均發(fā)布招聘信息,為各自旗下的AI Lab招攬人才。
在相關(guān)招聘信息中,蒙璽投資宣布公司AI Lab全新上線,并向在校生喊出“加入我們,成為改變世界的因子”;寬德私募表示獨(dú)立孵化的寬德智能學(xué)習(xí)實(shí)驗(yàn)室(WILL)始于但不局限于金融場景,將朝著整個(gè)人工智能的星辰大海啟航;鳴石私募介紹公司2021年便已成立G-Lab,次年正式開啟超級計(jì)算“星座計(jì)劃”,2025年隨著“星座計(jì)劃”超算系列進(jìn)一步擴(kuò)容,為G-Lab提供了自由的算力空間。
據(jù)中證金牛座消息,近日鳴石基金創(chuàng)始人袁宇還在接受采訪時(shí)透露,未來公司不排除考慮“直接參與AI產(chǎn)業(yè)發(fā)展”的可能。
另外,九坤投資近期攜手微軟團(tuán)隊(duì)刊文表示,首次成功復(fù)現(xiàn)DeepSeek-R1,還首次發(fā)現(xiàn)了輸出長度與推理性能提升無關(guān)、語言混合(例如中英文夾雜)會顯著降低推理能力以及reasoning tokens確實(shí)有提升推理性能等問題。
那么,其他的量化私募也有可能打造出比肩DeepSeek的大模型嗎?不少用戶的心中都泛起了和李萌一樣的疑問。
“技術(shù)上具備可行性”,在尚藝投資總經(jīng)理王崢看來,國內(nèi)頭部量化私募的資金實(shí)力、算力資源以及人才儲備,使其具備進(jìn)入AI大模型領(lǐng)域的潛力,尤其是九坤成功復(fù)現(xiàn)DeepSeek-R1,表明資金充裕、計(jì)算資源豐富的量化私募已經(jīng)能夠開展大模型訓(xùn)練。
另有多位受訪人士也都認(rèn)為,量化私募和科技大廠之間本身就有著許多的共性。
首先,二者在人才儲備方面非常相似。
王崢指出,量化私募長期以來吸引了大量數(shù)學(xué)、統(tǒng)計(jì)、計(jì)算機(jī)科學(xué)、機(jī)器學(xué)習(xí)領(lǐng)域的頂尖人才,許多從業(yè)者本身就有人工智能和算法研究背景。而AI大模型的核心研發(fā)涉及概率統(tǒng)計(jì)、最優(yōu)化方法、深度學(xué)習(xí)等,這些正是量化研究員和算法交易員的強(qiáng)項(xiàng)。
界面新聞梳理發(fā)現(xiàn),很多頭部量化私募都擁有大量數(shù)理背景或者計(jì)算機(jī)科學(xué)領(lǐng)域的團(tuán)隊(duì)成員。以DeepSeek背后的幻方量化為例,私募排排網(wǎng)數(shù)據(jù)顯示,公司策略開發(fā)團(tuán)隊(duì)有100多人,其中AI Lab有20多人,涵蓋奧林匹克數(shù)學(xué)/物理/信息學(xué)競賽金牌得主,信號識別、機(jī)器學(xué)習(xí)領(lǐng)域?qū)<覉F(tuán)隊(duì),拓?fù)鋵W(xué)、統(tǒng)計(jì)學(xué)、運(yùn)籌學(xué)、控制論各學(xué)科博士以及資深行業(yè)研究專家。
根據(jù)私募排排網(wǎng)不完全統(tǒng)計(jì)數(shù)據(jù),截至今年2月27日已有28家百億私募于春季發(fā)布了量化、算法、機(jī)器學(xué)習(xí)等AI相關(guān)的招聘崗位(包含校招、社招、實(shí)習(xí)生崗位),其中量化私募明顯較多,共有19家,占比67.85%。
華南地區(qū)的一位量化私募負(fù)責(zé)人林宇指出,量化私募的研究團(tuán)隊(duì)往往具備扎實(shí)的AI技術(shù)功底。他們在高性能計(jì)算、工程實(shí)現(xiàn)、模型調(diào)優(yōu)等方面積累了豐富經(jīng)驗(yàn),這些能力正是大模型研發(fā)的關(guān)鍵所在。因此,這類團(tuán)隊(duì)在轉(zhuǎn)向大模型研究時(shí),往往能夠快速適應(yīng)并高效推進(jìn),這種優(yōu)勢是其他領(lǐng)域的研究團(tuán)隊(duì)難以比擬的。
其次,頭部量化私募普遍在算力基礎(chǔ)設(shè)施方面儲備豐厚。
尚藝投資總經(jīng)理王崢指出,訓(xùn)練AI模型需要極強(qiáng)的分布式計(jì)算能力和高性能GPU集群,而量化高頻交易機(jī)構(gòu)本身對低延遲計(jì)算和超算基礎(chǔ)設(shè)施的投入極大,具備大規(guī)模數(shù)據(jù)處理的能力。量化私募的交易系統(tǒng)通常已經(jīng)搭建了專有的數(shù)據(jù)中心,這與AI大模型的高算力需求有一定的重疊。
界面新聞梳理發(fā)現(xiàn),很多頭部量化私募確實(shí)都在算力基礎(chǔ)設(shè)施方面有著深厚的儲備。比如早在2020年3月幻方量化就已經(jīng)正式啟用了“螢火一號”超算平臺,后續(xù)還投建了“螢火二號”;明投資自2019年開始大規(guī)模建設(shè)高性能計(jì)算集群,每年持續(xù)投入,目前仍處在指數(shù)增長階段;鳴石投資自2022年以來開啟超算“星座計(jì)劃”,陸續(xù)上線一期“仙女座”、二期“英仙座”等。
再者,量化模型和大模型研究之間有很多相通之處。
量化私募人士張鑫表示,量化私募團(tuán)隊(duì)通過數(shù)據(jù)分析和算法優(yōu)化來進(jìn)行投資研究,這與研發(fā)大模型的過程高度一致,都是將人才優(yōu)勢轉(zhuǎn)化為技術(shù)創(chuàng)新。而且無論是量化私募還是大模型的研發(fā),本質(zhì)上都是利用數(shù)據(jù)和技術(shù)來推動創(chuàng)新,兩者都依賴大量高質(zhì)量的數(shù)據(jù)進(jìn)行分析和建模,并且都需要開發(fā)和優(yōu)化復(fù)雜的算法以提高預(yù)測精度或決策效率。
主要區(qū)別在于,科技大廠主要面向廣泛的通用市場,創(chuàng)造適用于多種應(yīng)用場景的通用模型;而量化私募則聚焦于投資領(lǐng)域,開發(fā)適用于金融市場的專用模型,這種專用模型能夠更好地滿足特定領(lǐng)域的需求。
華南地區(qū)量化私募負(fù)責(zé)人林宇進(jìn)一步解釋稱,量化投資和大模型研究在方法論上存在諸多共性,兩者都以數(shù)據(jù)為基石,通過算法模型的不斷迭代優(yōu)化來驅(qū)動決策。在量化交易中,深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、時(shí)間序列建模等技術(shù)也早已廣泛應(yīng)用,而這些技術(shù)恰恰也是大模型的核心支柱。
以Transformer架構(gòu)為例,它不僅在自然語言處理領(lǐng)域大放異彩,在金融數(shù)據(jù)分析中同樣展現(xiàn)出巨大潛力。我們可以利用Transformer處理海量的海量金融和市場數(shù)據(jù),如新聞輿情、社交媒體等,從中提取有價(jià)值的市場信號。這種技術(shù)遷移的可行性,源于兩者在數(shù)據(jù)處理模式上的本質(zhì)相似性。
此外,量化私募和科技大廠都具備雄厚的經(jīng)濟(jì)基礎(chǔ)。
大模型“很燒錢”是業(yè)內(nèi)的共識。華南地區(qū)量化私募負(fù)責(zé)人林宇指出,大模型的研發(fā)需要龐大的計(jì)算資源、海量數(shù)據(jù)以及高水平的研究團(tuán)隊(duì),初期投入較大,對于資金充裕、盈利穩(wěn)定的量化私募才能更好承擔(dān)這些研發(fā)成本。
“動輒上百萬的年薪搶人”、“在算力基礎(chǔ)設(shè)施上持續(xù)投入”、“2.85億競拍豪宅”、“個(gè)人捐款1.38億”,近年來量化私募及相關(guān)人士一些“壕氣十足”的舉動,恰好從側(cè)面反映出了部分量化私募的“不差錢”。
根據(jù)私募排排網(wǎng)數(shù)據(jù),截至今年2月底,國內(nèi)管理規(guī)模超過100億元的量化私募已經(jīng)達(dá)到32家,另有8家百億私募為“主觀+量化”策略私募。
不過,界面新聞根據(jù)公開資料梳理發(fā)現(xiàn),盡管在AI領(lǐng)域的新動作不少,目前尚未有其他量化私募明確宣布將打造類似于DeepSeek的AI大模型。
也有部分受訪人士指出,量化私募固然具備一些研究大模型的基礎(chǔ),但是真的去實(shí)踐的話,也將會面臨著不少的挑戰(zhàn)。
大巖資本相關(guān)人士認(rèn)為,復(fù)現(xiàn)DeepSeekR1確實(shí)證明了利用開源代碼和強(qiáng)化學(xué)習(xí)技術(shù)可以模仿現(xiàn)有大模型的性能,但并不意味著這種成功可以被輕易復(fù)制。復(fù)現(xiàn)不僅僅是簡單的復(fù)制代碼,而需要高水平的算法調(diào)優(yōu)、超參數(shù)設(shè)置和環(huán)境調(diào)試,這需要頂尖的AI研發(fā)團(tuán)隊(duì)和長時(shí)間的技術(shù)積累。此外,訓(xùn)練和調(diào)優(yōu)大規(guī)模模型需要龐大的算力和海量數(shù)據(jù)支持,這不僅涉及硬件設(shè)施的投資,還需要長期的運(yùn)營維護(hù)成本。
尚藝投資總經(jīng)理王崢指出,訓(xùn)練一個(gè)通用AI大模型的投資回報(bào)率不明確,量化私募的核心目標(biāo)仍然是提升交易收益率,而AI大模型的研發(fā)本質(zhì)上是一個(gè)技術(shù)驅(qū)動的長周期投入,需要平衡投入和回報(bào)的周期,并且AI大模型需要極大規(guī)模、多樣化的數(shù)據(jù)進(jìn)行訓(xùn)練,而量化私募的數(shù)據(jù)主要集中在金融市場相關(guān)領(lǐng)域,相比互聯(lián)網(wǎng)公司掌握的跨行業(yè)、多語言數(shù)據(jù),數(shù)據(jù)廣度有限等挑戰(zhàn)。
(文中李萌、張鑫、林宇為化名)