AGI 編程,將是我們從移動(dòng)互聯(lián)網(wǎng)時(shí)代,跨越到大模型時(shí)代的重要一步。
整理 | Moonshot編輯| 靖宇
在繪畫、寫文章、創(chuàng)作視頻之后,AGI 應(yīng)用的另一大場(chǎng)景是:編程。曾經(jīng)大家認(rèn)為編程有很高門檻,但在 AGI 時(shí)代,它在變成人人觸手可及的技術(shù),越來(lái)越多的 AI 編程工具,讓不會(huì)代碼的普通人也能輕松制作 App。我們?nèi)绾螖[脫基于移動(dòng)互聯(lián)網(wǎng)時(shí)代的想象,展開大模型時(shí)代新的可能性?未來(lái)是不是人人都能成為 AI 程序員,創(chuàng)造專屬于自己的「?jìng)(gè)性化應(yīng)用」?對(duì)于這些問(wèn)題,AIGCode 創(chuàng)始人宿文在極客公園 IF2025 創(chuàng)新大會(huì)上,給出了自己的答案。宿文認(rèn)為,在 AGI 的賦能下,AGI 代碼可以把應(yīng)用帶入更有「?jìng)(gè)性化」的階段,讓每個(gè)用戶可以實(shí)現(xiàn)自己小眾但精準(zhǔn)的需求,小團(tuán)隊(duì)也可以降低成本,快速迭代。這是宿文眼中編程的終極場(chǎng)景。在宿文看來(lái):
在互聯(lián)網(wǎng)時(shí)代創(chuàng)造的應(yīng)用、平臺(tái),并不生產(chǎn)任何內(nèi)容,只完成內(nèi)容的聚合和分發(fā)。
在大模型時(shí)代,大模型只有一個(gè)核心功能:在底層幫大家生成內(nèi)容。
大模型時(shí)代剛剛拉開序幕,大模型的鏈條會(huì)長(zhǎng)什么樣,每個(gè)從業(yè)者還在探索,但這條鏈條可能不會(huì)長(zhǎng)成上個(gè)時(shí)代的樣子。
AI 編程將重塑軟件開發(fā)行業(yè),軟件開發(fā)「又好又快又便宜」可以同時(shí)實(shí)現(xiàn)。
在大模型時(shí)代,沒(méi)有超級(jí)應(yīng)用,只有超級(jí)智能。
以下是 AIGCode 創(chuàng)始人宿文在極客公園 IF2025 創(chuàng)新大會(huì)上的現(xiàn)場(chǎng)演講實(shí)錄,由極客公園整理。
宿文在極客公園 IF2025 創(chuàng)新大會(huì)上進(jìn)行演講|圖片來(lái)源:極客公園01
從 Copilot 到 Autopilot即將過(guò)去的 2024 年,大模型賽道引發(fā)了許多討論,AI 編程是其中一個(gè)繞不開的話題。大家都會(huì)說(shuō)程序員被大模型改造得很深刻,全世界程序員群體有七八千萬(wàn),占世界人口 1% 左右。這么厲害的軟件代碼改造技術(shù),怎么讓其他 99% 的人使用呢?我們可以舉一個(gè)例子,今天中午極客公園鵬總突然說(shuō)這個(gè)活動(dòng)辦得很好,除了線上買票、線上收費(fèi),咱們線上直播行不行?會(huì)務(wù)組小伙伴崩潰了,去哪找直播管理平臺(tái),去哪找 SaaS,如果自己定需求,自己去做開發(fā),至少幾個(gè)周、幾個(gè)月時(shí)間。為了方便大家了解 AIGCode 的產(chǎn)品 AutoCoder,我們把這個(gè)平臺(tái)給大家看一下。
AutoCoder 演示界面|圖源:AIGCode這個(gè)產(chǎn)品完全面向不會(huì)編程的人群。另外很重要的點(diǎn),相比大家現(xiàn)在拿到的類似產(chǎn)品,主要圍繞前端,但是 AIGCode 能夠把后端和數(shù)據(jù)庫(kù)一體化交付給大家,能交付出一個(gè)完整的軟件工程。做這個(gè)事的源頭,跟我上一段創(chuàng)業(yè)有關(guān)系。我上段創(chuàng)業(yè)是做軟件,有一個(gè)比較大的痛點(diǎn)是效率,我們經(jīng)常提出一個(gè)需求,程序員要做幾周甚至幾個(gè)月,我們看到很多很好的技術(shù)棧,字節(jié)、阿里用得很好,但我們程序員用不起來(lái),而且程序員成本很貴。所以做軟件,怎么做得又快又好又便宜,這是每個(gè)行業(yè)都面臨的難題,不可能在一個(gè)維度上去解決。然而大模型來(lái)了,又好又快又便宜可以實(shí)現(xiàn)了。
當(dāng)然實(shí)現(xiàn)過(guò)程中,目前主要有兩類解決方案:一類就是 Copilot,就像名字一樣的,幫程序員做輔助駕駛。另外就是我們想做的 Autopilot 這樣的產(chǎn)品。Copilot,目前主要還是圍繞程序員工作場(chǎng)景在 IDE 里面做代碼補(bǔ)齊,中國(guó)沒(méi)有 IDE,甚至全球最主要的 IDE 80%、90% 的市場(chǎng)都在微軟手里,作為初創(chuàng)公司很難在生態(tài)里 PK,只能繞開這個(gè)很大的生態(tài)競(jìng)爭(zhēng)。我們?cè)?Web 端做 IDE Free 的產(chǎn)品,端到端去做。我們用戶會(huì)完全不一樣,我們把用戶群體從 1% 放大到 10%、20% 都有可能。目前大家所用到的模型和 Copilot 產(chǎn)品,主模型能夠用上最好的基模,不管海外還是國(guó)內(nèi),大家都在使用 Deepseek 這種水平的基模。要把代碼鏈條優(yōu)化得足夠好,核心的技術(shù)都卡在模型上,所以自研模型不會(huì)套殼,不會(huì)用 Llama 去做,我們會(huì)有自己的模型架構(gòu)解決這個(gè)問(wèn)題。還有很重要一點(diǎn),傳統(tǒng)軟件架構(gòu)跟生成式軟件架構(gòu)不一樣,兩大支柱做了算法和軟件架構(gòu)層面的創(chuàng)新,這是我們兩塊主要的工作。
右面是模型上的工作,核心解決兩個(gè)點(diǎn):又大又準(zhǔn),大的是「大上下文」,而不是后半段做 4K 窗口的串聯(lián)。另外是新的網(wǎng)絡(luò)結(jié)構(gòu)帶來(lái)的收益,還有一塊是在軟件結(jié)構(gòu)的創(chuàng)新。ChatGPT 的火爆正好兩年多,我們其實(shí)站在今天這個(gè)節(jié)點(diǎn)來(lái)看,我們很憧憬大模型可以解決很多問(wèn)題。今天可以解決的問(wèn)題主要在寫字和畫畫兩個(gè)場(chǎng)景,很多理科生的的問(wèn)題,比如數(shù)學(xué)、編程這樣的工作還沒(méi)有解決得很好,我們遇到了很多其他問(wèn)題,比如訓(xùn)練成本、資金、模型本身的泛化能力、訓(xùn)練效率等等。目前網(wǎng)絡(luò)結(jié)構(gòu)在 Transformer 往前迭代,去年上半年提出的 MOE 這種架構(gòu)也在改造整個(gè)大模型,在 MOE 之后還有 MMOE 等很多技術(shù)迭代。我們率先使用 PLE 架構(gòu),核心是我們能夠在網(wǎng)絡(luò)結(jié)構(gòu)層讓專家或大模型,更有結(jié)構(gòu)化地深度學(xué)習(xí)人類高質(zhì)量樣本。至于樣本不夠用的問(wèn)題,其實(shí)不會(huì)出現(xiàn),因?yàn)槲覀冇泻芏喔哔|(zhì)量的樣本,像論文、代碼這些樣本還沒(méi)有被徹底學(xué)到。為了讓整個(gè)模型可以支撐起完整的代碼生成,模型底層還要配套很強(qiáng)的算法,所以我們自己去做優(yōu)化,包括不同的算力平臺(tái)的整合,一體化平臺(tái)上的算力加速,我們看到的技術(shù)卡點(diǎn),都解決掉了。我們自己的模型成果,也不會(huì)拿國(guó)內(nèi)任何一個(gè)軟柿子去捏,去對(duì)比,我們還是拿全球頂尖的團(tuán)隊(duì)的最新版本,最大參數(shù)量去做,我們?cè)诜夯笜?biāo)上,是跟主流模型基本平齊的水平。我們會(huì)在接下來(lái)三個(gè)季度把 13B 和 33B 也發(fā)布出來(lái),給有模型使用能力的團(tuán)隊(duì)使用。
這句話是我們公司的愿景,剛剛主要解釋了上半句,Auto-coding is AGI,我們看起來(lái)在解決代碼編程的問(wèn)題,但是核心問(wèn)題是:能不能把端到端代替程序員寫完代碼。02
Auto-coding 加速「?jìng)(gè)性化」這問(wèn)題由 AGI 模型本身決定,我們發(fā)現(xiàn),無(wú)論解決上下文還是網(wǎng)絡(luò)結(jié)構(gòu)、底層優(yōu)化器、算力加速等等問(wèn)題,都是目前 AGI 最大的痛點(diǎn),這兩個(gè)問(wèn)題幾乎是等價(jià)的,AGI 和 Auto-coding 基本上同一個(gè)時(shí)間點(diǎn)到來(lái)。底層邏輯有兩個(gè):一、代碼本身就是一種高質(zhì)量語(yǔ)言,對(duì)于模型訓(xùn)練非常重要。另外,我們覺(jué)得 AGI 本身從一個(gè)新技術(shù)的出現(xiàn),到兩年前的 ChatGPT 進(jìn)入大眾視野,我們對(duì)它有很多憧憬,但它解決很多行業(yè)問(wèn)題還不成熟,所以很多行業(yè)專家或者用戶就會(huì)罵街,說(shuō)這個(gè)工具不成熟,解決不了問(wèn)題。但是對(duì)于代碼這個(gè)賽道來(lái)說(shuō),比較幸福的是:我們算法工程師,95% 都是程序員出身,因此思路上閉環(huán)很快,自己做得好不好,我們自己心里有數(shù)。第二點(diǎn)是,這樣的 Auto-coding 準(zhǔn)備好后,解決問(wèn)題時(shí),怎么端到端,要打到哪些需求點(diǎn)?用戶體驗(yàn)上的核心之處:第一個(gè)點(diǎn)是準(zhǔn)確,我們所有需求,怎么達(dá)成底層產(chǎn)品鏈條里的準(zhǔn)確率?今天使用很多 Agent 類產(chǎn)品,第一個(gè)生成的版本很好,但細(xì)微的需求點(diǎn)沒(méi)有辦法實(shí)現(xiàn)。第二個(gè)點(diǎn)是靈活性,在一個(gè)應(yīng)用的生成過(guò)程中,最重要的是要實(shí)現(xiàn)各種各樣個(gè)性化的要求,比如一個(gè)搜索框,能不能實(shí)現(xiàn)得足夠靈活,能跟所有功能邏輯串通。第三個(gè)點(diǎn)是完整度,這是軟件工程上的工作,要解決工程的安全問(wèn)題、部署問(wèn)題。在這些工作做完后,這套方案就會(huì)變成基礎(chǔ)設(shè)施,程序員的工作全部用推理算力成本就可以解決。我們想去做的 Personal App(個(gè)性化應(yīng)用)就可以實(shí)現(xiàn)。大家看到這個(gè)場(chǎng)景的時(shí)候可能會(huì)說(shuō):「我們手機(jī)里裝的都是通用應(yīng)用,我要一個(gè) Personal App 做什么呢?」也有很多人問(wèn)我:「你們要 ToB 還是 ToC?」
其實(shí)一個(gè)新的生產(chǎn)力工具出現(xiàn)時(shí),這些問(wèn)題都不重要,舉兩個(gè)很有意思的例子:上周我去云南某城參加一個(gè)會(huì)議,會(huì)議組織方帶我們?nèi)ゾ皡^(qū),很多人排長(zhǎng)隊(duì)在買票,但旁邊有好幾臺(tái)自動(dòng)售票的機(jī)器,我走近一看都開著機(jī),機(jī)內(nèi)裝著 Windows 系統(tǒng),這時(shí)候如果有一個(gè)管理人員可以提出一個(gè)售票系統(tǒng)的需求,都不需要在當(dāng)?shù)卣页绦騿T,用可以在 Windows 里部署一套售票管理軟件,排長(zhǎng)隊(duì)買票的問(wèn)題就很好解決。另外一個(gè)例子,我跟一個(gè)朋友討論播客,我們聽播客很多都依賴于小宇宙這種播客客戶端。在美國(guó),很多主播會(huì)在 YouTube 上有視頻播客的頻道,國(guó)內(nèi)很少用視頻的方式做播客,這個(gè)朋友說(shuō)我們不太想露臉,如果有一個(gè)卡通形象體出鏡,去做視頻播客,主播就會(huì)自然舒服很多了。所以大家會(huì)發(fā)現(xiàn),在我們場(chǎng)景里有非常多個(gè)性化應(yīng)用的需求,哪怕是基于一個(gè)通用的平臺(tái),都可以加很多個(gè)性化的功能進(jìn)去,這在編程的終極場(chǎng)景里都可以實(shí)現(xiàn)。我們?cè)谛〖t書、知乎或者百度上,想搜索一個(gè)軟件去解決我們一些問(wèn)題時(shí),本質(zhì)上都是在提需求。如果這樣的需求可以通過(guò)自動(dòng)生成的代碼和應(yīng)用實(shí)現(xiàn),而不需要用戶去找各種各樣的應(yīng)用,找到后還要克制自己的需求。這兩種體驗(yàn)完全不一樣。03
大模型的核心功能,究竟是什么?關(guān)于代碼生成和我們公司要做的事情,介紹到這里就結(jié)束了。接下來(lái)我有三個(gè)真話想說(shuō):一、大家一直在追求 AGI 或者解決 AGI 問(wèn)題,是很割裂的。比如很多大佬都會(huì)說(shuō),整個(gè)大模型目前還處于嬰兒期,但是從 2024 年初到現(xiàn)在,大家都說(shuō)今年是 Agent 元年,但一個(gè)嬰兒期的工具怎么解決那么多問(wèn)題?我們經(jīng)常聽到說(shuō) Scaling Law 走到盡頭了,但是囤卡樂(lè)此不疲,H100、B200,1 萬(wàn)張,10 萬(wàn)張,大幾十萬(wàn)張卡,現(xiàn)在大廠甚至開始搞核電站了,包括 Ilay 最近提到的,預(yù)訓(xùn)練期結(jié)束了,其實(shí)里面沒(méi)有什么干貨,主要把樣本學(xué)完,但是還有很多高質(zhì)量樣本,需要結(jié)構(gòu)化輸入進(jìn)整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)里。所以有什么資源,大家就會(huì)依賴什么路徑,對(duì)于我們這樣的公司來(lái)說(shuō),我們看到更多的是網(wǎng)絡(luò)結(jié)構(gòu)層帶來(lái)了非常大的紅利。從 Transformer 出現(xiàn),到前面幾十年,大家對(duì)于通用人工智能的追求,都避不開網(wǎng)絡(luò)結(jié)構(gòu)這個(gè)環(huán)節(jié),這一層獲得的收益和待解決的問(wèn)題更多。
宿文對(duì)大模型的核心做出預(yù)測(cè)|圖片來(lái)源:極客公園二、互聯(lián)網(wǎng)或者移動(dòng)互聯(lián)網(wǎng),給大家留下的思維慣性太強(qiáng)了,不管投資人、創(chuàng)業(yè)者、產(chǎn)業(yè)分析師,在大模型出現(xiàn)的第一天,很快就出現(xiàn)了一個(gè)分析框架,這個(gè)框架鏈條里有基模、OS、Agent、應(yīng)用……但這些分類的基礎(chǔ),都是從上個(gè)時(shí)代復(fù)刻下來(lái)的,大模型時(shí)代的鏈條會(huì)長(zhǎng)什么樣,我們都不知道,它大概率不會(huì)長(zhǎng)成上個(gè)時(shí)代的樣子。我們做的過(guò)程中發(fā)現(xiàn),做 Infra 這一層、做基模、做應(yīng)用,各個(gè)環(huán)節(jié)的基礎(chǔ)鏈條都不成熟,在不成熟的時(shí)候,大家如果去等待鏈條成熟,或者自己找一段去完善,這個(gè)商業(yè)通路很難跑通,因?yàn)樗茈y把價(jià)值直接傳遞給用戶。對(duì)我們來(lái)說(shuō),我們有能力把這些鏈條打通到一起做,而不會(huì)很刻板地停留在過(guò)去的技術(shù)思路里。三、在大模型出現(xiàn)第一天起,就很多人提超級(jí)應(yīng)用,這同樣是互聯(lián)網(wǎng)時(shí)代留給我們的想象。移動(dòng)互聯(lián)網(wǎng)時(shí)代,我們看到這種超級(jí)應(yīng)用本身不產(chǎn)生內(nèi)容,更多是做一個(gè)信息的嫁接平臺(tái)或者一個(gè)中間平臺(tái),讓我們搜內(nèi)容搜得越來(lái)越快,給我們推薦信息越來(lái)越準(zhǔn),讓我們交易越來(lái)越高效,但這個(gè)平臺(tái)本身不會(huì)提供內(nèi)容服務(wù)。但是到了大模型時(shí)代,這些互聯(lián)網(wǎng)產(chǎn)品特性基本都消失了,大模型只有一個(gè)核心功能:在底層幫大家生成內(nèi)容。這個(gè)競(jìng)爭(zhēng)力一定是最底層的,未來(lái)超級(jí)應(yīng)用長(zhǎng)什么樣不知道,甚至不會(huì)存在。但是超級(jí)應(yīng)用底層是對(duì)超級(jí)智能的支持,這一點(diǎn)是一定避不開的,這是最內(nèi)核的競(jìng)爭(zhēng)力?雌饋(lái)我們是在做 AICoding,但其實(shí)我們是在這樣一個(gè)商業(yè)場(chǎng)景里,去解決 AGI 自身的問(wèn)題,我們朝著 AGI 一路狂奔,也是希望有更多小伙伴像我們一樣,大家向上卷,向核心技術(shù)卷,最后把這些技術(shù)沉淀在產(chǎn)品上,提供給我們的用戶。謝謝大家。*頭圖來(lái)源:CodeSummit本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請(qǐng)聯(lián)系極客君微信 geekparkGO極客一問(wèn)AGI 編程的普及會(huì)如何改變傳統(tǒng)的軟件開發(fā)流程?