鈦媒體獨(dú)家獲悉,科銳國(guó)際已接入DeepSeek-R1大模型,探索AI大模型與招聘特別是中高端招聘領(lǐng)域的深度融合,以期提升人才匹配效率。
科銳國(guó)際是國(guó)內(nèi)首家登陸A股的人力資源服務(wù)企業(yè),目前在全球已有100多個(gè)分支機(jī)構(gòu),其主營(yíng)業(yè)務(wù)覆蓋中高端人才訪尋、招聘流程外包、靈活用工等全鏈條服務(wù),及HR SaaS、垂直領(lǐng)域招聘等產(chǎn)品。成功推薦中高端管理及專業(yè)技術(shù)人員近20,000名,靈活用工累計(jì)派出人員38.3萬(wàn)余人次。
科銳國(guó)際CTO劉之指出,春節(jié)前后中國(guó)DeepSeek-R1推理大模型驚艷世界,這將進(jìn)一步推動(dòng)Agents技術(shù)的成熟。
他告訴鈦媒體,“DeepSeek-R1是跟OpenAI o1平替但更經(jīng)濟(jì)的版本。DeepSeek-R1在大規(guī)模強(qiáng)化學(xué)習(xí)的原創(chuàng)式創(chuàng)新開創(chuàng)了先河。雖然模型的優(yōu)勢(shì)并不一定總是持續(xù),社區(qū)會(huì)跟進(jìn)的很快。但將工程和算法等跨學(xué)科深度融合的團(tuán)隊(duì)總是能做出特別優(yōu)秀的創(chuàng)新,這才是最值得敬佩和學(xué)習(xí)的。”
但他同樣指出,“雖然 OpenAI 去年 9 月就發(fā)布了 o1 推理大模型,我們已經(jīng)在嘗試使用o1為跨數(shù)據(jù)源的復(fù)雜RAG任務(wù)提供更高效的任務(wù)拆解能力,同時(shí)也在預(yù)研更需要推理能力的Agents。DeeSeek-R1和o1的推理能力類似,所以并沒有因此改變我們的產(chǎn)品方案和策略。但與 o1 不同的是,DeepSeek-R1的思維鏈?zhǔn)峭该骰,所以在進(jìn)行意圖理解和任務(wù)規(guī)劃時(shí)可以將產(chǎn)品轉(zhuǎn)變成交互會(huì)話式的,這會(huì)極大提高用戶體驗(yàn)!
劉之預(yù)計(jì),“隨著科銳國(guó)際在不同場(chǎng)景接入更多不同模型,DeepSeek-R1作為RAG和Agents的主力模型是完全可以的!
早在去年5月,不少大模型提供商均在爭(zhēng)相降價(jià)期間,DeepSeek-V2就已經(jīng)體現(xiàn)出與閉源模型如GPT-4-Turbo和文心4.0在語(yǔ)言理解與生成方面的綜合實(shí)力。直至年底12月DeepSeek-V3和1月20日DeepSeek-R1的先后發(fā)布,客觀上為OpenAI等大模型廠商帶來(lái)了壓力。盡管DeepSeek-R1訓(xùn)練成本并未公布,但DeepSeek-V3據(jù)公布的訓(xùn)練預(yù)算為“2048個(gè)GPU、2個(gè)月、近600萬(wàn)美元”,外界認(rèn)為R1在對(duì)標(biāo)OpenAI o1模型的同時(shí),訓(xùn)練成本也可能更低。
短短一個(gè)春節(jié)假期過后,國(guó)內(nèi)外從芯片廠到云廠商都迅速公布了對(duì)DeepSeek支持?梢灶A(yù)期的是,在不同GPU和云算力平臺(tái)上,DeepSeek系列模型會(huì)有不同的性能表現(xiàn)。
劉之指出,“目前獨(dú)立部署DeepSeek-R1滿血版的成本仍太高,所以我們直接采用云服務(wù)廠商的API!
鈦媒體注意到,科銳國(guó)際在2023年下半年就公開表示,已經(jīng)訓(xùn)練了面向技能與招聘的行業(yè)級(jí)預(yù)訓(xùn)練語(yǔ)言模型CRE(CareerInternational Recruitment Embedding)。
但科銳國(guó)際如今沒有選擇直接走訓(xùn)練行業(yè)垂直大模型的路線,而是選擇以行業(yè)垂直的Embedding模型和RAG技術(shù)為核心技術(shù)路線?其J國(guó)際在2023年的兩點(diǎn)判斷是:一是AI的計(jì)算范式開始轉(zhuǎn)變,即通過大量數(shù)據(jù)和算力而非單純依賴模型架構(gòu)的改進(jìn)來(lái)提升性能。這不僅僅是大模型,也包括其他模型。比如時(shí)間序列模型、Embedding模型等;二是通用大模型的集中化趨勢(shì)是肯定的,而垂直行業(yè)大模型面臨諸多難以短期解決的技術(shù)難題。例如小模型的推理能力和知識(shí)不夠,而大模型又難以微調(diào)且知識(shí)陳舊。
科銳國(guó)際一直在研發(fā)Embedding模型和提供RAG能力的MatchSystem匹配系統(tǒng),以提升招聘效率和精準(zhǔn)性。
劉之對(duì)鈦媒體指出,“大模型總是要接入企業(yè)內(nèi)部數(shù)據(jù)的,F(xiàn)在就三種方法:RAG、ICL上下文學(xué)習(xí)和微調(diào)。在擁有大量數(shù)據(jù)的情況下,RAG這條路是繞不過去的。而RAG又離不開搜索系統(tǒng)和Embedding!
從2022年科銳國(guó)際開始布局?jǐn)?shù)據(jù)中臺(tái)建設(shè),逐漸構(gòu)建了一個(gè)龐大的數(shù)據(jù)系統(tǒng)。這些數(shù)據(jù)廣泛覆蓋20多個(gè)行業(yè)與細(xì)分領(lǐng)域。數(shù)據(jù)的多樣性使得CRE Embedding模型能夠在真實(shí)場(chǎng)景中更好地貼合實(shí)際分布,從而有效提升匹配的精準(zhǔn)度和效率。
據(jù)劉之透露,CRE Embedding模型基于700GB公開數(shù)據(jù)和40GB行業(yè)簡(jiǎn)歷與招聘需求數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練和任務(wù)微調(diào)。它能夠深刻理解崗位需求和候選人簡(jiǎn)歷中的復(fù)雜語(yǔ)義關(guān)系。由于招聘數(shù)據(jù)與連貫性文本是不同的兩類數(shù)據(jù),招聘數(shù)據(jù)不需要從頭到尾閱讀,通常會(huì)采用掃視閱讀。因此在模型架構(gòu)設(shè)計(jì)時(shí)更加關(guān)心局部關(guān)系。同時(shí),通過多粒度特征融合和Transformer變體等技術(shù)使得CRE模型更符合招聘場(chǎng)景。
另外,Embedding模型也有一些缺陷是需要關(guān)鍵詞檢索來(lái)進(jìn)行彌補(bǔ)的,因此MatchSystem是一個(gè)結(jié)合Embedding和關(guān)鍵詞檢索的混合檢索系統(tǒng)。同時(shí),MatchSystem也結(jié)合了RAG(檢索增強(qiáng)生成),以滿足一些更靈活的查詢需求。
針對(duì)MatchSystem匹配系統(tǒng)的研發(fā)路徑,劉之告訴鈦媒體,“其實(shí)我們走到這一步,不只是大環(huán)境的影響,而是原來(lái)的技術(shù)方案確實(shí)不奏效了!
以招聘場(chǎng)景中“人崗匹配”為例,過去招聘系統(tǒng)會(huì)使用一些標(biāo)簽或者知識(shí)圖譜的方法,以實(shí)現(xiàn)人崗匹配。但這種匹配在一些中高端崗位中就會(huì)遇到問題,“比如招聘一位高級(jí)算法工程師,其實(shí)這個(gè)崗位是很難去定義的,對(duì)崗位人員使用的技術(shù)棧、工具平臺(tái)、解決的問題和業(yè)務(wù)場(chǎng)景(推廣搜)等等都有諸多考量。”崗位細(xì)分類型多、招聘需求因“崗”而異,為獵頭顧問帶來(lái)了不小的匹配難度。開源模型如智譜的向量模型BGE并不能滿足招聘場(chǎng)景的需求,所以才開始自研。
在他看來(lái),“招聘業(yè)務(wù)核心要解決匹配撮合,但不同的崗位和層次的痛點(diǎn)都不一樣,所以解決方案也要進(jìn)行調(diào)整。在基礎(chǔ)崗位和初級(jí)崗位的招聘中,AI技術(shù)應(yīng)該更強(qiáng)調(diào)自動(dòng)化,例如通過自動(dòng)化篩選簡(jiǎn)歷,自動(dòng)聯(lián)系和跟進(jìn);而在中高端崗位招聘領(lǐng)域,AI技術(shù)應(yīng)該更強(qiáng)調(diào)輔助,例如通過智能分析候選人背景和崗位適配度,幫助獵頭顧問更精準(zhǔn)地定位目標(biāo)候選人。基礎(chǔ)和初級(jí)崗位的招聘有望實(shí)現(xiàn)全流程自動(dòng)化,而中高級(jí)崗位的招聘在部分流程中也將實(shí)現(xiàn)部分自動(dòng)化!
據(jù)悉,MatchSystem可準(zhǔn)確匹配垂直類崗位的招聘需求,而不是泛泛的匹配。例如算法工程師這個(gè)崗位是非常細(xì)分的,但是通過MatchSystem系統(tǒng),哪怕是細(xì)微的招聘差別,它都能實(shí)現(xiàn)精準(zhǔn)匹配。再比如,在獲客方面,原先需要花費(fèi)一周時(shí)間來(lái)匹配候選人與企業(yè)用人需求的繁瑣過程,現(xiàn)在通過MatchSystem系統(tǒng)可以實(shí)時(shí)完成。
“隨著實(shí)時(shí)多模態(tài)大模型、長(zhǎng)上下文、推理大模型等技術(shù)的逐漸成熟,科銳國(guó)際將抓住Agents的最佳進(jìn)入時(shí)機(jī),于2025年將推出PC端尋訪自動(dòng)化Agent和關(guān)系圖譜預(yù)測(cè)的CRN(CareerInternational Relation Network)等!眲⒅硎尽(本文首發(fā)于鈦媒體APP,作者 | 楊麗,編輯 | 蓋虹達(dá))
更多精彩內(nèi)容,關(guān)注鈦媒體微信號(hào)(ID:taimeiti),或者下載鈦媒體App