展會信息港展會大全

科大訊飛:聯(lián)手華為攻克難題,底座模型對標GPT-4o
來源:互聯(lián)網(wǎng)   發(fā)布日期:2025-01-16 06:58:16   瀏覽:220次  

導讀:1月15日,科大訊飛宣布推出當前全國產(chǎn)算力平臺上唯一的深度推理大模型訊飛星火X1。該模型中文數(shù)學能力國內(nèi)第一,并率先應用于教育、醫(yī)療等剛需場景。同時,訊飛星火4.0 Turbo底座能力再次迎來全新升級,圖文、數(shù)學和長文本能力顯著提升,并首發(fā)混域知識搜索技術,進一步解決行業(yè)、企業(yè)痛點。此外,作為國內(nèi)智能翻譯領域的佼佼者,科大訊飛還推出了業(yè)界首個具備端到端語音到語音 ......

1月15日,科大訊飛宣布推出當前全國產(chǎn)算力平臺上唯一的深度推理大模型訊飛星火X1。該模型中文數(shù)學能力國內(nèi)第一,并率先應用于教育、醫(yī)療等剛需場景。

同時,訊飛星火4.0 Turbo底座能力再次迎來全新升級,圖文、數(shù)學和長文本能力顯著提升,并首發(fā)混域知識搜索技術,進一步解決行業(yè)、企業(yè)痛點。

此外,作為國內(nèi)智能翻譯領域的佼佼者,科大訊飛還推出了業(yè)界首個具備端到端語音到語音同傳能力的大模型星火語音同傳大模型,最快語音同傳時延小于5秒。

聯(lián)手華為

一直以來,訊飛星火堅持走全國產(chǎn)化路線。該公司表示,盡管在全國產(chǎn)算力平臺上訓練深度推理模型遭遇了諸多挑戰(zhàn),但科大訊飛攜手華為,成功攻克了訓練推理強交互、高吞吐推理優(yōu)化以及國產(chǎn)算子優(yōu)化等一系列難題,最終成功訓練出我國首個基于全國產(chǎn)算力訓練的具備深度思考和推理能力的大模型訊飛星火X1。

發(fā)布會上,科大訊飛研究院的研究員們依次展示了訊飛星火X1解答高考題、AIME競賽題以及高中奧賽題的表現(xiàn)。訊飛星火X1不僅準確給出了這些題目的答案,還對解題思路和步驟進行了詳細拆解。與通用大模型相比,其解題過程更接近人類的“慢思考”方式。

過程中,訊飛星火X1充分展現(xiàn)深度推理模型的三大典型特征:化繁為簡,將復雜問題分步拆解簡化;進行自我探索和反思驗證;基于答案正確與否的優(yōu)質(zhì)反饋信息進行強化訓練。

值得一提的是,訊飛星火X1在近期參加的小初高(含競賽)、大學(含競賽)、AIME、MATH 500等多項“考試”中成績十分亮眼,用更少的算力,實現(xiàn)了業(yè)界一流的效果,多項指標國內(nèi)第一。

科大訊飛:聯(lián)手華為攻克難題,底座模型對標GPT-4o

科大訊飛表示,目前訊飛星火X1率先在教育等真實場景中實現(xiàn)了應用落地。去年1024,科大訊飛聯(lián)合中國教育科學研究院發(fā)布了基于“問題鏈”的高中數(shù)學智能教師助手。同時也正面向全國百個試點區(qū)域、聯(lián)合千名優(yōu)秀教研員和老師打造上萬個優(yōu)秀案例。

醫(yī)療領域,訊飛火X1的模型策略已取得初步驗證成效,可使得?戚o助診斷和復雜病歷內(nèi)涵質(zhì)控的準確率均達90%。發(fā)布會上,科大訊飛還宣布將在今年上半年正式發(fā)布基于訊飛星火X1的醫(yī)療大模型升級版。

訊飛星火4.0 Turbo底座能力再升級

此次發(fā)布會,訊飛星火4.0 Turbo底座能力實現(xiàn)了全新升級,七大核心能力全面提升,全面對標OpenAI最新版的GPT-4o。此次升級最重要的特點,是針對行業(yè)、企業(yè)的痛點問題,在數(shù)學能力、行業(yè)知識、圖文識別、長文本能力等能力上實現(xiàn)提升。

科大訊飛:聯(lián)手華為攻克難題,底座模型對標GPT-4o

數(shù)學能力一直是訊飛星火的強項,此次基于訊飛星火X1的高質(zhì)量合成數(shù)據(jù),訊飛星火4.0 Turbo的數(shù)學能力變得更強,可以在數(shù)學教學、金融分析和科研推演等工作中更好的幫助用戶。

圖文識別能力直接關乎著企業(yè)能否高效的采編和利用行業(yè)、私域數(shù)據(jù),是大模型“學習”的基礎。在各行各業(yè)的實際工作中,經(jīng)常面臨圖文識別的“疑難雜癥”:如醫(yī)療的體檢報告、法院的文書、學術論文、企業(yè)合同等,還有復雜長表格、雜亂板式、手寫公式、印章手寫合同、傾斜少線等情況,訊飛星火4.0 Turbo圖文識別能力升級,使得通用文檔版面分析、文字識別的準確率相對提升了40%,復雜表格結(jié)構、潦草手寫文字等方面的準確率相對提升了60%,可以解決上述難題、大幅提升高價值數(shù)據(jù)的獲取能力。

此次升級還針對性地提升了文檔要素檢測能力,在知識切分和構建的粒度上更加精細、準確,能有效防止大模型幻覺,同時發(fā)布了掃描文檔解析的極速版本,文檔理解速度提升了10倍以上。對于一份500頁的項目文件,從掃描、識別到解析的全過程,僅需2分鐘即可全部完成。

大模型的長文本能力一直是用戶關注的重點,特別是在企業(yè)知識問答這類嚴謹?shù)膽脠鼍爸,用戶對大模型幻覺的容忍度幾乎為零。因此,訊飛星火推出了基于智能體的全新長文本框架,并行業(yè)首發(fā)了句子級溯源功能。這一新框架優(yōu)化了超長注意力機制,同時利用大規(guī)模網(wǎng)頁和書籍數(shù)據(jù)進行知識關聯(lián)式合成,使得知識回復的錯誤率降低了40%,句子級溯源效果更是超越了GPT-4o,顯著緩解了問答搜索服務中因大模型幻覺而需要反復溯源確認的應用落地難題。

考慮到不少用戶在寫報告、做調(diào)研這類工作時,往往需要花費大量時間搜集信息、整理資料,基于圖文、長文本能力的提升和行業(yè)應用能力的積累,訊飛星火行業(yè)首發(fā)了混域知識搜索技術。該技術能夠?qū)崿F(xiàn)對個人知識、企業(yè)知識、業(yè)務系統(tǒng)數(shù)據(jù)、精品行業(yè)數(shù)據(jù)以及互聯(lián)網(wǎng)信息的綜合搜索,用戶只需一次提問,即可獲得綜合搜索后的結(jié)果,大大提升信息搜索效率。

根據(jù)第三方數(shù)據(jù),2024年,訊飛星火在大模型中標數(shù)量和中標金額上取得“雙第一”,尤其是在能源、金融、汽車、運營商等行業(yè),與客戶共同打磨了近百個智能體應用。

科大訊飛:聯(lián)手華為攻克難題,底座模型對標GPT-4o

基于“技術+應用”的不斷正向循環(huán),訊飛星火4.0 Turbo的行業(yè)能力全面提升,金融、油氣、能源、電力、鋼鐵、 航司等領域綜合能力的絕對提升全部超過10%。

首發(fā)星火語音同傳大模型

發(fā)布會上,科大訊飛帶來了在智能翻譯領域又一突破:針對日常對話、商務交流、行業(yè)翻譯等國際交流場景中的高難度同傳翻譯需求,發(fā)布了國內(nèi)首個具備端到端語音同傳能力的大模型星火語音同傳大模型。該模型通過模仿人類同傳譯員的思維鏈路進行訓練,具備實時意群理解和切分、上下文語境精準選詞以及碎片化信息重組的能力,這一特性使得星火語音同傳大模型在處理復雜句式和語境時表現(xiàn)出色,能夠迅速準確地傳達原意。

科大訊飛:聯(lián)手華為攻克難題,底座模型對標GPT-4o

技術測試結(jié)果顯示,即便將訊飛的語音同傳技術和國外最優(yōu)競品的交傳技術對比,訊飛語音同傳在內(nèi)容完整度、信息準確度以及語言質(zhì)量上都處于領先水平,同時星火語音同傳大模型還可以最快實現(xiàn)僅5秒的同傳時延,達到人類專家譯員的水平。

集成了最新的同傳技術的產(chǎn)品用起來怎么樣?訊飛翻譯機的產(chǎn)品經(jīng)理也進行了演示。無論是海外旅游場景中的景點介紹,還是國際展會上的專業(yè)產(chǎn)品介紹,翻譯機能在短時間內(nèi)完成高質(zhì)量的英到中和中到英的雙向同傳任務。

除了端到端的語音同傳能力,星火語音同傳大模型還促進了語音到文字翻譯效果的提升,使得科大訊飛全系產(chǎn)品的翻譯能力都得到顯著提升,在日常對話、單人演講、影視節(jié)目,包括場景更復雜、翻譯難度更高的多人會議等場景以及醫(yī)療等專業(yè)領域,為各種國際交流場景提供高質(zhì)量翻譯服務。

本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權,不得轉(zhuǎn)載。

贊助本站

AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港