4月20日,科大訊飛深度推理大模型——訊飛星火X1迎來全新升級。作為當前業界仅有基於全國產算力訓練的深度推理大模型,升級后的星火X1在數學、代碼、邏輯推理、文本生成、語言了解、知識問答等通用任務上效果顯著进步,在模型參數比業界同類模型小一個數量級的情況下,整體效果對標OpenAI o1和DeepSeek R1,再次証明晰基於國產算力訓練的全棧自主可控大模型具備登頂業界顶配水平的實力和持續創新的潛力。
星火X1除了在常見通用任務获得顯著進步之外,由於融入了更多場景復雜類型數據,模型的泛化性也获得了進步,多個行業任務上展現出了業界領先的才能。在重點行業如教育、醫療、司法等進一步擴大了領先優勢。
面向企業和廣大開發者,訊飛星火X1首發“快考虑、慢考虑統一模型”,全新升級模型定制優化东西鏈,進一步下降大模型私有化布置和定制門檻﹔同時,訊飛星火X1 API已上線訊飛開放渠道開放服務,作為首個支撑全國產算力微調的推理大模型,訊飛星斗MaaS渠道同步上線了星火X1微調服務。
升級后的星火X1在多個任務上效果繼續打破,展現出優異的功用。根據最新測試集評測結果,星火X1在通用任務效果評測中全面對標OpenAI o1和DeepSeek R1,在數學、知識問答等方面表現杰出。
數學答題和復雜的數理邏輯推理方面,星火X1能夠准確識別出復雜的數學公式,不僅給出完好的解題思路,輸出結果也嚴謹明晰﹔在邏輯推理時全方位考虑,考虑或许出現的每一種假設,表現出更強的嚴謹性和准確性。代碼才能上,星火X1不僅进步了代碼生成的准確率,對生成代碼邏輯了解也進一步进步,能夠應對更復雜的編程需求,考虑問題的多種或许性,幫助開發者快速實現功用。在語言了解方面,模型輸出內容、格局更符合用戶指令要求,能夠給到愈加准確且深度考虑的結果,生成內容愈加連貫、准確。
此外,星火X1的長思維鏈才能支撑圖像輸入,能够對輸入的圖像進行關聯考虑,對於圖像中的多種復雜元素,探求或许的含義和意图,進行更深層次的信息整合和推理。
本次星火X1升級不僅进步了通用才能,也同步增強了面向行業的解決计划才能,助力產業智能化轉型。由於融入了更多場景復雜類型數據,模型的泛化性也获得了進步,多個行業任務上展現出了業界領先的才能。在重點行業,如教育、醫療、司法等進一步擴大了領先優勢。以司法行業為例,對於行業專業需求,例如根據资料總結案件事實以及判決理由,升級后的星火X1能夠精准掌握用戶指令,詳細剖析爭議點,快速定位關鍵信息,並輸出准確內容,為行業用戶供给專業、牢靠的智能支撑。
在技術創新和模型布置方面,星火X1首發“快考虑、慢考虑統一模型”,由一個模型同時支撑兩種考虑形式,进步了模型處理不同復雜度任務的才能,滿血版星火X1僅需4張卡(華為910B)即可布置,簡化了私有化布置流程。
同時,星火X1還全新升級了模型定制優化东西鏈,支撑SFT(監督微調)、強化學習兩種模型定制優化计划,隻需16張卡(華為910B)就能够完成行業定制優化,大大下降了企業AI的定制門檻,使各行業能更快捷地落地AI應用價值。
首要,提出基於問題難度的大規模多階段強化學習办法,在復雜推理、數學、代碼、語言了解等場景全方面进步模型效果及泛化性﹔同時提出強化學習動態更新算法,基於樣本採樣長度動態調整強化學習更新速度,進一步进步深度考虑強化學習功率及效果。
其次,統一模型下的快慢考虑混合訓練办法,充沛發揮快慢考虑數據彼此促進效果,實現基於系統指令操控模型是否深度考虑,支撐下流更高效快捷地布置运用﹔
第三,實現多項工程技術創新,顯存動態卸載技術大幅度的进步長文本推理並發、訓推共卡協同實現高效訓推資源轉換、推理引擎蛰伏機制實現快速拉起和恢復,實現國產算力渠道上高效和穩定的強化學習訓練全流程。
在中美科技競爭日趨剧烈的布景下,星火X1選擇的全國產化技術路徑更具深遠意義。最近,科大訊飛與華為昇騰聯合團隊在前期工作基礎上再獲打破,升級MoE模型的PD分離+大規模專家並行系統计划,實現了集群推理功用翻番,包含PD分離布置进步20%+功用、MTP多token預測技術进步30%+整體功用、專家負載均衡算法優化使集群吞吐进步30%+,以及異步雙發射技術下降服務請求調度耗時进步10%系統功用。堅定自主可控算法創新和系統工程創新,使得基於國產算力的星火大模型能夠快速迭代進步,在實際應用場景获得顯著效能優勢,在當前國際形勢下也更具戰略韌性。
此次訊飛星火X1的全面升級,不僅展现了中國人工智能技術在國產算力渠道上的創新打破,也為各行各業數字化轉型供给了新的或许。作為基於國產算力訓練的大模型代表作,星火X1的表現証明,在技術自主可控的道路上,中國AI已具備與國際頂尖模型同台競技的實力。(汪茜茜)
公民日報社概況關於公民網報社招聘招聘英才廣告服務协作加盟供稿服務數據服務網站聲明網站律師信息保護聯系我們
人 民 網 股 份 有 限 公 司 版 權 所 有 ,未 經 書 面 授 權 禁 止 使 用