智快網 - 新科技與新能源行業網絡媒體

DeepSeek與Kimi技術“撞車”背后:中國開源AI雙子星攜手改寫全球格局

   發布時間:2026-04-27 00:25 作者:柳晴雪

中國AI開源領域迎來重大突破,DeepSeek與Kimi兩大模型近期接連發布新一代產品,引發全球技術社區高度關注。4月24日,沉寂15個月的DeepSeek正式開源全新模型DeepSeek-V4,該模型支持百萬詞元超長上下文,在Agent能力、世界知識儲備及推理性能方面實現質的飛躍,被海外開發者譽為"鯨魚回歸"。同日發布的Artificial Analysis智能指數榜單顯示,DeepSeek V4 Pro(Max)以52分躍居全球開源模型第二位,較上一代提升10分。

僅隔四天,中國另一開源力量Kimi發布萬億參數模型Kimi K2.6,該模型以54分成績登頂Humanity’s Last Exam全工具測試,在DeepSearchQA深度檢索任務中取得92.5%的領先得分。值得關注的是,K2.6成為全球前五開源模型中唯一支持圖片與視頻理解的多模態模型,其余四款均為純文本模型。這兩款萬億參數級模型的密集發布,標志著中國AI開源陣營正式向國際巨頭發起挑戰。

在底層架構創新方面,兩家企業展現出深度技術協同。DeepSeek V4訓練方案中引入的Muon優化器,其技術源頭可追溯至Kimi團隊2025年2月發表的論文《Muon is Scalable for LLM Training》。該論文首次驗證Muon在480億參數模型中的有效性,為后續萬億參數模型訓練奠定基礎。Kimi K2.6通過改進該優化器,在相同訓練量下實現2倍token效率提升,而DeepSeek V4則將其列為架構層三大關鍵升級之一,顯著增強訓練穩定性。英偉達GTC 2026大會上,黃仁勛選擇Kimi K2.5作為展示Blackwell Ultra芯片性能的基準模型,進一步印證中國開源模型的技術影響力。

商業競爭層面,中國開源模型展現出顯著成本優勢。OpenAI在DeepSeek V4發布前夕推出的GPT-5.5,每百萬輸出token定價30美元,而DeepSeek V4 Pro僅需24元人民幣(約3.4美元),價格僅為前者的十分之一。價格策略背后,是國產算力生態的突破性進展——DeepSeek V4明確支持華為昇騰950芯片,通過芯模協同技術實現高吞吐推理部署;Kimi K2.6則采用國產芯片混合推理方案,從K2 Thinking版本開始應用的INT4量化技術,使其對國產加速芯片兼容性提升40%。華為官方披露,昇騰超節點已完成對兩大模型的全面適配,預計下半年批量上市后將推動服務價格進一步下探。

這場技術競賽的參與者,是兩位來自廣東的創業者——量化投資出身的梁文鋒與學術背景深厚的楊植麟。盡管年齡相差八歲,但兩人均將開源視為AI發展的核心驅動力。梁文鋒團隊通過DeepSeek構建起從推理模型到多模態系統的完整技術棧,楊植麟團隊則憑借Kimi在數學推理與混合架構領域建立優勢。這種差異化競爭與協同創新并存的模式,正在重塑全球AI產業格局。meta最新發布的Muse Spark模型,直接將DeepSeek與Kimi作為基準對比對象,印證中國開源力量已成為國際巨頭不可忽視的競爭對手。

 
 
更多>同類內容
全站最新
熱門內容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群