國產開源大模型領域迎來重要突破——DeepSeek V4正式發布預覽版本并全面開源,其Pro與Flash雙版本模型同步上線API服務。這款基于華為昇騰國產算力架構開發的模型,在性能表現與成本控制上均展現出強勁競爭力,標志著國產大模型在推理環節實現關鍵技術自主化。
技術參數方面,DeepSeek V4 Pro版本以1.6T參數量、49B激活參數和33T預訓練數據構建起強大基座,上下文窗口長度突破性達到1M級別。其輕量化版本Flash則采用284B參數架構,在保持13B激活參數和32T預訓練數據的同時,實現了同等規模的上下文處理能力。這種雙軌設計分別對應網頁端/App的"專家模式"與"快速模式",滿足不同場景需求。
性能測試數據顯示,該模型在多維度評估中表現亮眼:Agentic Coding測評中,Pro版本交付質量已接近Opus 4.6非思考模式水平,在開源模型中位居榜首;世界知識測試僅以微弱差距落后于閉源模型Gemini-Pro-3.1;推理性能更是在已公開評測的開源模型中獨占鰲頭。這些數據印證了官方宣稱的"性能比肩頂級閉源模型"并非虛言。
價格體系成為另一大亮點。當前API服務定價顯示,Pro版本每百萬token輸入(緩存未命中)12元、輸出24元,Flash版本則低至輸入1元、輸出2元。盡管受高端算力限制,Pro版本初期服務吞吐量有限,但官方透露隨著下半年昇騰950超節點批量上市,成本有望進一步下探。這種定價策略不僅在行業內形成顯著優勢,更得益于完全脫離CUDA生態的國產化適配,為后續價格調整預留充足空間。
值得關注的是,此次發布標志著國產頂級開源大模型在關鍵技術領域實現重要突破。通過完全基于華為昇騰架構的開發路徑,DeepSeek V4成功擺脫對英偉達GPU的依賴,在推理環節構建起自主可控的技術體系。這種技術路線選擇不僅降低了硬件成本,更為國產大模型生態的可持續發展提供了新范式。























