前特斯拉AI總監(jiān)、OpenAI聯(lián)合創(chuàng)始人安德烈·卡帕西近日在其個人博客中發(fā)表深度分析,指出2025年將成為大模型發(fā)展的關(guān)鍵轉(zhuǎn)折年。他通過系統(tǒng)梳理行業(yè)動態(tài)發(fā)現(xiàn),當(dāng)前技術(shù)對大模型潛力的開發(fā)程度不足10%,這些系統(tǒng)既展現(xiàn)出超越預(yù)期的智能水平,又在特定場景中暴露出明顯局限。
在訓(xùn)練范式革新方面,基于可驗證獎勵的強化學(xué)習(xí)(RLVR)正取代傳統(tǒng)方法成為主流。這種新范式通過數(shù)學(xué)證明、代碼執(zhí)行等客觀驗證場景,引導(dǎo)模型自主發(fā)展出類推理能力。卡帕西特別指出,DeepSeek R1論文展示的案例表明,模型已學(xué)會將復(fù)雜問題拆解為中間步驟,并采用多輪驗證策略解決問題。這種訓(xùn)練方式雖然計算成本高昂,但性價比顯著優(yōu)于監(jiān)督微調(diào),促使各大實驗室將原本用于預(yù)訓(xùn)練的資源轉(zhuǎn)向強化學(xué)習(xí)階段。
智能形態(tài)的認知轉(zhuǎn)變引發(fā)行業(yè)熱議。卡帕西強調(diào)大模型本質(zhì)是"數(shù)據(jù)幽靈",其能力邊界由訓(xùn)練數(shù)據(jù)和優(yōu)化目標(biāo)決定,與生物智能存在根本差異。這種特性導(dǎo)致模型在特定領(lǐng)域表現(xiàn)卓越,卻在簡單任務(wù)中頻繁出錯,形成獨特的鋸齒狀能力曲線。他警示當(dāng)前基準(zhǔn)測試體系面臨信任危機,實驗室通過針對性訓(xùn)練刷分的現(xiàn)象,使得測試結(jié)果與實際應(yīng)用能力嚴(yán)重脫節(jié)。
應(yīng)用層創(chuàng)新呈現(xiàn)垂直化趨勢。AI編程工具Cursor的崛起印證了專業(yè)系統(tǒng)構(gòu)建的可行性,這類工具通過編排多模型調(diào)用、整合私有數(shù)據(jù),形成解決復(fù)雜任務(wù)的工作流。卡帕西認為,通用大模型與垂直應(yīng)用的分工將日益清晰,前者培養(yǎng)基礎(chǔ)能力,后者通過微調(diào)激活專業(yè)潛能。這種模式在醫(yī)療、法律等領(lǐng)域已顯現(xiàn)巨大價值。
交互方式革新方面,本地化智能體成為新焦點。Anthropic推出的Claude Code突破性地將AI運行在開發(fā)者終端,直接調(diào)用本地環(huán)境、數(shù)據(jù)和上下文。這種設(shè)計使AI不再是云端服務(wù),而是成為駐留設(shè)備的智能助手。卡帕西批評OpenAI早期將智能體局限于云端容器的策略,認為在技術(shù)漸進發(fā)展階段,本地化部署更符合實際需求。
編程門檻的消解催生"氛圍編程"(Vibe Coding)新范式。借助自然語言交互,非專業(yè)用戶現(xiàn)在能夠創(chuàng)建功能完整的程序,專業(yè)開發(fā)者則可快速實現(xiàn)創(chuàng)意原型。卡帕西分享的個人經(jīng)驗顯示,他通過這種方式開發(fā)了多個實用工具,包括Rust分詞器、臨時調(diào)試應(yīng)用等。這種趨勢正在重塑軟件生態(tài),使代碼變得"可塑、臨時且用后即棄"。
輸出形態(tài)的視覺化轉(zhuǎn)型加速推進。谷歌的Nano Banana模型展示了圖形界面生成的突破性進展,該模型將文本理解、圖像創(chuàng)作與世界知識深度融合,能夠自動生成信息圖、動畫視頻等多媒體內(nèi)容。卡帕西認為,這標(biāo)志著大模型開始突破文本交互的局限,向更符合人類認知習(xí)慣的呈現(xiàn)方式演進。早期實現(xiàn)形式如Markdown標(biāo)注的流行,已預(yù)示這種變革的必然性。






















