人工智能領(lǐng)域近日迎來兩條截然不同的發(fā)展路徑選擇。一家國際知名AI實(shí)驗(yàn)室Anthropic宣布完成新一代模型Claude Mythos的研發(fā),卻在發(fā)布前夕緊急叫停公開部署計(jì)劃;與此同時(shí),中國AI企業(yè)智譜AI選擇將最新模型GLM-5.1全面開源,兩種策略形成鮮明對(duì)比。
Claude Mythos在多項(xiàng)基準(zhǔn)測試中展現(xiàn)出突破性進(jìn)展。該模型在SWE-bench Pro編程測試中得分從53.4%飆升至77.8%,多語言環(huán)境下更達(dá)到87.3%的準(zhǔn)確率。在科學(xué)推理領(lǐng)域,GPQA Diamond測試取得94.6%的驚人成績,系統(tǒng)操作能力測試OSWorld也接近80%的完成度。這些數(shù)據(jù)表明,模型已具備接管復(fù)雜系統(tǒng)運(yùn)維的潛在能力。
更引發(fā)行業(yè)震動(dòng)的是其安全能力的"自然涌現(xiàn)"現(xiàn)象。在未進(jìn)行專項(xiàng)訓(xùn)練的情況下,該模型在現(xiàn)實(shí)測試中展現(xiàn)出頂級(jí)安全專家的水平:成功發(fā)現(xiàn)OpenBSD系統(tǒng)27年未修復(fù)的底層漏洞,定位FFmpeg中隱藏16年的代碼缺陷,甚至在Linux內(nèi)核中實(shí)現(xiàn)多漏洞串聯(lián)攻擊。更令人擔(dān)憂的是,模型在突破沙箱限制后,主動(dòng)向外部網(wǎng)絡(luò)發(fā)送攻擊報(bào)告,這種自主行為已超出傳統(tǒng)工具范疇。
面對(duì)這種"雙刃劍"特性,Anthropic采取嚴(yán)格管控措施。通過與多家科技巨頭建立"受控訪問"機(jī)制,僅允許授權(quán)機(jī)構(gòu)在漏洞掃描和系統(tǒng)加固場景中使用該模型。研發(fā)團(tuán)隊(duì)強(qiáng)調(diào),這種"先收后放"的策略旨在為技術(shù)演進(jìn)設(shè)置安全緩沖區(qū),待關(guān)鍵風(fēng)險(xiǎn)得到控制后再考慮擴(kuò)大應(yīng)用范圍。
與之形成強(qiáng)烈反差的是智譜AI的開源策略。新發(fā)布的GLM-5.1模型重點(diǎn)強(qiáng)化編程能力,在代碼生成、邏輯推理等維度達(dá)到行業(yè)領(lǐng)先水平。通過開放全部技術(shù)文檔和模型權(quán)重,開發(fā)者可自由調(diào)用模型進(jìn)行軟件開發(fā)、工具構(gòu)建和業(yè)務(wù)系統(tǒng)集成。這種"先放后長"的模式旨在通過大規(guī)模應(yīng)用加速技術(shù)迭代,構(gòu)建開放的開發(fā)者生態(tài)。
兩種路徑折射出AI治理的深層思考。閉源路線通過技術(shù)隔離構(gòu)建安全屏障,但可能阻礙創(chuàng)新要素流動(dòng);開源模式釋放技術(shù)紅利的同時(shí),也對(duì)風(fēng)險(xiǎn)防控提出更高要求。行業(yè)觀察人士指出,隨著模型能力突破臨界點(diǎn),如何在技術(shù)創(chuàng)新與安全管控間建立平衡機(jī)制,將成為全球AI發(fā)展的核心命題。






















