人工智能開發(fā)工具Codex迎來重大變革,其功能邊界從單純的代碼生成擴(kuò)展至全流程電腦操作,這一轉(zhuǎn)變被官方形容為“Codex for (almost) everything”。此次更新標(biāo)志著Codex從單一編程輔助工具向智能化工作流中樞的進(jìn)化,其核心突破在于實(shí)現(xiàn)跨應(yīng)用、跨時(shí)間的任務(wù)執(zhí)行能力。
最引人注目的革新是桌面級交互能力。更新后的Codex通過視覺識別屏幕內(nèi)容、模擬鼠標(biāo)鍵盤操作的方式,直接操控本地應(yīng)用程序。這種突破性設(shè)計(jì)使其擺脫了對API接口的依賴,能夠處理設(shè)計(jì)軟件、內(nèi)部系統(tǒng)等無開放接口的工具。在macOS系統(tǒng)上,用戶可同時(shí)運(yùn)行多個(gè)AI代理,它們在后臺自主切換應(yīng)用窗口,而不會干擾正常辦公流程。該功能計(jì)劃逐步向其他操作系統(tǒng)擴(kuò)展。
網(wǎng)頁交互領(lǐng)域同樣實(shí)現(xiàn)突破。內(nèi)置瀏覽器支持用戶通過圈選界面元素、標(biāo)注區(qū)域等方式生成操作指令,前端開發(fā)者可直接在生成頁面上標(biāo)注修改需求。官方透露未來將擴(kuò)展瀏覽器控制權(quán)限,最終實(shí)現(xiàn)跨網(wǎng)絡(luò)環(huán)境的完整操作能力。配合新增的原生圖像生成模塊,開發(fā)者可基于gpt-image-1.5模型直接生成界面素材,無需調(diào)用外部API。
這種工作流整合模式引發(fā)行業(yè)對"AI操作系統(tǒng)"的討論。相較于OpenClaw通過接口調(diào)用工具的路徑,Codex選擇將AI能力內(nèi)嵌至系統(tǒng)底層,實(shí)現(xiàn)應(yīng)用層面的直接操控。這種差異或與OpenClaw創(chuàng)始人Peter Steinberger加盟OpenAI存在關(guān)聯(lián),但更本質(zhì)的動因在于構(gòu)建覆蓋全場景的超級應(yīng)用生態(tài)。據(jù)統(tǒng)計(jì),Codex周活躍用戶已突破300萬,其中近半數(shù)使用場景涉及非編程任務(wù)。
競爭格局方面,Perplexity AI同期推出"Personal Computer"桌面應(yīng)用,整合本地文件管理與瀏覽器操作,采用Claude Opus 4.7作為核心協(xié)作模型。Anthropic的產(chǎn)品雖具備多工具調(diào)用能力,但尚未形成統(tǒng)一的桌面級操作系統(tǒng)。國內(nèi)科技企業(yè)則同步推進(jìn)Agent體系構(gòu)建與本地環(huán)境適配,全球AI競爭正從模型性能轉(zhuǎn)向工作流滲透深度。























