OpenAI于近日正式推出全新圖像生成模型GPT Image 1.5,并同步在ChatGPT平臺上線獨立“Images”功能模塊。這款被定義為“旗艦級”的模型不僅在圖像質(zhì)量上實現(xiàn)突破,更在指令理解能力方面展現(xiàn)出顯著優(yōu)勢。用戶現(xiàn)在可通過網(wǎng)頁端chatgpt.com或移動應(yīng)用側(cè)邊欄直接訪問該功能,全球所有ChatGPT用戶及API開發(fā)者均可使用。
新模型最核心的升級在于精準的指令執(zhí)行能力。無論是從零創(chuàng)作圖像,還是基于現(xiàn)有照片進行編輯修改,GPT Image 1.5都能在保持原始圖像關(guān)鍵特征的基礎(chǔ)上,準確完成用戶提出的各項要求。特別是在光線處理、構(gòu)圖布局和人物特征保留等細節(jié)方面,有效解決了傳統(tǒng)AI圖像生成常見的“面目全非”問題。OpenAI展示的案例顯示,該模型甚至能實現(xiàn)逼真的虛擬試衣效果,并支持高度原創(chuàng)性的概念轉(zhuǎn)換。
針對長期困擾AI繪圖領(lǐng)域的文本渲染難題,新版本取得突破性進展。模型現(xiàn)在能夠自然地將文字元素融入圖像場景,生成包含清晰可讀文本的復(fù)合圖像。配合全面升級的編輯工具集,用戶現(xiàn)在可以精確添加、刪除或移動圖像中的任意元素,實現(xiàn)專業(yè)級的圖像處理操作。OpenAI形象地將這種能力比喻為“隨身攜帶的迷你修圖工作室”。
在交互設(shè)計方面,獨立“Images”標簽頁內(nèi)置了多種預(yù)設(shè)濾鏡和創(chuàng)作提示詞庫。這種“開箱即用”的設(shè)計顯著降低了使用門檻,即使非專業(yè)用戶也能快速生成高質(zhì)量圖像。功能上線初期,有用戶發(fā)現(xiàn)生成的月歷存在時間錯誤,后通過其他工具進行了修正,這一插曲從側(cè)面反映出用戶對新生功能的高度關(guān)注。
項目研發(fā)團隊陣容堪稱豪華,由Gabriel Goh擔任技術(shù)負責(zé)人,Adele Li統(tǒng)籌產(chǎn)品落地。值得關(guān)注的是,Sora視頻生成模型負責(zé)人Bill Peebles與DALL-E系列締造者Aditya Ramesh共同參與項目指導(dǎo),這暗示新功能可能融合了視頻生成領(lǐng)域的先進技術(shù)。首席研究官Mark Chen領(lǐng)銜的跨學(xué)科團隊涵蓋核心推理、多模態(tài)處理等關(guān)鍵技術(shù)領(lǐng)域,確保模型在復(fù)雜場景下的穩(wěn)定運行。
為應(yīng)對AI生成內(nèi)容帶來的倫理挑戰(zhàn),OpenAI組建了由二十余位專家構(gòu)成的安全合規(guī)團隊。該部門專門負責(zé)制定內(nèi)容過濾機制、預(yù)防惡意使用,并確保所有生成內(nèi)容符合法律法規(guī)要求。這種將技術(shù)創(chuàng)新與風(fēng)險管控同步推進的策略,展現(xiàn)出企業(yè)級AI應(yīng)用開發(fā)的成熟思路。從技術(shù)研發(fā)到市場推廣的全鏈條團隊配置,凸顯OpenAI將前沿成果轉(zhuǎn)化為消費級產(chǎn)品的系統(tǒng)化能力。




















