智快網 - 新科技與新能源行業網絡媒體

GPT Image 2發布背后:研究科學家陳博遠揭秘官網圖片生成趣事

   發布時間:2026-05-03 07:35 作者:蘇婉清

在OpenAI最新發布的GPT Image 2技術分享中,研究科學家陳博遠以獨特視角揭秘了這場視覺盛宴背后的創作故事。作為模型核心訓練成員,他不僅主導了中文渲染能力的突破性優化,更在發布會現場與CEO山姆·奧特曼共同演示了多語言文本生成功能。這位華裔科學家透露,團隊在模型代號選擇上頗費心思——"duct-tape"(布基膠帶)的命名靈感源自現代藝術經典:用膠帶將香蕉粘貼在墻面上的裝置藝術,這一隱喻恰如其分地體現了技術突破的顛覆性。

在LMArena雙盲測試中,該模型以顯著優勢領先第二名"小香蕉"代號團隊。陳博遠展示的測試圖表顯示,GPT Image 2在圖像細節處理和語義理解維度形成斷層式領先。這位科學家特別強調了中文環境的優化成果:"我們讓模型在海報右下角生成了比頭發絲還細的中文文本,這種多層級畫中畫結構都是一次性生成的。"他展示的漫畫作品驗證了這一能力——畫面中不僅包含多國語言文本,更通過畫中畫結構嵌套了三層視覺信息,最終呈現效果與真實拍攝的漫畫書別無二致。

技術團隊在視覺推理能力的突破上另辟蹊徑。陳博遠設計的數學證明挑戰題頗具匠心:要求模型在黑板上用圖形而非代數方式證明奇數之和等于平方數。這個需要空間想象力的任務,成功驗證了模型超越傳統語言模型的視覺推理能力。更令人驚嘆的是4K細節測試圖——在堆疊的米粒中,某顆米粒表面刻有肉眼難辨的微型文字,這種級別的細節處理標志著生成式AI進入微觀視覺時代。

發布會隱藏的彩蛋機制引發技術圈熱議。當演示自動生成二維碼功能時,首批掃描者意外獲得了限量數字獎品,這種將技術演示與用戶互動結合的創新形式獲得廣泛好評。陳博遠特別感謝跨部門協作:"從市場團隊的藝術設計到工程團隊的細節打磨,每個環節都展現出驚人的執行力。"這場融合技術深度與藝術創意的發布會,不僅展示了AI生成技術的最新進展,更重新定義了人機協作的創作邊界。

 
 
更多>同類內容
全站最新
熱門內容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群