站內搜索 | 手機版

智快網 - 新科技與新能源行業網絡媒體

當前位置：智快網 > 科技 > 正文內容

蘋果推出Pico-Banana-400K數據集，為文本引導圖像編輯模型提供優質訓練資源

發布時間：2025-10-29 14:05 來源：快訊作者：江紫萱

蘋果公司近日宣布推出一項名為《Pico-Banana-400K：面向文本引導圖像編輯的大規模數據集》的研究成果，并同步公開了包含40萬張圖像的完整數據集。該數據集采用非商業性研究許可協議發布，允許全球學術機構和研究人員自由使用，但明確禁止商業用途。這一舉措旨在解決當前圖像編輯領域數據集質量參差不齊、共享性受限等核心問題。

研究團隊指出，盡管近年來圖像生成與編輯技術取得顯著突破，但開放研究仍面臨關鍵瓶頸?，F有數據集普遍存在三大缺陷：依賴專有模型生成的合成數據、人工篩選子集規模有限、以及領域偏移與質量控制不一致等問題。這些缺陷直接導致魯棒圖像編輯模型的開發受阻。為突破這一局限，蘋果團隊歷時數月構建了Pico-Banana-400K數據集。

該數據集的構建流程體現了嚴格的篩選機制。研究人員首先從OpenImages數據集中精選涵蓋人物、物體及文字場景的多樣化真實照片，隨后設計了35類圖像修改指令，并劃分為八大編輯類別。具體包括像素與光度調整（如添加復古濾鏡）、以人為中心的編輯（如生成Funko-Pop風格形象）、場景構成編輯（如天氣條件變換）、對象級語義修改（如物體空間關系調整）等。

在技術實現層面，團隊采用谷歌的Gemini-2.5系列模型完成核心工作。每張原始圖像與編輯指令輸入至Nanon-Banana模型（即Gemini 2.5-Flash-Image）生成編輯結果后，需通過Gemini 2.5-Pro模型的雙重驗證：評估編輯是否精準遵循指令，并確保視覺質量達標。只有通過嚴格篩選的樣本才會被納入最終數據集。

數據集的創新性體現在其結構設計上。除包含單輪編輯樣本外，還首次引入多輪連續編輯序列，模擬真實場景中的漸進式修改需求。更值得關注的是"偏好對"樣本的收錄——通過對比成功與失敗的編輯結果，為模型提供區分優質輸出的學習范例。這種設計有助于提升下一代文本引導圖像編輯模型的判斷能力。

研究團隊坦承，當前使用的Nanon-Banana模型在精細空間控制、布局外推及文字排版處理方面仍存在改進空間。但他們強調，Pico-Banana-400K的核心價值在于為行業提供首個可復現、高質量的訓練與評測基準。目前，相關研究論文已上線預印本平臺arXiv，完整數據集則在GitHub平臺向全球研究者開放下載。

更多>同類內容

網傳小米SU7將改款漲價？客服與專賣店雙雙回應：暫無相關通知

11-11

理想汽車CEO李想談iPhone Air：輕薄稱手但續航有挑戰，整體滿意

11-11

天馬“天工屏”亮相廈門，以三大技術突破定義高端顯示新標準

09-19

華為鴻蒙HarmonyOS 6升級：取消“NEXT”后綴，新增多種實用功能

09-19

Meta攜手Oakley推運動智能眼鏡Vanguard，續航強、設計輕或成市場新寵

09-19

Meta Connect大會發布AI智能眼鏡：799美元起售，配全彩屏與神經腕帶

09-19

AMD發布銳龍PRO 9000系列商用處理器：6/8/12核可選 5.4GHz加速頻率兼顧能效

09-18

?格力朱磊談玫瑰空調爭議：眼見為實，現場觀者皆贊其美，董明珠堅持創新?

09-18

星紀魅族CEO黃質潘確認：魅族23新機立項，預計明年年中與消費者見面

09-18

蘋果macOS 26正式版來襲：適配多款機型，新功能設計亮點一覽

09-17

商務部反傾銷調查啟動，國產模擬芯片乘勢而上，加速崛起正當時

09-17

OPPO Find X9 Pro攜“真2億”長焦登場，哈蘇認證與黑科技共筑影像新標桿

09-17

日本2025年Q2手機市場：蘋果49%份額領跑，三星成黑馬，小米成唯一國產品牌上榜

09-13

2025年Q2全球智能手機TOP10：三星蘋果穩居前二，華為成最大黑馬，國產手機占八席

09-13

華為Mate XTs非凡大師起售17999元，備貨40-60萬臺開售即罄，三折疊引領生產力新潮

09-13

點擊查看更多 +

全站最新

華為廣汽強強聯合！啟境汽車11月20日開啟高端智能新能源新篇章

華為廣汽強強聯合！啟境汽車11月20日開啟高端智能新能源新篇章

小米SU7改款車型來襲交付周期大幅縮短引關注

小米SU7改款車型來襲交付周期大幅縮短引關注

宇樹科技G1-D輪式人形機器人上線，攜全棧方案助力開發者高效研發

宇樹科技G1-D輪式人形機器人上線，攜全棧方案助力開發者高效研發

京東雙11手機榜單揭曉：iPhone 17系列強勢登頂，國產手機競爭激烈

京東雙11手機榜單揭曉：iPhone 17系列強勢登頂，國產手機競爭激烈

榮耀400系列成績亮眼！肖戰代言助力，全球發貨量超600萬臺

榮耀400系列成績亮眼！肖戰代言助力，全球發貨量超600萬臺

網傳小米SU7將改款漲價？客服與專賣店雙雙回應：暫無相關通知

網傳小米SU7將改款漲價？客服與專賣店雙雙回應：暫無相關通知

理想汽車CEO李想談iPhone Air：輕薄稱手但續航有挑戰，整體滿意

理想汽車CEO李想談iPhone Air：輕薄稱手但續航有挑戰，整體滿意

榮耀李健烏鎮發聲：阿爾法戰略推進，智慧手機生態建設成果顯著

榮耀李健烏鎮發聲：阿爾法戰略推進，智慧手機生態建設成果顯著

熱門內容

本欄最新

網傳小米SU7將改款漲價？客服與專賣店雙雙回應：暫無相關通知

網傳小米SU7將改款漲價？客服與專賣店雙雙回應：暫無相關通知

理想汽車CEO李想談iPhone Air：輕薄稱手但續航有挑戰，整體滿意

理想汽車CEO李想談iPhone Air：輕薄稱手但續航有挑戰，整體滿意

天馬“天工屏”亮相廈門，以三大技術突破定義高端顯示新標準

天馬“天工屏”亮相廈門，以三大技術突破定義高端顯示新標準

華為鴻蒙HarmonyOS 6升級：取消“NEXT”后綴，新增多種實用功能

華為鴻蒙HarmonyOS 6升級：取消“NEXT”后綴，新增多種實用功能

Meta攜手Oakley推運動智能眼鏡Vanguard，續航強、設計輕或成市場新寵

Meta攜手Oakley推運動智能眼鏡Vanguard，續航強、設計輕或成市場新寵

Meta Connect大會發布AI智能眼鏡：799美元起售，配全彩屏與神經腕帶

Meta Connect大會發布AI智能眼鏡：799美元起售，配全彩屏與神經腕帶

AMD發布銳龍PRO 9000系列商用處理器：6/8/12核可選 5.4GHz加速頻率兼顧能效

AMD發布銳龍PRO 9000系列商用處理器：6/8/12核可選 5.4GHz加速頻率兼顧能效

?格力朱磊談玫瑰空調爭議：眼見為實，現場觀者皆贊其美，董明珠堅持創新?

?格力朱磊談玫瑰空調爭議：眼見為實，現場觀者皆贊其美，董明珠堅持創新?

智快實驗室評測約稿合作微信：netspread（注明:智快科技）簡體繁體根據客戶端智慧切換，如顯示有問題，請點擊頁面右上角的簡繁切換功能！
Copyright ? 2016-2021 zhikuai.com All rights reserved. 魯ICP備20033456號

微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群