91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

蘋果DeepMMSearch-R1模型:用“圖像裁剪術(shù)”攻克AI視覺搜索難題

   發(fā)布時間:2026-01-15 15:01 作者:馮璃月

蘋果公司近日在人工智能領(lǐng)域取得重要進展,其研發(fā)團隊發(fā)表的研究論文詳細介紹了一款名為DeepMMSearch-R1的新型AI模型。該模型針對復(fù)雜視覺場景下的信息檢索問題進行了深度優(yōu)化,通過創(chuàng)新技術(shù)解決了傳統(tǒng)AI模型在處理多要素視覺任務(wù)時常見的準確性不足問題。

傳統(tǒng)AI模型在面對包含多個視覺元素的復(fù)合問題時,往往難以精準定位關(guān)鍵信息。例如當詢問"畫面左上角鳥類的最高飛行速度"時,現(xiàn)有模型可能因無法聚焦局部細節(jié)而返回整個鳥群的平均速度數(shù)據(jù)。這種"答非所問"或"漏看關(guān)鍵信息"的現(xiàn)象,在醫(yī)療影像分析、工業(yè)質(zhì)檢等需要高精度識別的場景中尤為突出。

DeepMMSearch-R1的核心突破在于引入了視覺定位工具系統(tǒng)。該系統(tǒng)通過動態(tài)圖像裁剪技術(shù),能夠自動識別并隔離干擾元素,將處理范圍聚焦于目標區(qū)域。這種"先定位后驗證"的處理流程,使模型在保持整體場景理解能力的同時,顯著提升了微小目標的識別精度。研究團隊特別設(shè)計了雙重驗證機制,確保裁剪后的圖像信息仍能保持語義完整性。

為平衡計算效率與處理精度,研發(fā)團隊創(chuàng)新性地采用混合訓(xùn)練策略。通過監(jiān)督微調(diào)技術(shù),模型學(xué)習(xí)在何種場景下需要啟動裁剪功能,避免不必要的計算資源消耗;結(jié)合在線強化學(xué)習(xí)算法,持續(xù)優(yōu)化工具調(diào)用的時機與范圍。這種訓(xùn)練方式使模型在保持響應(yīng)速度的同時,將準確率提升了37%。

獨立測試表明,在需要精確圖文匹配的任務(wù)中,DeepMMSearch-R1的表現(xiàn)明顯優(yōu)于現(xiàn)有檢索增強生成(RAG)系統(tǒng)及提示詞驅(qū)動的搜索智能體。特別是在處理包含遮擋、重疊或微小元素的復(fù)雜圖像時,該模型能準確識別并提取關(guān)鍵信息,有效解決了AI系統(tǒng)在常識性事實檢索中常見的"簡化處理"問題。目前研究團隊正在探索該技術(shù)在自動駕駛、遠程醫(yī)療等領(lǐng)域的應(yīng)用可能性。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群