智快網 - 新科技與新能源行業網絡媒體

DeepSeek“識圖模式”上線測試:從辨物到算命,多模態潛力初顯

   發布時間:2026-04-30 02:02 作者:楊凌霄

近日,DeepSeek平臺悄然開啟了一項備受矚目的新功能——識圖模式灰度測試。部分幸運用戶發現,在DeepSeek首頁新增了一個“識圖模式”入口,只需上傳圖片,該系統便能像人類一樣理解畫面內容,無論是物體識別還是場景分析,都展現出強大的能力,這標志著DeepSeek在多模態領域邁出了重要一步。

多位DeepSeek研究員第一時間在社交平臺分享了這一消息。研究員陳德里興奮地表示,這一功能得益于團隊中“天才多模態同事們”的辛勤付出,如今DeepSeek終于擁有了“看見世界”的能力。這一表述引發了眾多網友的關注和討論,大家紛紛期待能夠親身體驗這一新功能。

為了驗證識圖模式的實際效果,我們獲得了灰度測試資格并進行了多輪測試。在基礎識物測試中,我們上傳了一張兔子的照片,DeepSeek迅速識別出兔子的品種,并詳細描述了它的姿態,展現出精準的識別能力。隨后,我們加大了測試難度,上傳了一張杭州靈隱寺的照片。照片中,“靈隱寺”字樣僅出現在右下角路燈的草書上,對人類而言也頗具挑戰。然而,DeepSeek根據建筑風格和路燈字樣,迅速判斷出這是靈隱寺,并給出了準確的經緯度信息,生成速度極快,令人印象深刻。

在應對視覺陷阱方面,DeepSeek同樣表現出色。我們上傳了一張包含視覺錯覺的圖片,圖中物品的擺放容易讓人誤以為有個人坐在椅子上。但DeepSeek并未被誤導,它準確識別出圖中的墻面修補痕跡、垃圾收集區和雜物等,展現了強大的視覺解析能力。

DeepSeek的視覺模式還支持深度思考功能。我們上傳了一張隨手拍的照片,圖中沒有任何文字參考。開啟推理模式后,DeepSeek的視覺能力顯著提升。它分步驟拆解畫面信息,全面分析前景、中景和背景的所有細節,然后將地標特征與地理區域進行匹配,成功判斷出山脈是燕山山脈,建筑風格在北京昌平等郊區很常見,最終將范圍縮小到北京昌平區或海淀山后地區,部分猜測與實際位置相差不到10公里。

我們還嘗試了有趣的看手相玩法。上傳圖片后,DeepSeek起初將左手誤判為右手,但在實際分析階段,它對手相形態的描述基本符合事實,分析過程也頗具條理,至于具體內容的可信度,則因人而異了。

此前,DeepSeek雖一直致力于多模態研究,并曾發布開源多模態模型Janus等成果,但始終未在產品中向公眾開放多模態能力。此次識圖模式的灰度測試,無疑填補了這一空白。隨著AI技術的不斷發展,多模態內容已成為擴展AI認知世界觸角的重要途徑,也更貼近人類理解世界的方式。雖然目前識圖模式仍處于測試階段,但它已充分展現了DeepSeek在視覺解析與跨模態推理方面的巨大潛力。

 
 
更多>同類內容
全站最新
熱門內容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群