近日,高德地圖宣布上線全球首款基于大模型技術(shù)的“視覺認(rèn)知步導(dǎo)”系統(tǒng)——地標(biāo)AI領(lǐng)航。該系統(tǒng)通過整合千問大模型、超億級地理興趣點(POI)數(shù)據(jù)及千萬級街景圖像,首次賦予導(dǎo)航系統(tǒng)“視覺感知+語言理解”的雙重空間智能,讓步行導(dǎo)航更貼近人類自然認(rèn)知習(xí)慣。
傳統(tǒng)步行導(dǎo)航長期存在三大痛點:起步階段方向辨識困難、行程中距離感知模糊、臨近終點時定位不精準(zhǔn)。高德研發(fā)團(tuán)隊通過分析人類指路行為發(fā)現(xiàn),人們習(xí)慣用“穿過藍(lán)色大樓”“右轉(zhuǎn)見紅色招牌”等具象化描述傳遞路線信息,其核心邏輯在于結(jié)合方向指引、地標(biāo)錨定與場景上下文。為復(fù)現(xiàn)這種認(rèn)知模式,系統(tǒng)需構(gòu)建覆蓋真實世界的動態(tài)地理語義網(wǎng)絡(luò)。
技術(shù)實現(xiàn)層面,該系統(tǒng)依托三大基礎(chǔ)能力:包含1.2億個POI的數(shù)據(jù)庫、高精度步行路網(wǎng)拓?fù)浣Y(jié)構(gòu),以及覆蓋全國主要城市的千萬級街景圖像庫。通過千問大模型的多模態(tài)分析能力,系統(tǒng)可自動識別道路設(shè)施、商業(yè)標(biāo)識、建筑特征等實體,并評估其在視覺場景中的顯著程度。例如,在復(fù)雜路口會優(yōu)先選擇地鐵標(biāo)識、銀行招牌等高辨識度地標(biāo)作為參照物。
為提升指引效率,系統(tǒng)采用雙重篩選機(jī)制:在空間維度上,僅在起步、轉(zhuǎn)向、偏航糾正等關(guān)鍵節(jié)點播報;在視覺維度上,通過算法評估地標(biāo)的顏色對比度、尺寸大小、位置關(guān)系等特征,篩選出最易識別的參照物。播報文案設(shè)計摒棄機(jī)械式指令,轉(zhuǎn)而使用“左側(cè)第二個玻璃門”“經(jīng)過星巴克后右轉(zhuǎn)”等口語化表達(dá),并根據(jù)環(huán)境復(fù)雜度動態(tài)調(diào)整信息密度。
實際測試數(shù)據(jù)顯示,使用該系統(tǒng)的用戶在關(guān)鍵路口的路徑確認(rèn)速度平均提升2秒,低頭查看手機(jī)的頻率下降37%。特別對于老年群體、帶兒童家庭及異地游客等場景,這種“直覺式導(dǎo)航”顯著降低了步行出行的認(rèn)知負(fù)擔(dān)。系統(tǒng)目前已在200余個城市上線,后續(xù)將擴(kuò)展至更多語言版本及特殊場景適配。






















