91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡媒體

谷歌深夜放大招!深度研究Agent升級,交互API上線,生態(tài)再擴容

   發(fā)布時間:2025-12-12 18:40 作者:趙云飛

谷歌近日在人工智能領域再次發(fā)力,一口氣推出三項重要舉措,涵蓋Agent功能更新、開源基準測試以及全新交互接口,進一步鞏固其在AI賽道的領先地位。此次更新不僅提升了現(xiàn)有技術的實用性,還為開發(fā)者提供了更強大的工具鏈,推動AI應用向更深層次發(fā)展。

作為核心更新,Deep Research Agent迎來功能升級并首次向開發(fā)者開放。該Agent基于Gemini 3 Pro模型構建,專為處理長期上下文采集與綜合任務設計。通過多步強化學習技術,它能夠自主導航復雜信息環(huán)境,實現(xiàn)高精度搜索。此次更新重點優(yōu)化了網(wǎng)頁搜索能力,使其能夠深入特定網(wǎng)站挖掘數(shù)據(jù),同時降低了生成研究報告的成本。據(jù)測試數(shù)據(jù)顯示,新版本在完整HLE測試中得分46.4%,超越Gemini 3 Pro的43.2%和GPT-5 Pro的38.9%,在DeepSearchQA和BrowseComp基準測試中也以微弱優(yōu)勢領先。目前該技術已應用于金融服務、生物技術及市場調(diào)研等領域,幫助用戶完成初步調(diào)研任務。

為評估Agent在網(wǎng)絡研究任務中的全面性,谷歌同步開源了新基準測試DeepSearchQA。該基準包含900個手工設計的"因果鏈"任務,覆蓋17個專業(yè)領域,每項任務均需多步推理完成。與傳統(tǒng)事實性測試不同,DeepSearchQA更注重答案的詳盡程度,要求Agent生成包含完整推理鏈的解答集。這種設計不僅考察準確性,還評估信息檢索的記憶能力。測試發(fā)現(xiàn),當允許Agent執(zhí)行更多搜索步驟時,其性能顯著提升,為衡量"思考時長"效率提供了新工具。

全新推出的交互API(Interactions API)為開發(fā)者提供了統(tǒng)一入口,支持與Gemini模型及Agent的高效交互。該接口原生集成復雜上下文管理功能,可處理交錯消息、思維鏈、工具調(diào)用等場景。開發(fā)者通過ADK開發(fā)套件和A2A協(xié)議即可調(diào)用服務,享受服務器端狀態(tài)管理、可解釋數(shù)據(jù)模型等特性。特別值得關注的是,API內(nèi)置了Deep Research Agent,未來還將擴展支持更多谷歌內(nèi)置Agent及第三方定制Agent。技術文檔顯示,該接口采用單一RESTful端點設計,支持通過模型參數(shù)或Agent參數(shù)進行靈活調(diào)用,并提供背景執(zhí)行、遠程MCP工具支持等高級功能。

這些更新標志著谷歌AI生態(tài)進入新階段。通過降低研究型Agent的使用門檻,提供標準化評估體系,以及構建統(tǒng)一開發(fā)接口,谷歌正在為AI應用開發(fā)創(chuàng)造更友好的環(huán)境。據(jù)悉,后續(xù)更新將聚焦于可視化輸出能力,包括原生圖表生成功能,同時通過MCP協(xié)議支持更便捷的數(shù)據(jù)源接入,最終目標是將Deep Research技術引入企業(yè)級Vertex AI平臺。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群