谷歌今日正式推出Gemma 4系列開放權(quán)重AI模型,為開發(fā)者提供四種針對不同場景優(yōu)化的本地化解決方案。這一更新不僅在性能上實現(xiàn)顯著突破,更通過許可證調(diào)整回應(yīng)了開發(fā)者社區(qū)長期以來的訴求,標志著谷歌在開放模型領(lǐng)域邁出重要一步。
性能升級是Gemma 4的核心亮點。基于與Gemini 3相同的底層架構(gòu),新模型在推理能力、數(shù)學(xué)計算和指令響應(yīng)方面均有提升。260億參數(shù)的專家混合模型通過動態(tài)激活38億參數(shù)子集,在保持精度的同時將處理速度提升至同類模型前列;310億參數(shù)的稠密模型則通過優(yōu)化參數(shù)質(zhì)量,在生成質(zhì)量上實現(xiàn)突破。針對移動設(shè)備優(yōu)化的20億(E2B)和40億(E4B)參數(shù)模型,通過內(nèi)存管理技術(shù)將延遲降低至接近零水平,同時保持低功耗特性。
硬件適配性方面,谷歌為不同需求提供靈活選擇。高端版本可完整運行在配備80GB顯存的英偉達H100 GPU上,量化后版本則能適配消費級顯卡。移動端模型通過與高通、聯(lián)發(fā)科合作優(yōu)化,已實現(xiàn)在Pixel手機、樹莓派等設(shè)備上的原生部署。測試數(shù)據(jù)顯示,E2B/E4B模型在語音識別、OCR等任務(wù)中的內(nèi)存占用較前代降低30%,電池消耗減少25%。
許可證改革成為本次更新的關(guān)鍵轉(zhuǎn)折。此前采用的定制化協(xié)議因條款嚴苛飽受爭議,新版本全面轉(zhuǎn)向Apache 2.0開源協(xié)議。這一改變消除了數(shù)據(jù)歸屬、模型衍生等限制,開發(fā)者可自由將模型用于商業(yè)項目,且無需擔心谷歌單方面修改使用條款。法律專家指出,此舉將顯著降低企業(yè)采用風險,可能吸引更多傳統(tǒng)行業(yè)開發(fā)者加入生態(tài)。
功能擴展方面,Gemma 4新增對結(jié)構(gòu)化數(shù)據(jù)輸出的原生支持,可直接生成JSON格式響應(yīng),并內(nèi)置函數(shù)調(diào)用能力。代碼生成模塊經(jīng)過專項優(yōu)化,在離線環(huán)境下可達到云端模型90%的代碼質(zhì)量水平。視覺處理能力提升使圖表解析、手寫識別等任務(wù)準確率提高15%,上下文窗口擴展至128K-256K Token,雖不及云端模型的百萬級容量,但已滿足多數(shù)本地應(yīng)用需求。
移動端戰(zhàn)略通過Gemini Nano 4的升級路徑得以明確。谷歌確認下一代手機AI模型將基于Gemma 4的E2B/E4B架構(gòu)開發(fā),現(xiàn)有Pixel設(shè)備上的Nano 3模型已展示出詐騙電話攔截、通話摘要生成等實用功能。開發(fā)者預(yù)覽版現(xiàn)已開放智能體工作流原型設(shè)計,相關(guān)項目將與Nano 4正式版保持兼容。
模型權(quán)重已通過Hugging Face、Kaggle等平臺開放下載,支持完整本地部署。對于有云端需求的用戶,谷歌云提供按需計費服務(wù)。行業(yè)分析師認為,Gemma 4通過性能與靈活性的平衡,可能在醫(yī)療、金融等數(shù)據(jù)敏感領(lǐng)域引發(fā)采用熱潮,其開源策略或?qū)⒅厮蹵I模型市場競爭格局。





















