智東西(公眾號:zhidxcom)
作者 | 李水青
編輯 | 云鵬

智東西8月15日消息,今天,谷歌推出史上最小Gemma 3開源模型,一個擁有2.7億個參數的輕量級模型,底層設計以特定任務微調為目標,具備強大的指令跟蹤和文本能力

在指令執行能(neng)力(li)測(ce)試中(zhong),如IFEval基準測(ce)試所示,Gemma 3 270M超越了尺寸(cun)更大的Qwen2.5 0.5B Instruct,與(yu)Llama 3.2 1B能(neng)力(li)比(bi)肩(jian)。

僅0.27B參數!谷歌開源史上最小Gemma 3,手機能跑,25次對話耗電不到1%

Gemma 3 270M在一些特定任務上能達到甚至超越大模型的能力。該模型的尺寸和性能使其非常適合離線、基于網頁的創意任務。比如(ru)谷歌公布了(le)一(yi)個案例,其(qi)用(yong)(yong)Gemma 3 270M驅動一(yi)款使用(yong)(yong)Transformers.js的睡(shui)前(qian)故事生成器網頁應用(yong)(yong),通過簡(jian)單的勾選(xuan)就(jiu)可以生成精彩的睡(shui)前(qian)故事。

僅0.27B參數!谷歌開源史上最小Gemma 3,手機能跑,25次對話耗電不到1%

Gemma 3 270M的核心能力(li)如下:

1、輕量而強大的架構。該(gai)模(mo)(mo)型(xing)共(gong)有(you)2.7億(yi)(yi)個參(can)數(shu),由于(yu)詞匯量龐大(da),嵌入參(can)數(shu)有(you)1.7億(yi)(yi)個,Transformer模(mo)(mo)塊參(can)數(shu)有(you)1億(yi)(yi)個。得(de)益(yi)于(yu)256k個token的(de)(de)龐大(da)詞匯量,該(gai)模(mo)(mo)型(xing)能夠處理特定(ding)和稀有(you)的(de)(de)token,使其成為可在特定(ding)領域和語言中進一步微調的(de)(de)優質基礎模(mo)(mo)型(xing)。

2、極致能效。 該模型的一大優勢在于低功耗,其在Pixel 9 Pro SoC上進行的內部測試表明,INT4量化模型在25次對話中僅消耗0.75%的電量,使其成為谷歌最節能的Gemma模型。

3、指令遵循。該模型同步發布了指(zhi)令(ling)(ling)微調版本與預訓(xun)練檢查點(dian)(checkpoint)。雖然該模型并非(fei)為復雜的對話用(yong)例(li)而設計,但其基礎指(zhi)令(ling)(ling)遵循能力出(chu)色,可(ke) “開箱即用(yong)” 地響應通用(yong)指(zhi)令(ling)(ling)。

4、可用于生產的量化。模型(xing)提供量化感知(zhi)訓練(Quantization-Aware Trained, QAT)檢查點,支(zhi)持以INT4精度運(yun)行,且性能損(sun)失(shi)極小,這對于在資(zi)源受限設(she)備(bei)(如手(shou)機、邊緣設(she)備(bei))上部署至關重(zhong)要(yao)。

換句(ju)話說,如(ru)果用戶有(you)(you)一個(ge)高容量、定義明(ming)確(que)的(de)任務(wu),在成本上需要精打細算,又需要快速(su)迭(die)代(dai)和部署(shu),或是有(you)(you)保護隱(yin)私的(de)需求,他都適合選(xuan)擇Gemma 3 270M。

Hugging Face地址:
//huggingface.co/collections/google/gemma-3-release-67c6c6f89c4f76621268bb6d

結語:輕量化模型釋放端側智能

此前,谷歌Gemma開(kai)源模(mo)型加(jia)速(su)迭代:先是適用于(yu)單云和桌面加(jia)速(su)器的(de)Gemma 3和Gemma 3 QAT發(fa)布,隨后是將強大(da)實時多模(mo)態(tai)AI直接引入邊緣設備的(de)Gemma 3n推(tui)出(chu),本次Gemma 3 270M的(de)推(tui)出(chu)填補了(le)輕量模(mo)型版塊。

輕(qing)量化模型正在打(da)破(po)參數迷信。大(da)模型領(ling)域長期存在 “參數規(gui)模決定性能(neng)” 的固有認知,Gemma 3 270M展現(xian)出小(xiao)模型遵循指令的能(neng)力以及微調后(hou)的威力。從(cong)輕(qing)量而強(qiang)大(da)的模型入手,用戶(hu)可以構建精簡、快速(su)且運(yun)行成本顯著(zhu)降低的生產系統。