
智東西(公眾號:zhidxcom)
作者 | ?程茜
編輯 |? 心緣
智東西8月9日報道,本周三、四(si),在(zai)北京舉(ju)行(xing)的(de)Google I/O?Connect?China(2024谷歌開發者(zhe)大會)上,谷歌來自全球不(bu)同領(ling)域的(de)技術專家闡(chan)釋了(le)谷歌的(de)最(zui)新開發者(zhe)工具和技術。
谷歌大中華區總裁陳俊延談道,中國是全球最大的開發者市場之一,過去一年,中國25個開發者團隊,開發了31款游戲和應用,在全球不同地區獲得50個Google Play年度最佳獎項。
此外,谷歌開發者中文網站上推出了谷歌AI頁面,開發者可以獲取相關技術更新與資訊,中文專題頁面的Codelab、Chrome、Web專題頁面均已上線。
一、Gemini三大模型可滿足不同開發需求,小米SU7應用基于Flutter開發
Google Developer X和開(kai)發者關(guan)系副總裁(cai)兼總經理Jeanine?Banks帶(dai)來(lai)了AI工具和技(ji)術更新(xin)的分享。
AI正在從根本上重塑軟件(jian)開(kai)發(fa),讓每一位(wei)開(kai)發(fa)者提(ti)(ti)升開(kai)發(fa)效率,谷歌提(ti)(ti)供了三(san)種不同(tong)規(gui)格的Gemini模型,包括Gemini Nano、Gemini 1.5 Flash、Gemini 1.5 Pro。
其(qi)中Gemini Nano可以直接在設備(bei)端(duan)運行,能實現快速(su)響應和保(bao)護數據(ju)隱(yin)私;Gemini 1.5 Flash是谷歌(ge)目(mu)前最快最經濟的(de)模型,適合(he)處理高容量任務,為開(kai)發者提(ti)供了100萬(wan)個(ge)Tokens的(de)超長上(shang)下(xia)文窗口;Gemini 1.5 Pro的(de)回答質量更高,適合(he)處理復雜任務,谷歌(ge)已經面向(xiang)使用(yong)Gemini 1.5 Pro的(de)所有開(kai)發者開(kai)放了200萬(wan)個(ge)Tokens的(de)上(shang)下(xia)文窗口。
更大的上下(xia)(xia)文窗口可(ke)以提升(sheng)模型性能(neng),還有助于開發(fa)(fa)者(zhe)(zhe)發(fa)(fa)掘新的應用場景,也會消耗大量的計算資源,基于此,谷(gu)歌(ge)近(jin)日為Gemini 1.5 Flash、Gemini 1.5 Pro推出了上下(xia)(xia)文緩存功能(neng),開發(fa)(fa)者(zhe)(zhe)可(ke)以將(jiang)提示(shi)中(zhong)不變的內容進(jin)行緩存,后(hou)續可(ke)以即時調(diao)用。
做出(chu)海應(ying)用的開發者可以使用AI Studio免費使用這些模型,省去(qu)訓練和維護模型的時間。
Gemma系列模型可以滿足開發(fa)者希望根據具(ju)體應(ying)用場景對(dui)AI進行微調的需(xu)求,Jeanine稱,Gemma和(he)Gemini系列模型一脈相承,共享(xiang)底層技術和(he)工具(ju)。
谷(gu)歌已經(jing)正式(shi)發布(bu)Gemma 2模(mo)(mo)型,新增了參數(shu)規(gui)(gui)模(mo)(mo)達到90億和270億的(de)(de)(de)兩(liang)種模(mo)(mo)型。270億參數(shu)規(gui)(gui)模(mo)(mo)的(de)(de)(de)模(mo)(mo)型針對(dui)英偉達GPU進行(xing)了優化(hua),可以在Google Cloud的(de)(de)(de)單(dan)個英偉達GPU、Vertex AI的(de)(de)(de)單(dan)個GPU上高效運行(xing)。
Jeanine稱,Gemma 2的性能表(biao)現超越了參數(shu)規模(mo)比它(ta)大兩倍的模(mo)型(xing)。
Gemini已經集成到Android Studio、Chrome?DevTools等諸多開發工(gong)具中(zhong),可以獲取應用設置、性能數據、日(ri)志和源代碼(ma)等信(xin)息,幫助開發者編(bian)寫、調試和測試代碼(ma)、生成文(wen)檔等。
谷歌開源的(de)應(ying)用開發(fa)框(kuang)架Flutter升(sheng)級(ji)到3.24和(he)Dart 3.5版(ban)本,改進了在macOS上對Platform View和(he)Webview的(de)支持(chi)。新的(de)API早期預覽版(ban)Flutter GPU直接內(nei)置在Flutter SDK中,可以(yi)允(yun)許開發(fa)者使用Dart代碼訪問(wen)GPU,提(ti)升(sheng)圖形的(de)渲染能力。
Jeanine稱,中國的Flutter開發活躍(yue)度(du)位列全球(qiu)前(qian)三。
谷歌正在構建(jian)User Scene的軟件(jian)包,可以將不(bu)同(tong)行業標準的3D模型(xing)直接導入Flutter項目中。
小米(mi)(mi)電動汽車(che)(che)SU7的(de)配置應用就是基于Flutter打造,小米(mi)(mi)汽車(che)(che)的(de)應用程(cheng)序提供了(le)一(yi)整套功能(neng),可以實現遠程(cheng)車(che)(che)輛控制(zhi)、接收車(che)(che)輛狀態(tai)的(de)實時(shi)更新等。小米(mi)(mi)汽車(che)(che)智能(neng)座艙手機APP客(ke)戶端高級研發工程(cheng)師陳作斌談道,他(ta)們預估使(shi)用Flutter比使(shi)用原生框(kuang)架的(de)效率要(yao)高60%。
此外,Android Studio Project IDX的早(zao)期預覽(lan)版已經推(tui)出(chu),完(wan)全運行在瀏覽(lan)器中,開(kai)發(fa)者可(ke)以快(kuai)速(su)搭建起(qi)運行Android Studio的工(gong)作區,開(kai)始編寫、構建和測(ce)試原生Android應用(yong)。本地Android Studio和云端(duan)IDX工(gong)作區都(dou)可(ke)以滿足開(kai)發(fa)者開(kai)發(fa)需求。
在安(an)全性方(fang)面, Firebase?AI Monitoring可以實時監(jian)控開發者使(shi)用(yong)大語言模(mo)型構建(jian)的(de)功能,在生產環境下的(de)性能和(he)行為,目前這一產品處(chu)于(yu)非公開預覽(lan)階(jie)段。谷歌還推出(chu)了Checks AI Safety,可以用(yong)于(yu)評估監(jian)控和(he)監(jian)督AI模(mo)型和(he)代理(li)的(de)合規性。
三、Gemini Nano已內置Chrome桌面客戶端,多項UI設計工具已發布
設(she)備端的(de)AI模(mo)型為云端模(mo)型提供(gong)了(le)補充(chong),讓(rang)開(kai)發者能以更低(di)的(de)成(cheng)本、更少的(de)容量限制、更強的(de)數據隱私保護來交付(fu)解(jie)決方(fang)案,無(wu)論基(ji)于(yu)哪(na)個模(mo)型構建(jian)響(xiang)應(ying)AI功能,WebGPU和Web Assembly都是端側Web AI的(de)基(ji)石。
WebGPU已經支(zhi)持(chi)16位浮點數值,Web Assembly集成了(le)Memory 64和JavaScript Promise,基于(yu)此,開(kai)發(fa)者(zhe)構建的模型(xing)可以在全球絕大多數設備上高效運行(xing)。
谷歌Chrome開發技術推廣部(bu)主(zhu)管Paul?Kinlan談(tan)道,視頻彈(dan)幕平臺(tai)BiliBili結合使用了Web Assembly和(he)MediaPipe的圖像(xiang)識別(bie)技術,成功實(shi)現了彈(dan)幕不(bu)遮擋(dang)畫面人物的功能,使得會話時長增加30%,點(dian)擊率增長19%。
從(cong)Chrome 126瀏覽(lan)器版本(ben)開(kai)始,Gemini Nano會(hui)直接內(nei)置到(dao)Chrome桌面客戶端(duan)中。其中“幫(bang)(bang)我寫”這個(ge)功(gong)能(neng)就(jiu)可以幫(bang)(bang)助海外(wai)用(yong)戶撰寫商品評價(jia)、客戶反饋等(deng)。為了實現這個(ge)功(gong)能(neng),谷歌對Gemini模型(xing)最高效版本(ben)進行了微調。
谷歌(ge)還在開(kai)(kai)(kai)發Prompt API,開(kai)(kai)(kai)發者可(ke)以通過這一工(gong)具使(shi)用自然語言,向Chrome中的Gemini Nano發送指令,全程不會有數據(ju)離開(kai)(kai)(kai)本地設備(bei)。
強大的AI功能離不開優質UI,谷歌也(ye)推(tui)出了(le)新(xin)功能幫助開發者(zhe)打造應用。
谷(gu)歌發布Speculation Rules API,可以通(tong)過在后臺預(yu)讀(du)取、預(yu)渲染頁面,提升站內的瀏覽速(su)度。面向單頁應用,谷(gu)歌推(tui)出(chu)了View Transitions API,可以實現更加順暢的導航。
在(zai)(zai)調試和優(you)化應(ying)用方(fang)面,Chrome Devtools能夠在(zai)(zai)網站發生(sheng)錯誤時發出警告和提(ti)(ti)示,同時Chrome Devtools Insight可(ke)以快速分(fen)析問(wen)題所在(zai)(zai),并(bing)且根據代碼提(ti)(ti)供(gong)合(he)理的(de)解決方(fang)案。
三、Gemini Nano沒網也可運行,Compose簡化跨設備應用構建流程
谷(gu)歌安(an)卓開發技術推廣部(bu)主管史婧羽談道,使用(yong)Gemini Nano實現的AI功能不需要網(wang)絡就可以在設備上完成(cheng)所有操作。
Gemini Nano通過(guo)AICore系統服務(wu)實(shi)現,為了應對管理打包(bao)和分發大語言模(mo)型的復雜(za)難題,AICore可以負責管理設備上的基礎模(mo)型,開發者能直接使(shi)用。
Gemini Nano和AICore現已登陸谷歌Pixel 8和三星Galaxy S24系列。
未來幾(ji)個月(yue),谷歌(ge)將進一(yi)步開放Gemini Nano的使用權限。
今年(nian),谷(gu)歌將(jiang)支(zhi)持(chi)跨平臺(tai)代碼(ma)復(fu)用(yong)技術Kotlin Multiplatform用(yong)于業務端,使得開(kai)發者(zhe)可(ke)以在Web、服務器和桌面平臺(tai)間(jian)共享代碼(ma)。谷(gu)歌在DataStore、ViewModel、Room等多個Jetpack庫添加(jia)了Kotlin Multiplatform支(zhi)持(chi)。
寫作(zuo)工具Compose增加了(le)共(gong)享(xiang)元素過渡(du)等功(gong)能,可以(yi)幫開(kai)發者處(chu)理過渡(du)中大小變化、文字動(dong)畫等,同(tong)時原(yuan)生支持了(le)預(yu)測返回(hui)手勢。谷歌打造了(le)一系(xi)列新Compose API,幫助開(kai)發者構建符合設(she)計規(gui)范的自適應布(bu)局。
谷歌聯合小米、OPPO、三星等手(shou)機(ji)玩(wan)家,將這些品(pin)牌的設(she)備實驗(yan)室接(jie)入由FireBase支持的Android Device Streaming測試平臺,開發(fa)者(zhe)可以在真機(ji)設(she)備上直接(jie)驗(yan)證自適應(ying)應(ying)用,包括折疊屏手(shou)機(ji)和(he)平板電腦。
谷歌同樣助(zhu)力和簡化了困難的(de)開(kai)發任務,例如Android Studio中的(de)Crashlytics功能,不(bu)僅(jin)可以在(zai)源代碼中快速(su)定位錯誤,還能基于Gemini的(de)分析能力提供修復(fu)建(jian)議。
開發者可(ke)以在內置(zhi)AI隱私設置(zhi)中,選(xuan)擇分享或不分享哪些(xie)數據。
四、拆解谷歌云端新平臺五大特征,Vertex AI一站搞定模型訓練、調優和部署
Google Cloud首席布(bu)道師Richard Seroter介紹了(le)谷(gu)歌打(da)造的(de)云端新(xin)平(ping)臺的(de)五個特征。
首先(xian)是(shi)實力超群,優勢獨享。云端(duan)新平臺能帶來全新構建方式、自(zi)動化、多功能、深度集成等。Vertex AI可以一站搞定模型訓(xun)練、調優和部署(shu)。
Gemini 1.5 Pro可(ke)以(yi)支持超200萬(wan)個Tokens的(de)上下文窗口,相當于2小(xiao)時(shi)視頻(pin)、20小(xiao)時(shi)音頻(pin)、1500頁文檔和6萬(wan)行(xing)代(dai)碼。Vertex AI在處理谷(gu)歌中國(guo)一段25萬(wan)個Tokens的(de)講座視頻(pin)時(shi),Gemini 1.5 Pro可(ke)以(yi)同時(shi)識別視頻(pin)中的(de)聲音和畫面,并能自動翻譯。
其次是自成體(ti)系(xi),靈活拓展。Google Cloud可以配置服務生產(chan)集(ji)默認值(zhi),及(ji)對開源接口的(de)支持。Vertex AI中提供了150多(duo)種模型(xing),包(bao)括谷歌(ge)自家、Anthropic、Meta等發布的(de)模型(xing)。
第三是(shi)破除壁壘(lei),便捷跨云。云端新(xin)平(ping)臺(tai)可以為開發者(zhe)量(liang)身打造解決方案,滿足(zu)其在(zai)本地JKE集群(qun)部署(shu)(shu)或者(zhe)其他(ta)云平(ping)臺(tai)部署(shu)(shu)的需求(qiu),讓用(yong)戶(hu)在(zai)不(bu)同云平(ping)臺(tai)之間遷移(yi)和管(guan)理資(zi)源。如BigQuery Omni允許用(yong)戶(hu)在(zai)多個主流云平(ping)臺(tai)上(shang)運行BigQuery而無需遷移(yi)數據;AloyDB Omni提供了無限制的數據庫部署(shu)(shu)環境。
第四是(shi)化(hua)繁為(wei)簡,輕松構建(jian)(jian)。Google Cloud平臺(tai)通(tong)過自(zi)動化(hua)和(he)智能(neng)默認設(she)置,簡化(hua)了(le)云(yun)基礎設(she)施的搭建(jian)(jian)和(he)管(guan)理(li)過程。現(xian)在開發者可以在45分鐘內搭建(jian)(jian)起生產級的云(yun)基礎設(she)施,實現(xian)多方面功能(neng)。
最后是AI助力,智能(neng)隨心(xin)。Gemini for Google Cloud深度融(rong)入云體驗,包(bao)括IDE插件提供代碼生(sheng)成、補全(quan)、解釋和測試生(sheng)成等(deng)功能(neng);Gemini in Databases將AI智能(neng)融(rong)入SQL生(sheng)成、數據(ju)庫(ku)操(cao)作等(deng)任務。
結語:谷歌用AI新工具,助力中國開發者出海
谷(gu)歌此(ci)次重磅發布了新的(de)(de)開發工(gong)具,可以為(wei)開發者(zhe)提供更強大的(de)(de)功能和更便捷的(de)(de)界(jie)面,幫助開發者(zhe)基(ji)于大模型能力更快速(su)地構建、測試和部署應用程(cheng)序。
從Gemini API的(de)強大數據處理能力(li)到谷歌AI Studio的(de)集成開發環境,再到AI技術的(de)跨平臺(tai)應(ying)用(yong)(yong),谷歌正不斷幫助開發者拓寬應(ying)用(yong)(yong)構(gou)建的(de)邊(bian)界,這或許會加速國(guo)內開發者更(geng)快構(gou)建應(ying)用(yong)(yong),讓(rang)產品在全球市場更(geng)具競爭力(li)。