
智東西(公眾號:zhidxcom)
作者 | 江宇
編輯 | 漠影
智(zhi)東西7月(yue)28日報道(dao),“應用來了”2025空間智(zhi)能(neng)應用大會于深(shen)圳圓滿落幕(mu)。大會由百度智(zhi)能(neng)云主辦,南山區科技創新局(ju)指導,NVIDIA提供(gong)支(zhi)持(chi),聚焦大模(mo)型與空間智(zhi)能(neng)融合背景下的(de)產(chan)業應用。
這也是百度繼去年牽頭成(cheng)立空間智能產業(ye)聯(lian)盟后再(zai)次集結生(sheng)態力量,并以三大關鍵詞——AIGC、智能硬件(jian)、IP創新(xin),明確空間智能將進入“從(cong)1到(dao)N”轉折階段(duan)。
在(zai)開場致辭中(zhong),百度(du)智能(neng)(neng)云副總(zong)裁、百度(du)智能(neng)(neng)云泛科(ke)技(ji)業務部總(zong)經(jing)理張(zhang)瑋談到,“我們希望百度(du)在(zai)產(chan)業鏈(lian)當中(zhong)可以作(zuo)為(wei)紐(niu)帶,為(wei)上下游的伙伴提(ti)供技(ji)術的共(gong)研和資源的共(gong)享。”他強調,AI正(zheng)在(zai)成為(wei)空間智能(neng)(neng)的引擎。從(cong)設備、模型(xing)到交互和落(luo)地,百度(du)的目標不是(shi)成為(wei)某一單點工具,而(er)是(shi)作(zuo)為(wei)“平臺型(xing)支撐者”,連接技(ji)術、產(chan)品與應用。
▲百度智能云副總裁,百度智能云泛科技(ji)業務部總經理(li)張瑋
南(nan)山(shan)區創新發(fa)展(zhan)促(cu)進中心(xin)負責人劉(liu)靜在隨后(hou)的演(yan)講中指出,空(kong)(kong)間(jian)智(zhi)能作(zuo)為科創前沿領域,正(zheng)受(shou)到南(nan)山(shan)區高度重視。她詳細介(jie)紹(shao)了南(nan)山(shan)“創業(ye)之星(xing)(xing)NextStar”全球大賽、模力(li)營AI生態社區的情況。今年“創業(ye)之星(xing)(xing)NextStar”全球大賽將設立4029萬元(yuan)獎金(jin)池、5億元(yuan)直投基金(jin)及150萬平方(fang)米產業(ye)空(kong)(kong)間(jian)等配套資源,鼓勵更多空(kong)(kong)間(jian)智(zhi)能企業(ye)在南(nan)山(shan)扎根(gen)發(fa)展(zhan)。
▲南山區創新發展促進中(zhong)心負責(ze)人劉靜
一、空間智能產業初成,快速發展的瓶頸待解
空間智能不僅是一個(ge)技術概(gai)念,更正在(zai)向具(ju)象化的(de)產(chan)業演進,其核心(xin)理念是“虛擬(ni)空間與物理空間的(de)融(rong)合”——通(tong)過AI大模型對(dui)人、物、場(chang)的(de)感(gan)知(zhi)與理解,進而在(zai)虛擬(ni)世界(jie)中實(shi)現(xian)再(zai)現(xian)和(he)互(hu)動,構建具(ju)備(bei)生成力(li)、交互(hu)性和(he)環境感(gan)知(zhi)能力(li)的(de)“數字(zi)空間”。
百度(du)智能(neng)(neng)(neng)云(yun)空間智能(neng)(neng)(neng)行業負責人常佳碩在大會上指出,空間智能(neng)(neng)(neng)的(de)(de)關(guan)鍵在于“讓AI既(ji)能(neng)(neng)(neng)理(li)解人,也能(neng)(neng)(neng)理(li)解物(wu)理(li)世界(jie)的(de)(de)狀態(tai)”,并通過語言、圖像、3D等(deng)(deng)多模態(tai)能(neng)(neng)(neng)力,將這些信息轉化為(wei)虛擬空間中的(de)(de)交互(hu)體驗。未來,AI不再只是(shi)信息處(chu)理(li)工具,而將以眼鏡(jing)、玩具、車載系統(tong)、機器(qi)人等(deng)(deng)智能(neng)(neng)(neng)終端的(de)(de)形態(tai),成為(wei)物(wu)理(li)空間中的(de)(de)組成單元。
▲百度智能(neng)云空間智能(neng)行業負責人(ren)常佳碩
但在這一愿景落地前,行業(ye)還面臨不少現實瓶頸(jing)。當前空間智(zhi)能的(de)推進受限于高(gao)昂的(de)數據采集成(cheng)本、模型(xing)適應性不足、終端(duan)設備標準不一,以及異構算力(li)資源難(nan)以統籌等問題(ti)。這些問題(ti)導(dao)致了項目交付鏈條(tiao)易斷、調試成(cheng)本高(gao)和(he)協作(zuo)效率低。
為(wei)了(le)破解這些結構性(xing)難題,百度正通(tong)過共建平臺機(ji)制(zhi),打通(tong)模型、硬件、內容(rong)之間的協同機(ji)制(zhi),為(wei)產(chan)業生態提(ti)供通(tong)用能(neng)力底座。
二、構建“算力+模型+工具鏈”能力,接住空間智能的產業需求
圍繞空(kong)間智(zhi)能規模化(hua)落地的產業(ye)需求,百度(du)正在加速構建底層技術能力(li)。其核心策略(lve)是通過(guo)“算力(li)+模型+工具鏈”的全棧布局,為企業(ye)提供從開(kai)發到部署的全周(zhou)期(qi)支撐。
百(bai)度(du)智能云已構(gou)建起(qi)從芯(xin)片(pian)(pian)到(dao)大(da)模型的(de)一(yi)體化(hua)體系,底(di)層(ceng)以昆侖芯(xin)片(pian)(pian)提供算力支撐(cheng),配合百(bai)度(du)百(bai)舸GPU云平臺,實現萬卡級(ji)的(de)算力調(diao)度(du);上層(ceng)以文心(xin)(xin)大(da)模型為核心(xin)(xin)大(da)模型,形成穩定的(de)空間智能技術(shu)底(di)座。
在開發工具方(fang)面,百度構建了基于千(qian)帆(fan)大模(mo)型(xing)的一站式平臺,從2D/3D創作、到(dao)大模(mo)型(xing)微(wei)調(diao)、再到(dao)場景生成與虛擬數(shu)字人部署,逐步(bu)建立起(qi)覆蓋2D至(zhi)5D交(jiao)互(hu)的多(duo)模(mo)態(tai)工作流,加速了從創意到(dao)產品的交(jiao)付路徑。
與此同(tong)時,百(bai)度也在算力層面與生態伙伴展(zhan)開深(shen)度合作。
NVIDIA資深解決方案架(jia)構師金國強在(zai)演講中指(zhi)出,當前AIGC模(mo)型(xing)在(zai)推理階段資源消耗(hao)極高(gao),成(cheng)為制(zhi)約空間智能應用落地的重要(yao)瓶(ping)頸。例如,圖像生成(cheng)模(mo)型(xing)Flux參(can)數(shu)規(gui)模(mo)已(yi)達120億,需(xu)執行50步去噪過程;開源視(shi)頻模(mo)型(xing)Wan2.1則達到140億參(can)數(shu),生成(cheng)5秒720P視(shi)頻耗(hao)時超過100分鐘,顯存需(xu)求高(gao)達62GB,難以滿足(zu)高(gao)頻實時調用場景(jing)。
為此,NVIDIA推(tui)出TensorRT推(tui)理引擎(qing)、量(liang)化(hua)壓縮(suo)、模(mo)型(xing)卸載(zai)等(deng)一(yi)系(xi)列(lie)優(you)化(hua)工具,實測可帶來2至3倍的推(tui)理提速、50%以上的顯存壓縮(suo),并已在百度繪想等(deng)視頻模(mo)型(xing)部署(shu)中驗證效果。
▲NVIDIA資深解決方(fang)案架構師金國強
同時,百度云也在(zai)其“百舸(ge)”平臺上與NVIDIA展開合作,共(gong)同緩解(jie)推理瓶頸,為空間智能提供更具可擴展性(xing)的技術支撐(cheng)。
三、空間智能真落地,百度和伙伴們正交付一批真產品
衡量空間智能是(shi)否真(zhen)正進入產業落地階段,最(zui)關鍵的指標之(zhi)一就是(shi):有沒有真(zhen)實交(jiao)付、面向用戶(hu)的項(xiang)目。此次大會展(zhan)(zhan)示了多個“能交(jiao)付、真(zhen)落地”的案例,它(ta)們不僅跑通(tong)了AI的模型(xing)能力與產業的銜(xian)接,還探索出了可持(chi)續發展(zhan)(zhan)的商業路徑。
從(cong)內容創作、三(san)維建模到智能(neng)終端與情感陪伴,空間智能(neng)正(zheng)逐步穿透不同類型的應(ying)用場景(jing),構建起完整的產(chan)業接口能(neng)力。
1、角色生成、建模復原、AI投流:空間智能內容“產線”已成型
2033科(ke)技(ji)是空間智能在內容創作領域的重要落地案例。創始人兼CEO馬宇馳(chi)曾(ceng)主導(dao)三角獸科(ke)技(ji),服務百(bai)度、小(xiao)米、vivo 、oppo等3.5億臺(tai)手(shou)機和1.5億臺(tai)IoT設備(bei),此次(ci)再創業,聚焦普通用戶可用的3D角色(se)生成與多模態交互平臺(tai)。
其(qi)產品已上線灰度版,用戶可(ke)通(tong)過上傳模(mo)型,自定義捏臉、語音、性(xing)格和對話(hua)風格,生成具有動作執行能力的(de)AI角色,并支(zhi)持在3D空(kong)間中完成做飯、講故事、密室互動等(deng)行為。
其系統(tong)由(you)百(bai)億級大模型(xing)與世(shi)界模型(xing)驅動,強調角(jiao)色(se)在“人、時(shi)間、空間、事件”四維下的(de)認(ren)知(zhi)與響應,已支持數(shu)千個用戶角(jiao)色(se)上線(xian),構建起從IP創作到(dao)空間智能(neng)的(de)閉環能(neng)力。
▲2033科技(ji)創始人兼(jian)CEO馬宇(yu)馳
KIRI公司開(kai)辟了從現實視頻復現可交互3D空間的(de)(de)獨特(te)路徑。其(qi)核心產品KIRIEngine已服務200萬用戶,廣(guang)泛應用于3D打印、游(you)戲開(kai)發、電影(ying)特(te)效等(deng)領域,為各行業提供高效的(de)(de)3D模型(xing)解決(jue)方案。?
該公司率先推出的(de)3DGaussSplatting(高(gao)斯濺射(she))技術,大幅(fu)降低建(jian)模門檻(jian),用戶通過(guo)手機拍攝即(ji)可快速生成高(gao)保真3D模型,讓更多人(ren)能參與3D內容創作(zuo)。?
在(zai)C端應用上,KIRI潛力可觀(guan)。櫻花(hua)樹下的紀念影像、藝術(shu)裝置留(liu)存、航建(jian)筑建(jian)模、親人建(jian)模等(deng)場景,為(wei)空間智能在(zai)情感類(lei)與消費類(lei)場景的落地提(ti)供了清(qing)晰案例,讓技(ji)術(shu)更具溫度與實用價值。
▲KIRI創始人兼CEO王正(zheng)男
筷子科(ke)技則(ze)讓AI內容生產走入品(pin)牌營銷主戰場(chang)。其產品(pin)系統以(yi)視(shi)頻(pin)理(li)解與(yu)熱點識(shi)別為底座,提供(gong)從AI素(su)材抓取、視(shi)頻(pin)自動(dong)合成到智能(neng)投(tou)放(fang)的(de)鏈條化流(liu)程,形成支持大規模商業(ye)傳播的(de)“AI內容中臺”。
筷子將AI能(neng)力模塊(kuai)化為(wei)MCP組件(jian),并構建(jian)了商業(ye)鏡頭庫(ku)、熱點素(su)材庫(ku),覆蓋從(cong)創意到分發的(de)內容(rong)(rong)鏈路,為(wei)空間(jian)智能(neng)在“人-內容(rong)(rong)-消費”之間(jian)的(de)落地提供(gong)了模板。
▲筷子科技高級產品(pin)總監陳龍(long)
2、從創作者到開發者,空間智能的“AI工具集”來了
海(hai)馬(ma)云聯合創始人兼副總裁趙珅(shen)展示(shi)了AI工(gong)作流如何承接大模型能力并實現應用交(jiao)付。
其RunningHUB平(ping)臺定(ding)位為面向全球開(kai)發者(zhe)的AIGC共(gong)創平(ping)臺,聚焦圖像、音視頻的AI工作(zuo)流開(kai)發與部署,已吸引來(lai)自154個國家和地區的5萬余(yu)名開(kai)發者(zhe)。
目前,該平(ping)(ping)臺(tai)同時開(kai)放C端入口,用戶可通過小程序(xu)一鍵調用全球開(kai)發(fa)者構建的AI工具。從(cong)基礎算(suan)力到高兼(jian)容(rong)的ComfyUI開(kai)發(fa)框架,海馬(ma)云打(da)造了(le)內容(rong)生產(chan)鏈,也為空間智(zhi)能提供了(le)類(lei)“開(kai)發(fa)者平(ping)(ping)臺(tai)”的生態。
▲海馬云聯合創始人(ren)兼副總裁(cai)趙珅
3、智能終端貼身落地,空間智能走向日常場景
在AI+硬件的落(luo)地路徑中(zhong),李(li)未可科技(ji)帶來(lai)了AI眼鏡(jing)的實裝案例(li),展示空間智能如(ru)何(he)真正“貼身進入(ru)”用戶生活。
李未(wei)可(ke)科技(ji)合伙人兼(jian)生態業務負責人張建華提到,其創始團(tuan)隊出(chu)身于百(bai)度(du)、小米(mi)、天貓精靈等(deng)產品體(ti)系。自(zi)2023年(nian)以(yi)來(lai),李未(wei)可(ke)科技(ji)推出(chu)多款AI眼(yan)鏡(jing)產品,從騎(qi)行運動款到帶攝像(xiang)頭的輕量眼(yan)鏡(jing),功能涵蓋(gai)語(yu)音助手(shou)、翻譯、導游等(deng)Agent服務。
眼鏡(jing)(jing)搭載(zai)自研可穿戴模型,并通過統一調度框架(jia)連(lian)接多家大模型平臺,形成(cheng)“眼鏡(jing)(jing)應用商店”式的智能生態。李未可也已將平臺能力(li)開放(fang)給其(qi)他硬件廠商,通過云端(duan)預裝和MCP能力(li)嵌入(ru),推(tui)動空間智能終(zhong)端(duan)走向產(chan)業鏈合作與可復制交付。
▲李未(wei)可科技合伙人(ren)兼(jian)生態業務負(fu)責人(ren)張建華(hua)
4、情緒交互成新接口,空間智能切入陪伴場景
數伴科技展示了數字情(qing)感體如何進入日常生活,尤其是(shi)針對年輕群(qun)體的(de)“陪伴剛需”。其產品通過Unity引擎與(yu)手(shou)勢(shi)識別、頭部追蹤等(deng)感知技術,構建出可(ke)觸摸、可(ke)互動(dong)、具備角色(se)個性(xing)的(de)3D虛(xu)擬形象,并將其載入屏幕與(yu)硬(ying)件(jian)載體中。
創始人兼CEO李巍佳提出,“從你看手機到AI看你”是未來交互趨勢。通過專利(li)化的(de)指向式樣全息方式、標準(zhun)化的(de)角色模型平臺“模之屋”,數伴打(da)造(zao)了一套“虛擬(ni)形象驅動情(qing)緒連接”的(de)系(xi)統樣本。其落地路徑不僅服務二次(ci)元群體,也在提示(shi)情(qing)感陪伴場(chang)景中(zhong)各種空間智能角色。
▲模之屋
這(zhe)批產品共(gong)同勾(gou)勒出(chu)(chu)空(kong)間智能(neng)(neng)“從平臺到(dao)項目(mu)”的(de)(de)落地路徑(jing):它們既展示了內容生(sheng)成、交互建模、Agent調度等關鍵能(neng)(neng)力的(de)(de)協同突破,也體(ti)現出(chu)(chu)產業伙伴圍繞真實場景推(tui)進產品化(hua)落地的(de)(de)持(chi)續(xu)探(tan)索。空(kong)間智能(neng)(neng)正逐步(bu)具備規模化(hua)走入產業與消(xiao)費端的(de)(de)系統能(neng)(neng)力。
結語:平臺逐漸成熟,場景正在生長,空間智能不止是個“熱詞”
從內容(rong)生成(cheng)、交(jiao)互硬(ying)件到(dao)智能體系統,本次大會展(zhan)示了(le)一(yi)批可交(jiao)付(fu)、可復制的空間智能落地(di)項目,標志(zhi)著(zhu)這一(yi)概念正在由(you)愿景走向現實。
多(duo)(duo)位嘉賓也在現場強(qiang)調,空(kong)間(jian)智能的價(jia)值不止于(yu)“技術可用(yong)”,更在于(yu)其對未來生活方式與(yu)表達(da)方式的重塑。無論是以VisionPro為代表的沉浸式觀演體(ti)驗,還是AI眼(yan)鏡等輕交互設(she)備(bei),空(kong)間(jian)智能正逐步滲透(tou)至文化IP、零售營銷、創作者(zhe)生態(tai)等多(duo)(duo)元場景。虛實融合(he)、可共建的數(shu)字空(kong)間(jian),將塑造新一代的“內(nei)容—人(ren)—設(she)備(bei)”范式。
空間智能(neng)是百(bai)度(du)AI戰略(lve)中持續(xu)深耕的方向。本次(ci)大會展(zhan)示(shi)的是百(bai)度(du)空間智能(neng)平臺的階(jie)段性成(cheng)果,也為后(hou)續(xu)產(chan)(chan)業(ye)的快速(su)發展(zhan)和產(chan)(chan)品的快速(su)落(luo)地(di)提供了(le)良好(hao)的技術底座。即將(jiang)于8月28日召開的云智大會,百(bai)度(du)將(jiang)進一步展(zhan)示(shi)這套(tao)能(neng)力如何貫(guan)通上下游(you),支撐產(chan)(chan)業(ye)規模(mo)化落(luo)地(di)。