
智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 心緣
智東西8月26日報道,近日,谷歌母公司Alphabet風投部(bu)門(men)CapitalG、英偉達(da)正在洽談投資以色列AI基礎設施提供商VAST Data,融資金額或達到數十億美元,或將成為以色列科技公司史上最大規模融資。這家創企的估值將躍升至300億美元(折合人民幣(bi)約2148億元)。
這家(jia)被谷(gu)歌(ge)、英偉達爭著送錢(qian)的創企,到底什么來頭?
2016年成(cheng)(cheng)立的(de)VAST Data已成(cheng)(cheng)為(wei)眾多(duo)大(da)模(mo)型企業(ye)青(qing)睞(lai)的(de)香(xiang)餑餑,核心(xin)原因(yin)是傳統數(shu)據(ju)存儲架構無法滿足大(da)模(mo)型訓練、推理的(de)新需(xu)求,VAST Data面(mian)向AI時代推出(chu)了統一(yi)數(shu)據(ju)平臺(tai),將(jiang)結(jie)構化和非結(jie)構化數(shu)據(ju)集成(cheng)(cheng)在一(yi)起,讓AI處(chu)理數(shu)據(ju)能更高效、更便宜。
馬斯克旗下大模型創企xAI、獲英偉達39.6億美元投資的CoreWeave、全球頭部動畫公司迪士尼及其子公司皮克斯、美國電信巨頭威瑞森通信公司、視頻通話平臺Zoom等諸多(duo)全球知名企業都被這(zhe)家(jia)創企列入客戶名單。
值得一提的是,其與諸多客戶簽訂的都是5~7年的長期合同,?隨之而來的就是年收入的爆炸式上漲。根據VAST Data官網的公開數據,截至2025年1月31日年度,VAST Data營收同比增長3.6倍。這一營收(shou)增速(su)甚(shen)至超過了英偉達和OpenAI。2025財年英偉達營收(shou)同比增長114%,此前(qian)據彭博社報道,OpenAI預計2025年收(shou)入將同比增長三倍至127億美元(yuan)(折合人(ren)民(min)幣約909億元(yuan))。
據路透社援引熟悉財務狀況的匿名消息人士報道,VAST?Data聯合創始人、CEO雷寧·哈拉克(Renen Hallak)曾提到,該公司已經實現連續五年自由現金流為正。截至2025年1月,該公司ARR(年度經常性收入)達到2億美元(折合人(ren)民幣約(yue)14.3億元),預計明年ARR將增長至6億美元(折合人民幣約43億元)。
與此同時,這家創企還與被曝新融資的兩家“金主”關系匪淺,VAST Data將自家軟件平臺集成到了谷歌云上,英偉達創始人、CEO黃仁勛曾在GTC大會、臺北國際電腦展COMPUTEX等國際大會上多次為VAST Data送好評,稱其是大規模AI模型部署的關鍵推動者。
在創投圈,這家創企也早已站到投資人的聚光燈下,此前共拿下5輪融(rong)資,融資總額達到3.81億(yi)美元(折(zhe)合人民幣約27.3億(yi)元),彼時估值達到91億美元(折合人民幣約(yue)652億元),其(qi)中(zhong)戴爾和英偉達連續(xu)多輪注資。
▲VAST?Data融資情況
AI驅動數據以前(qian)所(suo)未有的規模(mo)增長,這(zhe)對數據處(chu)理的基(ji)礎設(she)施(shi)提出了更高要(yao)求,使得構(gou)建數據處(chu)理AI基(ji)礎設(she)施(shi)的VAST Data迎來發(fa)展機遇。
一、手握10億美金訂單,xAI、CoreWeave、迪士尼都是客戶
VAST?Data的(de)四位創始人都(dou)在存(cun)儲領域積累深厚。
CEO雷寧·哈拉克(Renen Hallak)、CTO沙查爾·芬布利特(Shachar Finblit)、營銷副總裁杰夫·登沃思(si)(Jeff Denworth)和CTO阿隆·霍列夫(Alon Horev)共同于2016年(nian)創立了(le)這家公司。
▲VAST?Data聯合創始人杰夫·登沃思(Jeff Denworth)(左一)、沙查爾·芬布利特(Shachar Finblit)(中(zhong))、CEO雷(lei)寧·哈拉克(Renen Hallak)(右(you)二)
哈(ha)拉克曾在戴(dai)爾EMC推出的(de)全閃存企業級存儲陣列XtremIO部門擔(dan)任研發副總裁,從(cong)項目啟動到實(shi)現超(chao)過(guo)10億美元的(de)營收;芬布利(li)特和(he)霍列夫均曾在IBM等(deng)公司(si)任職,登(deng)沃思在先進計算和(he)大規(gui)模可擴展的(de)大數據和(he)云存儲方面擁有超(chao)20年的(de)技術經驗。
彼時(shi),哈拉(la)克在(zai)XtremIO感(gan)受到了AI用于(yu)大規模分析的(de)數據(ju)存儲挑(tiao)戰,但在(zai)戴爾的(de)部(bu)門沒有施展拳腳的(de)空間,因此他決(jue)定離開從0開始(shi)(shi)打(da)造一種新架構(gou)。后(hou)續,他與另外三位聯合創始(shi)(shi)人一拍即合。
用一句話概括VAST?Data的業務體系,就是將(jiang)存儲、數據(ju)庫和容器化計算引擎服務統一(yi)(yi)為一(yi)(yi)個單一(yi)(yi)的、可擴展的VAST Data軟(ruan)件平臺,并(bing)且該平(ping)臺從底層架構(gou)設計(ji)之初(chu)就專(zhuan)為現代數據中心和云中的AI、GPU加速工具而構(gou)建。
具(ju)體來看,其能實現對(dui)電子郵件、日志、PDF文(wen)件和多媒(mei)體內容(rong)等(deng)非結構化(hua)數據的(de)實時訪問(wen),通過(guo)將非關(guan)鍵數據轉移到成本更低的(de)閃存(cun)(cun)中存(cun)(cun)儲,然后使用速度(du)更快、價格更高的(de)閃存(cun)(cun),讓GPU在模型(xing)訓練(lian)過(guo)程中能夠快速訪問(wen)大量數據。
得益于AI相關需求的日益增長,眾多大模型相關企業、其他賽道頭部企業等紛紛向VAST Data拋來橄欖枝,除了開篇提到的大模型領域炙手可熱的xAI、CoreWeave等,還有英偉達投資的云計算基礎設施公司Lambda和阿聯酋AI公司G42子公司Core42,以及NASA、美國能源部、波士頓兒童醫院、旅游公司Booking Holdings等其他賽道企業,均是VAST?Data的客戶。
▲VAST?Data部分客戶名單
且與許多依賴短期合同的軟件公司不同,VAST?Data會與客戶簽訂5至7年的長期合同,這使得公司的客戶流失率極(ji)低,累計軟件預訂量已超過10億美元(折合人民(min)幣約716億元)。
從融資層面看,VAST?Data此(ci)前累計融資金額已經超過3.81億美元(yuan),估值為90億美元(yuan),老虎環球、高盛等(deng)(deng)頂級投資機構,英偉(wei)達、戴爾等(deng)(deng)頭(tou)部公司均(jun)在其(qi)投資人(ren)之列(lie)。值得一提的(de)是,此次曝出參與此輪融資的是Alphabet的獨立增長基金CapitalG,該基金的投資目的是盈利,而不是戰略投資,這也在一定程度上說明投資者對VAST?Data盈利能(neng)力的(de)認(ren)可。
那么,VAST?Data的產(chan)品到底有什么(me)過人之處?
二、專為AI需求構建,自研分布式系統架構
能(neng)夠低成本高效處理數據,一直是AI發展的命(ming)門(men)之一。
傳統的(de)(de)數(shu)據(ju)存(cun)儲依賴(lai)于分層,用(yong)(yong)低成本存(cun)儲方案(an)處理長期存(cun)儲的(de)(de)數(shu)據(ju),用(yong)(yong)高端(duan)方案(an)存(cun)儲更常使用(yong)(yong)的(de)(de)數(shu)據(ju)。
但數據管理的(de)(de)難(nan)點(dian)在于,傳統(tong)架構下,跨全球(qiu)數據中心(xin)傳輸PB乃至(zhi)EB規模的(de)(de)數據已變得愈發難(nan)以處(chu)理;傳統(tong)數據架構并非為滿足當今AI對海(hai)量、多樣化數據集(ji)和(he)高性(xing)能(neng)隨機I/O的(de)(de)需求(qiu)而(er)設(she)計;當下的(de)(de)解(jie)決方(fang)案(an)成(cheng)(cheng)本過(guo)高,在管理和(he)激活數據時,迫使(shi)企業需要在性(xing)能(neng)、規模、彈性(xing)和(he)成(cheng)(cheng)本之間做取舍。
因此需要構建為(wei)AI專門設計的數據處理(li)架構。
VAST?Data的做法是消除傳統存儲的分層模式,將結構化、半結構化和非結構化數據存儲在一個地方加速數據檢索、降低模型訓練和推理成本,其最大的優勢就是能讓(rang)xAI、CoreWeave部署的數(shu)萬(wan)塊(kuai)(kuai)甚至數(shu)十(shi)萬(wan)塊(kuai)(kuai)GPU不會因等待存儲而閑置。
他們是如何做到的?
該公司提出了首個分布式系統架構DASE(Disaggregated Shared-Everything),作(zuo)為專為AI需求設計的專有(you)框架,其將(jiang)存儲、計算和數(shu)據(ju)庫層統(tong)(tong)一(yi)為一(yi)個單(dan)一(yi)的、全球一(yi)致的系統(tong)(tong),且與堆疊(die)不同(tong)工具的公有(you)云(yun)(yun)提(ti)供商不同(tong),VAST的AI操(cao)作(zuo)系統(tong)(tong)消(xiao)除了性能折(zhe)衷(zhong),支(zhi)持實(shi)時分析、遞歸計算和無(wu)縫混(hun)合云(yun)(yun)操(cao)作(zuo)。
具體來(lai)看,DASE的解耦(Disaggregated)支持將數據存(cun)儲和計算資(zi)源分離,可(ke)獨(du)立靈活地(di)擴展每(mei)個組件;共享(xiang)一切(Shared-Everything)意味著數據可(ke)以在所有存(cun)儲節點之間訪問,同時為所有節點提供統一數據視(shi)圖。
而依托這一架構構建的VAST Data Platform,可以支持(chi)1萬個GPU集群,每秒(miao)處理量達TB級別(bie)。
VAST Data Platform這一操作系統由諸多組件構成(cheng):
VAST DataSpace允許從邊緣到云、跨越數百個地點的數據訪問、交易和保護,類似于操作系統的全局資源管理器;VAST DataStore就是通用存儲平臺,堪比操作系統中的文件系統;VAST DataBase負責索引功能,可提供實時查詢、分析數據的多項功能。VAST DataEngine則扮演著動態計算和執行層的角色,VAST InsightEngine是其內部的(de)數據(ju)精煉工具(ju),利用(yong)AI嵌入模型(xing)將原始非結構(gou)化數據(ju)轉化為具(ju)有(you)上下文的(de)數據(ju),并將其作為RAG(檢(jian)索增(zeng)強生成)工具(ju)。
▲VAST Data AI操作(zuo)系統(tong)架(jia)構
今年下半年,VAST Data將補上數據處理AI操作系統核心服務的最后一塊拼圖,AI Agent部署和編排系統VAST AgentEngine。這(zhe)意(yi)味著VAST Data的(de)平臺已經集成了接收數據(ju)、實時存(cun)入存(cun)儲以及向(xiang)尋找信息的(de)Agent提供(gong)數據(ju)的(de)全(quan)流(liu)程能力。
從具體的合作客戶來看,今年2月,xAI官宣的搭載超過20萬塊英偉達GPU的超級計算集群Colossus,其背后的數據平臺就由VAST Data打造,使得Colossus的(de)AI工作負載的(de)總擁有成本(TCO)降低了50%;2023年9月,VAST Data與CoreWeave宣布達成戰略合作,CoreWeave基于VAST Data的平臺構建了全球英偉達加速計算云,能夠管理和保護為生成式AI、高性能計算(HPC)和視覺特效(VFX)任務所需的大量數據。
VAST Data從0開始(shi)為AI構建的系統(tong),將(jiang)存儲、數據(ju)庫和虛擬化計算(suan)引擎服務統(tong)一其(qi)中。這也(ye)說(shuo)明,面對AI行(xing)業的新發展(zhan)機(ji)遇,VAST Data已經從最初的存儲公司(si)定位,向著更廣泛的應用空間(jian)擴展(zhan)。
三、深度綁定谷歌、英偉達,新融資或為IPO信號
此次被曝注資的兩家巨頭,都與VAST Data進(jin)行了深度綁定。
首先是英偉達,今年3月,VAST Data獲(huo)得英偉達(da)認(ren)證存儲資質。黃仁勛曾在GTC大會、臺北國際電腦展COMPUTEX的主題演(yan)講中提到VAST?Data。他認為,AI時代數據是驅動行業的原材料,英偉達正與全球存儲頭部一起,構建新一代的企業基礎設施,企業需要其在混合數據中心中部署和擴展AI Agent。VAST Data就是與英偉達合作的企業之一(yi)。
2024年底,黃仁勛與哈拉克一起錄制了一段關于AI未來的十分鐘播客,黃仁勛談到他曾在法國巴黎的VivaTech大會上提到的實現模型持續改進的數據飛輪(data flywheel),當下擴展企業AI、從訓練轉向實時推理的轉變,對VAST Data來說是一個絕佳的機會。他對于此前和VAST?Data的合作感到非常自豪(hao)。
▲黃仁勛與哈拉克錄制(zhi)AI播客
去年9月,VAST Data還與英偉達合作構建了實時RAG工具InsightEngine,可以利用NIM微服務實(shi)現(xian)實(shi)時(shi)數據檢索(suo),已經在金融交(jiao)易、自動駕(jia)駛、物(wu)流等(deng)領(ling)域實(shi)現(xian)了企業(ye)級應用。
其次是谷歌,今年4月,VAST Data平臺已全面集成到谷歌云中,企業可以在單個高性能平臺上統一AI訓練、RAG管道、高(gao)通量數據處(chu)理(li)和非結構化數據湖,這(zhe)實現了(le)跨混(hun)合環境的AI訓練、RAG和推理(li),可以(yi)繞過公(gong)有云提(ti)供商的壁壘。
值得(de)一提的(de)是,除(chu)了(le)與(yu)頭部客戶(hu)深度綁定外(wai),這家創企(qi)與(yu)思科、超微(wei)和(he)HPE的(de)OEM合(he)作使其能獲得(de)較低的(de)硬(ying)件(jian)成(cheng)本,同時保持軟(ruan)件(jian)溢價,達到高毛利和(he)快(kuai)速客戶(hu)獲取的(de)優勢。
在現金流充足的情況下,外媒也認為VAST Data獲得新融資或證明了其進行IPO前準備工作的進程加快,去年這家創企還聘請了全球電商平臺Shopify前CFO艾米·沙佩羅(Amy Shapero)。
結語:乘AI東風,VAST?Data營收激增
數據、算力等AI基礎設施(shi)平臺構建的(de)重要(yao)性與日俱增,盡管英偉(wei)達、微(wei)軟和谷歌等科(ke)技巨頭(tou)憑借GPU、云平臺占據了這(zhe)(zhe)一(yi)賽道的(de)頭(tou)部市場,但以VAST Data為代(dai)表的(de)AI創企業務增長、估值飆升也證明了這(zhe)(zhe)不僅是(shi)一(yi)場巨頭(tou)游戲。
而在巨頭環伺的AI競賽下,VAST?Data這類專(zhuan)注(zhu)于某一垂(chui)直賽道的(de)(de)企業(ye),能夠針對(dui)數(shu)據存儲(chu)需求(qiu)的(de)(de)變化,在大模型發展(zhan)瞬(shun)息萬變的(de)(de)當(dang)下,打造完全面向(xiang)AI時代企業(ye)核心需求(qiu)的(de)(de)數(shu)據處(chu)理平臺,從(cong)而(er)收獲大批客戶(hu)以及收益(yi)。
來源:路透社、VAST?Data官網、CTech