
芯東西(公眾號:aichip001)
作者 | ?ZeR0
編輯 | ?漠影
芯東西5月30日報道,生成式人工智(zhi)能(neng)(AI)觸(chu)發了“AI時(shi)代的iPhone時(shi)刻(ke)”,每個行業都在投資生成式AI,推動對(dui)加速計算的需求,電信行業亦是如此。
在臺北電腦展COMPUTEX 2023期間,英偉達(NVIDIA)與日本電信巨頭軟銀昨日宣布,合作打造一個基于NVIDIA GH200 Grace Hopper超級芯片、面向生成式AI和5G/6G應用的開創性平臺。今日,英(ying)偉(wei)達技術專家進一(yi)步(bu)分(fen)享了關(guan)于這一(yi)平(ping)臺(tai)的更(geng)多技術細節(jie)。
軟銀計劃在日本(ben)各地的(de)全新(xin)分布式(shi)AI數據中心采用該(gai)平臺。
雙(shuang)方(fang)合作(zuo)之舉,是為了在全球范圍(wei)內快速部署生成式AI應(ying)用(yong)和服(fu)務鋪平道路。軟(ruan)銀正在為自(zi)動駕駛(shi)、AI工廠、增強現(xian)實(shi)和虛擬(ni)現(xian)實(shi)、計算機視覺和數字孿生開發5G應(ying)用(yong)。軟(ruan)銀公(gong)司總裁兼CEO Junichi Miyakawa談(tan)道:“隨著我們(men)進入一個社(she)會與AI共存的時代,對數據處理和電力的需求(qiu)將不斷(duan)增長。軟(ruan)銀將提供下一代社(she)會基(ji)礎設施,以支(zhi)持日本的超級數字化社(she)會。”
英(ying)偉達(da)創始人(ren)兼CEO黃仁勛認為(wei),對加(jia)速計(ji)算和(he)生成式(shi)(shi)AI的需求正在推動數據(ju)中心(xin)架構的根本性(xing)變革。英(ying)偉達(da)Grace Hopper是專為(wei)處理和(he)擴展生成式(shi)(shi)AI服(fu)務而設計(ji)。他稱贊軟銀創建一個電信(xin)網(wang)絡來承載生成式(shi)(shi)AI服(fu)務的舉措(cuo)“富有遠見”。
生成式(shi)AI的需求爆發,將重塑AI和5G數(shu)據中心(xin),將5G數(shu)據中心(xin)改造成AI工(gong)廠。相(xiang)比以往的數(shu)據中心(xin),新型數(shu)據中心(xin)的分布將更(geng)加均衡,并能夠同時(shi)(shi)處理AI和5G工(gong)作負載。這將讓它(ta)們更(geng)好(hao)地保持峰(feng)值(zhi)運行,同時(shi)(shi)保持低時(shi)(shi)延(yan)并大幅降低總體(ti)能源成本,兼具高利用率和最佳(jia)ROl。
雙方合作打造的平臺,是一個面向5G和生成式AI的云平臺,與單一用途5G vRAN相比,其投資回報率達4倍。該(gai)平臺將使用(yong)(yong)英偉達MGX服務(wu)器參考架構和基于Arm Neoverse的GH200 Grace Hopper超級芯片,有望提高應用(yong)(yong)程(cheng)序工作負載的性(xing)能、可擴展性(xing)和資源利用(yong)(yong)率。
具體而言,英(ying)偉達GH200超(chao)級芯片(pian)兼顧了(le)生(sheng)成式(shi)AI、5G/6G的需求,在加速(su)(su)5G Open vRAN上取得(de)了(le)高性(xing)能和(he)(he)高能效(xiao)(xiao),能夠有效(xiao)(xiao)減少CPU和(he)(he)加速(su)(su)器之間的延(yan)遲(chi)。英(ying)偉達Grace Hopper和(he)(he)BlueField-3 DPU將加速(su)(su)軟件(jian)定義的5G vRAN以(yi)及生(sheng)成式(shi)AI應用(yong),而無需定制硬件(jian)加速(su)(su)器或(huo)專用(yong)5G CPU。此外,配備BlueField-3的英(ying)偉達Spectrum以(yi)太(tai)網交(jiao)換(huan)機(ji)將為(wei)5G提(ti)供高精度時間同步協議。
該解決方案在英偉達加速的1U MGX服務器設計上實現了突破性的5G速度。根據公開的5G加速器數據,它實現了業內吞吐量最高的36Gbps下(xia)行(xing)鏈路(lu)容量。運營商(shang)一直(zhi)難以(yi)通過行(xing)業標準服務(wu)器實現如此高(gao)的下(xia)行(xing)鏈路(lu)容量。
NVIDIA MGX是英(ying)偉(wei)達(da)昨日最(zui)新推出的(de)一個(ge)模(mo)塊化參(can)考架構(gou)(gou),讓(rang)系統制造商(shang)和(he)超大規模(mo)企業客戶能夠快速、經濟地構(gou)(gou)建100多(duo)種(zhong)服務器機型,適(shi)用(yong)于各種(zhong)AI、HPC和(he)英(ying)偉(wei)達(da)Omniverse應用(yong)。
Arm首席執行(xing)官Rene Haas認為:“結(jie)合NVIDIA BlueField DPU、Grace Hopper,使得軟(ruan)(ruan)銀新的(de)(de)5G數據(ju)中心能夠運行(xing)最苛(ke)刻的(de)(de)計算和(he)內存密(mi)集(ji)型應(ying)用,并為Arm上的(de)(de)軟(ruan)(ruan)件定義5G和(he)AI帶來指數級(ji)的(de)(de)能效提(ti)升(sheng)。”
軟件同樣不可或缺,英偉達Aerial 5G軟件實現了對x86和Arm的兼容。通過將英偉達Aerial軟件引入到高性能的軟件定義的云原生5G網絡中,這些5G基站將允許運營商動態地分配計算資源,實現比競品高2.5倍的能效。
生(sheng)成式AI的(de)未來發(fa)展(zhan)需要高性能、節(jie)能的(de)計(ji)算。與英偉達(da)的(de)合作,將幫助軟銀的(de)基礎設施利用(yong)AI實現(xian)更高的(de)性能,包(bao)括對(dui)RAN的(de)優化(hua)。軟銀將打造能夠(gou)在多租戶通用(yong)服務器(qi)平臺(tai)上托管(guan)生(sheng)成式AI和無線應用(yong)的(de)數(shu)據(ju)中心,以降低成本和更節(jie)能。
“我們期(qi)待這也可以幫(bang)助我們降低能(neng)耗(hao),創(chuang)建(jian)一個互連的數據中(zhong)心網(wang)絡(luo),用于共享資源并托管一系列生(sheng)成式AI應用。”Junichi Miyakawa說。