芯東西(公眾號:aichip001)
作者 | ?ZeR0
編輯 | ?漠影

芯東西5月20日報道,臺北國際電腦展COMPUTEX 2025今日盛大開幕,芯片產業領袖云集,陳立武首次以英特爾CEO身份赴臺,并與中國臺灣供應鏈伙伴餐敘。英特爾更是一舉發布多款GPU和AI產品,包括英特爾銳(rui)炫(xuan)Pro B50/B60 GPUGaudi 3 AI加速(su)器輕量級開源軟件框架Intel AI Assistant Builder,展(zhan)露其在AI及專(zhuan)業視覺(jue)領域(yu)的最新布局(ju)。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

英特爾銳炫Pro B60/B50 GPU基于Xe?2架構,具備AI特性,為要求(qiu)嚴苛的AI推理工(gong)作負載和工(gong)作站應(ying)用而設(she)計,進一步豐富了英特爾專(zhuan)業級(ji)GPU產品線。

其中,銳炫Pro B60配備24GB顯存,AI峰值算力為197TOPS,適用于推理工作站;銳炫Pro B50配備16GB顯存,AI峰值算力為170TOPS,適用于圖形(xing)工作站(zhan)。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

兩款GPU均搭載英特爾XMX AI核心和先進的光線追蹤單元,并支持多GPU擴展,通過將高顯存(cun)容量(liang)與(yu)關鍵軟件兼容性相結合(he),為(wei)創作者(zhe)(zhe)和AI開發者(zhe)(zhe)提供(gong)了可擴展的、經(jing)濟(ji)高效的解決方案。

銳炫(xuan)Pro B50直接面向零(ling)售市場(chang),建(jian)議零(ling)售價為(wei)299美(mei)元(約合(he)人民幣2159元),性(xing)價比優(you)勢突出。銳炫(xuan)Pro B60將主要(yao)通過B2B模式進(jin)行(xing)項目采購(gou),正(zheng)在與多家系統集成(cheng)商和OEM廠商進(jin)行(xing)合(he)作(zuo)。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

華擎、藍戟、Lanner、銘瑄、傲世、Senao和撼與科技等AIB合作伙伴將于今年6月開始提供英特爾銳炫Pro B60 GPU樣品。英特爾銳炫Pro B50 GPU將于今年7月開(kai)始在英特爾授權經銷商處(chu)上市(shi)。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

有合作伙(huo)伴將提供(gong)銳炫Pro B60的(de)單(dan)卡雙GPU方案,板載顯(xian)存容量達48GB。

英特爾Gaudi 3 AI加速器提供PCIe機架級系統部署選擇,為企業和云AI推理提供可擴展的開放解決方案。英特爾Gaudi 3 PCIe卡支持在現有服務器數據中心環境中進行可擴展的AI推理,將于今年下半年上市。

在CES 2025首次亮相后,英特爾AI Assistant Builder軟件框架現已在GitHub上提供公開測試版。該框架專為在基(ji)于英特(te)爾(er)AI PC上本地構建和運行(xing)自定義(yi)AI agents而設計,可幫(bang)助(zhu)企(qi)業或個人快(kuai)速(su)構建并(bing)部(bu)署(shu)AI agents。

一、銳炫Pro B50:AI性能提升至3倍,性價比較RTX A1000翻番

英特爾銳炫Pro B50 GPU實現了同類價位段最高配置:擁有16個Xe核心,配備(bei)16GB顯(xian)(xian)存(cun)、128 XMX引(yin)擎,顯(xian)(xian)存(cun)帶寬(kuan)為224GB/s,AI峰(feng)值(zhi)算力(Int8)為170TOPS,單卡功(gong)耗僅70W。PCIe Gen 5速度的提升也會帶來10%-20%的性(xing)能提升。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

與同(tong)類產品對(dui)比,銳炫Pro B50的顯(xian)存容(rong)量、驅動程式優化、PCIe Gen 5提升均表現更優。同(tong)類產品通常(chang)配(pei)備6GB或(huo)8GB顯(xian)存。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

與上一(yi)代產(chan)品(pin)及(ji)競品(pin)相(xiang)比(bi),銳炫Pro B50在圖(tu)形(xing)和(he)AI推理(li)性能上有1.1倍~3.5倍的提升(sheng)。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

在通用性(xing)能方(fang)面,銳炫Pro B50相(xiang)比上一(yi)代產品提升(sheng)50%~130%。其性(xing)價(jia)比不(bu)僅相(xiang)較銳炫Pro A50、英偉達(da)RTX A1000翻倍提升(sheng),比起銳炫Pro A60也略勝一(yi)籌(chou)。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

該系列GPU在(zai)Windows上兼(jian)容消(xiao)費(fei)級(ji)和專(zhuan)業(ye)級(ji)驅動程序,在(zai)Linux上支(zhi)持(chi)容器化的(de)軟件棧(zhan)。其軟件棧(zhan)可以簡化AI部署,并支(zhi)持(chi)逐步升級(ji)和功能(neng)優化。

新發布的(de)兩款(kuan)GPU針對AEC(建(jian)筑、工程、施工)和推(tui)理工作站進行了優化,并通(tong)過(guo)大量ISV認證和優化的(de)軟件提供穩定(ding)、可靠(kao)的(de)性能。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

英特(te)爾副總(zong)裁兼客戶端顯(xian)卡總(zong)經(jing)理Vivian Lien稱(cheng),全新英特(te)爾銳炫Pro GPU為一直在尋求針對性解(jie)決(jue)方案(an)的中(zhong)小(xiao)型企業,提供(gong)了(le)易于獲取且(qie)可擴展(zhan)的解(jie)決(jue)方案(an)。

二、銳炫Pro B60:AI峰值算力197TOPS,跑DeepSeek-R1倍殺RTX 5060Ti

銳炫Pro B60擁有20個Xe核(he)心,配備24GB顯存、160 XMX引擎,顯存帶寬為(wei)456GB/s,AI峰值算力(Int8)為(wei)197TOPS,根(gen)據不同(tong)系統設(she)計,單(dan)卡(ka)功耗區間為(wei)120~200W。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

從性能來看,銳(rui)炫(xuan)Pro B60運行DeepSeek-R1、Phi 4、QwQ、Qwen 2.5、Llama 3等模(mo)型時(shi),相比英偉達RTX 2000 Ada 16GB、RTX 5060Ti 16GB的(de)吞吐量更高。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

更(geng)大參(can)數規模(mo)(mo)的模(mo)(mo)型,需(xu)要(yao)更(geng)大的顯(xian)存。7B模(mo)(mo)型若采用FP16進行推(tui)理,至少需(xu)要(yao)16GB顯(xian)存。70B模(mo)(mo)型采用INT4量(liang)化(hua),需(xu)要(yao)超過30GB的顯(xian)存,若采用FP16,顯(xian)存需(xu)求更(geng)是將(jiang)超過100GB。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

通過(guo)多卡互連,銳炫Pro B60能(neng)夠以(yi)(yi)更大(da)的顯存容量(liang),來支撐大(da)模型(xing)運行,并(bing)在上(shang)下文(wen)(wen)和并(bing)發擴展方面展現優勢。一(yi)張(zhang)(zhang)銳炫Pro B60跑(pao)不(bu)了32B參(can)數(shu)量(liang)的DeepSeek-R1蒸餾模型(xing),但2張(zhang)(zhang)GPU就能(neng)支持(chi)20k tokens上(shang)下文(wen)(wen),4張(zhang)(zhang)GPU可(ke)將上(shang)下文(wen)(wen)窗口擴展到100k以(yi)(yi)上(shang),足以(yi)(yi)直接輸入一(yi)本不(bu)太厚的書或論(lun)文(wen)(wen)。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

企業級(ji)應用(yong)(yong)(yong)(yong)場景(jing)對并發(fa)性提出了更(geng)高的(de)(de)要求(qiu)。在設定8k上下文窗口的(de)(de)情(qing)況下,單張銳(rui)炫Pro B60無(wu)法支撐DeepSeek-R1 32B FP8精度模(mo)型的(de)(de)運行(xing)。使(shi)用(yong)(yong)(yong)(yong)兩張顯(xian)(xian)卡(ka)時(shi),系統(tong)可支持(chi)5-6個并發(fa)用(yong)(yong)(yong)(yong)戶。而當采用(yong)(yong)(yong)(yong)四(si)張顯(xian)(xian)卡(ka)、利用(yong)(yong)(yong)(yong)全部96GB顯(xian)(xian)存(cun)時(shi),系統(tong)可支持(chi)超過50個并發(fa)用(yong)(yong)(yong)(yong)戶,足以滿(man)足中小企業的(de)(de)大部分需求(qiu)。

英特爾自己也用銳炫(xuan)Pro B60來解(jie)決問題(ti)。在(zai)開發酷睿Ultra第二代Lunar Lake產品時(shi),英特爾在(zai)VPC解(jie)碼(ma)過程(cheng)中發現(xian)(xian)了一個(ge)Bug,表現(xian)(xian)出現(xian)(xian)花屏(ping)現(xian)(xian)象。這類問題(ti)通(tong)常非常復(fu)雜,可能跨越多個(ge)軟件層,且(qie)代碼(ma)量(liang)巨大。一位經驗(yan)豐富的工程(cheng)師通(tong)常需要花費數天時(shi)間,從數萬(wan)行(xing)log中發現(xian)(xian)問題(ti),debug找到根源(yuan),并提供代碼(ma)修復(fu)方案,然(ran)后重(zhong)新(xin)進行(xing)測試。

而英特爾在配備4張銳炫Pro B60和至強W處理(li)器的(de)(de)服務器上部署運(yun)行多(duo)AI agent協同方(fang)案(an),僅花費數小(xiao)時便完成了從問(wen)題定位到(dao)代碼修(xiu)復的(de)(de)全過程,并最終完成了所有問(wen)題的(de)(de)修(xiu)復和重新測試。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

三、8張銳炫Pro B60互連,可跑1500億參數大模型

推理工(gong)作站(zhan)具有(you)廣(guang)闊的(de)發展前(qian)景,主(zhu)要(yao)體現在:1)安全(quan)部署,數據(ju)無(wu)需上傳至云端,可(ke)在本(ben)地處理;2)提供一站(zhan)式解決方案,將所有(you)軟件置于(yu)(yu)容器中,幫助客戶解決問題,易(yi)于(yu)(yu)設置;3)易(yi)于(yu)(yu)擴展,可(ke)靈活配(pei)置不(bu)同數量(liang)的(de)顯卡;4)成本(ben)效益具有(you)顯著(zhu)優勢(shi)。

英特爾發布了一款可配置的工作站級英特爾至強平臺(代號Project Battlematrix),旨(zhi)在減少AI開發人員的摩擦點。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

借助高達192GB的視頻隨機存取存儲器(VRAM),它最多可支持8張英特爾銳炫Pro B60 24GB GPU,運行高達1500億個參數的(de)中等規模(mo)(mo)且精度(du)高(gao)的(de)AI模(mo)(mo)型。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

為了優化(hua)AI推(tui)理(li)性能,英特爾在(zai)底層軟件(jian)上(shang)引(yin)入GPUDirect Peer-to-Peer技術,可(ke)(ke)在(zai)GPU之間直(zhi)接拷貝數據,不需要CPU參與。此外,其張(zhang)量并(bing)行算法則可(ke)(ke)以把(ba)一張(zhang)顯卡放不下的大模(mo)型(xing)平均(jun)切分到4張(zhang)或者是8張(zhang)卡上(shang)進行推(tui)理(li),然后把(ba)結果合并(bing)輸出給用(yong)戶(hu)。

英特爾采用容(rong)器化方案(an)來幫助(zhu)客戶解決軟件(jian)部署的復雜性問題,在容(rong)器內部對大(da)語(yu)言模型進行了大(da)量(liang)的優化,包括Linux軟件(jian)棧的支持、驗證以(yi)及(ji)分(fen)階段的軟件(jian)發布。

其(qi)Project Battlematrix Linux軟件(jian)棧如下圖所(suo)示,Linux操(cao)作系(xi)(xi)統位于容器(qi)之(zhi)外,往上是用戶(hu)層(ceng)驅(qu)動(dong),Level 0是英特(te)爾的底層(ceng)驅(qu)動(dong),再向(xiang)上是英特(te)爾OneAPI和(he)XPU Manager,上層(ceng)是英特(te)爾對生態系(xi)(xi)統的支(zhi)持(chi)。目前該(gai)軟件(jian)棧采用vLLM Serving,未來也將支(zhi)持(chi)SGLang等其(qi)他開源軟件(jian)。英特(te)爾對各層(ceng)軟件(jian)進行了(le)完整的驗證和(he)優(you)化(hua),并通過(guo)容器(qi)形(xing)式一鍵(jian)交付給(gei)客(ke)戶(hu),以方便部署。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

英特爾還(huan)展示了軟件(jian)功能(neng)路線圖,預計第三季度發布經(jing)過完整驗證(zheng)和產品化的(de)容器,第四(si)季度推出SR-IOV、VDI虛擬桌面(mian)的(de)軟件(jian)性能(neng)優化以(yi)及(ji)完整的(de)管(guan)理功能(neng)。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

四、英特爾Gaudi 3:PCIe卡AI峰值算力達1678TFLOPS,機架級配備8.2TB HBM

英特(te)爾進一步推進其AI戰略(lve),推出英特(te)爾Gaudi 3 AI加速器(qi)的全新部署方(fang)案。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

英特爾Gaudi 3 PCIe卡配(pei)備128GB HBM2e,FP8精(jing)度下AI峰值(zhi)算力達到1678TFLOPS,支持在現有服務(wu)器數據中心(xin)環境中進行可擴展的AI推(tui)理(li)。

英特爾大顯存GPU放猛料:性價比拉滿,本地跑DeepSeek-R1,性能秒RTX 5060Ti

以AI大(da)模型Llama為例,得益于可擴展配置(zhi),可靈(ling)活運行從輕量級Llama 3.1 8B到(dao)規模較大(da)的Llama 4 Scout或Maverick等各(ge)種規模的AI模型。

英特爾Gaudi 3機架級系統參考設計帶來了極大的靈活性和可擴展性,每個機架最多可容納64個加速器,并擁有高達8.2TB的高帶寬(kuan)內存(HBM)。

其機架級架構針對大型(xing)AI模型(xing)進行深度(du)優化,可提供(gong)實時(shi)推理(li)性能(neng)。

開放式(shi)模塊化(hua)設計打破了供應商的限制(zhi),而有(you)線(xian)背(bei)板和盲插2D全機架布線(xian)讓安裝和維護變得更(geng)加簡單(dan)。通過液冷(leng),這些系統(tong)可提供強大(da)的性能,并有(you)助于TCO的控制(zhi)。

這些配置支持云服務提供商(shang)(CSP)的定制化需求和開放(fang)計算項目(OCP)設(she)計規范。英特爾(er)承諾構建開放(fang)、靈活和安全AI基(ji)礎(chu)設(she)施。

結語:英特爾邁向全面轉型,力補AI產品實力,強調“執行力”與“說真話”

此次(ci)新品發(fa)布正值英特(te)(te)爾與臺灣科技生態系統合作(zuo)40周年。英特(te)(te)爾進一步擴大專業(ye)級GPU陣容(rong),提供大顯存、高性價比以及為(wei)AI推理(li)和專業(ye)工作(zuo)站量身定制(zhi)的配置(zhi),并展示(shi)了其(qi)AI加速器產(chan)品及AI Assistant Builder的可用性。這些新產(chan)品有望為(wei)英特(te)(te)爾開辟新的局面(mian)。

在英特(te)爾臺灣40周年晚(wan)宴活動上,陳立武(wu)發表致辭,談到英特(te)爾將全面轉(zhuan)型,重回工(gong)程導(dao)向,不(bu)僅做CPU,還要構建完整的AI計(ji)算系統,包括芯片、軟件(jian)、存儲、互(hu)連(lian)及(ji)工(gong)作負載(zai)整合,并(bing)強化與(yu)中國臺灣科(ke)技供應(ying)鏈及(ji)客(ke)戶的交流合作。

陳立武再度表露改造英特爾的決心和策略,以及對“新英特爾”的期許。英特爾在PC市場有超過68%的市占率,在服務器市場有55%的市占率。據陳(chen)立武透露,一些(xie)客(ke)戶反(fan)饋為(wei)了提高系統性能,正在評估(gu)推(tui)動(dong)開發定制芯片。

陳立(li)武強調(diao)了兩個目標:打造好(hao)產(chan)品(pin),令客(ke)戶滿意。為此,他讓英(ying)特(te)爾工程(cheng)團(tuan)(tuan)隊直接向他匯報(bao),確保做(zuo)出正(zheng)確的(de)芯片產(chan)品(pin),并積極招募人才。他告訴團(tuan)(tuan)隊:“如果(guo)你(ni)不(bu)先告訴我壞消息(xi),而是(shi)讓我從客(ke)戶口(kou)中得(de)知,那你(ni)就麻煩(fan)大了。我要(yao)的(de)是(shi)誠實、真實的(de)文化。”

此次來臺行程中,陳立(li)武拜訪了(le)許多OEM客戶,聽到很多反(fan)饋。“你會看到一個(ge)全(quan)新的英特(te)爾(er)。”他相(xiang)信英特(te)爾(er)未來將(jiang)以(yi)更謙卑、更開放的態度,主動傾(qing)聽客戶聲音,不僅要(yao)推(tui)出(chu)好產品,更要(yao)讓生產穩(wen)定、準時、品質穩(wen)定。

“我相信(xin)只(zhi)要持續執行、執行、執行,就能讓(rang)英(ying)特爾恢(hui)復元(yuan)氣。”陳立武說(shuo),他(ta)不是搞營(ying)銷的(de),不會(hui)吹噓(xu)表現,英(ying)特爾將用成果說(shuo)話。