英特尔大显存GPU放猛料：性价比拉满，本地跑DeepSeek-R1，性能秒RTX 5060Ti

芯東西（公眾號：aichip001）
作者 | ?ZeR0
編輯 | ?漠影

芯東西5月20日報道，臺北國際電腦展COMPUTEX 2025今日盛大開幕，芯片產業領袖云集，陳立武首次以英特爾CEO身份赴臺，并與中國臺灣供應鏈伙伴餐敘。英特爾更是一舉發布多款GPU和AI產品，包括英特爾銳(rui)炫(xuan)Pro B50/B60 GPU、Gaudi 3 AI加速(su)器、輕量級開源軟件框架Intel AI Assistant Builder，展(zhan)露其在AI及專(zhuan)業視覺(jue)領域(yu)的最新布局(ju)。

英特爾銳炫Pro B60/B50 GPU基于X^e?2架構，具備AI特性，為要求(qiu)嚴苛的AI推理工(gong)作負載和工(gong)作站應(ying)用而設(she)計，進一步豐富了英特爾專(zhuan)業級(ji)GPU產品線。

其中，銳炫Pro B60配備24GB顯存，AI峰值算力為197TOPS，適用于推理工作站；銳炫Pro B50配備16GB顯存，AI峰值算力為170TOPS，適用于圖形(xing)工作站(zhan)。

兩款GPU均搭載英特爾XMX AI核心和先進的光線追蹤單元，并支持多GPU擴展，通過將高顯存(cun)容量(liang)與(yu)關鍵軟件兼容性相結合(he)，為(wei)創作者(zhe)(zhe)和AI開發者(zhe)(zhe)提供(gong)了可擴展的、經(jing)濟(ji)高效的解決方案。

銳炫(xuan)Pro B50直接面向零(ling)售市場(chang)，建(jian)議零(ling)售價為(wei)299美(mei)元（約合(he)人民幣2159元），性(xing)價比優(you)勢突出。銳炫(xuan)Pro B60將主要(yao)通過B2B模式進(jin)行(xing)項目采購(gou)，正(zheng)在與多家系統集成(cheng)商和OEM廠商進(jin)行(xing)合(he)作(zuo)。

華擎、藍戟、Lanner、銘瑄、傲世、Senao和撼與科技等AIB合作伙伴將于今年6月開始提供英特爾銳炫Pro B60 GPU樣品。英特爾銳炫Pro B50 GPU將于今年7月開(kai)始在英特爾授權經銷商處(chu)上市(shi)。

有合作伙(huo)伴將提供(gong)銳炫Pro B60的(de)單(dan)卡雙GPU方案，板載顯(xian)存容量達48GB。

英特爾Gaudi 3 AI加速器提供PCIe和機架級系統部署選擇，為企業和云AI推理提供可擴展的開放解決方案。英特爾Gaudi 3 PCIe卡支持在現有服務器數據中心環境中進行可擴展的AI推理，將于今年下半年上市。

在CES 2025首次亮相后，英特爾AI Assistant Builder軟件框架現已在GitHub上提供公開測試版。該框架專為在基(ji)于英特(te)爾(er)AI PC上本地構建和運行(xing)自定義(yi)AI agents而設計，可幫(bang)助(zhu)企(qi)業或個人快(kuai)速(su)構建并(bing)部(bu)署(shu)AI agents。

一、銳炫Pro B50：AI性能提升至3倍，性價比較RTX A1000翻番

英特爾銳炫Pro B50 GPU實現了同類價位段最高配置：擁有16個X^e核心，配備(bei)16GB顯(xian)(xian)存(cun)、128 XMX引(yin)擎，顯(xian)(xian)存(cun)帶寬(kuan)為224GB/s，AI峰(feng)值(zhi)算力（Int8）為170TOPS，單卡功(gong)耗僅70W。PCIe Gen 5速度的提升也會帶來10%-20%的性(xing)能提升。

與同(tong)類產品對(dui)比，銳炫Pro B50的顯(xian)存容(rong)量、驅動程式優化、PCIe Gen 5提升均表現更優。同(tong)類產品通常(chang)配(pei)備6GB或(huo)8GB顯(xian)存。

與上一(yi)代產(chan)品(pin)及(ji)競品(pin)相(xiang)比(bi)，銳炫Pro B50在圖(tu)形(xing)和(he)AI推理(li)性能上有1.1倍~3.5倍的提升(sheng)。

在通用性(xing)能方(fang)面，銳炫Pro B50相(xiang)比上一(yi)代產品提升(sheng)50%~130%。其性(xing)價(jia)比不(bu)僅相(xiang)較銳炫Pro A50、英偉達(da)RTX A1000翻倍提升(sheng)，比起銳炫Pro A60也略勝一(yi)籌(chou)。

該系列GPU在(zai)Windows上兼(jian)容消(xiao)費(fei)級(ji)和專(zhuan)業(ye)級(ji)驅動程序，在(zai)Linux上支(zhi)持(chi)容器化的(de)軟件棧(zhan)。其軟件棧(zhan)可以簡化AI部署，并支(zhi)持(chi)逐步升級(ji)和功能(neng)優化。

新發布的(de)兩款(kuan)GPU針對AEC（建(jian)筑、工程、施工）和推(tui)理工作站進行了優化，并通(tong)過(guo)大量ISV認證和優化的(de)軟件提供穩定(ding)、可靠(kao)的(de)性能。

英特(te)爾副總(zong)裁兼客戶端顯(xian)卡總(zong)經(jing)理Vivian Lien稱(cheng)，全新英特(te)爾銳炫Pro GPU為一直在尋求針對性解(jie)決(jue)方案(an)的中(zhong)小(xiao)型企業，提供(gong)了(le)易于獲取且(qie)可擴展(zhan)的解(jie)決(jue)方案(an)。

二、銳炫Pro B60：AI峰值算力197TOPS，跑DeepSeek-R1倍殺RTX 5060Ti

銳炫Pro B60擁有20個X^e核(he)心，配備24GB顯存、160 XMX引擎，顯存帶寬為(wei)456GB/s，AI峰值算力（Int8）為(wei)197TOPS，根(gen)據不同(tong)系統設(she)計，單(dan)卡(ka)功耗區間為(wei)120~200W。

從性能來看，銳(rui)炫(xuan)Pro B60運行DeepSeek-R1、Phi 4、QwQ、Qwen 2.5、Llama 3等模(mo)型時(shi)，相比英偉達RTX 2000 Ada 16GB、RTX 5060Ti 16GB的(de)吞吐量更高。

更(geng)大參(can)數規模(mo)(mo)的模(mo)(mo)型，需(xu)要(yao)更(geng)大的顯(xian)存。7B模(mo)(mo)型若采用FP16進行推(tui)理，至少需(xu)要(yao)16GB顯(xian)存。70B模(mo)(mo)型采用INT4量(liang)化(hua)，需(xu)要(yao)超過30GB的顯(xian)存，若采用FP16，顯(xian)存需(xu)求更(geng)是將(jiang)超過100GB。

通過(guo)多卡互連，銳炫Pro B60能(neng)夠以(yi)(yi)更大(da)的顯存容量(liang)，來支撐大(da)模型(xing)運行，并(bing)在上(shang)下文(wen)(wen)和并(bing)發擴展方面展現優勢。一(yi)張(zhang)(zhang)銳炫Pro B60跑(pao)不(bu)了32B參(can)數(shu)量(liang)的DeepSeek-R1蒸餾模型(xing)，但2張(zhang)(zhang)GPU就能(neng)支持(chi)20k tokens上(shang)下文(wen)(wen)，4張(zhang)(zhang)GPU可(ke)將上(shang)下文(wen)(wen)窗口擴展到100k以(yi)(yi)上(shang)，足以(yi)(yi)直接輸入一(yi)本不(bu)太厚的書或論(lun)文(wen)(wen)。

企業級(ji)應用(yong)(yong)(yong)(yong)場景(jing)對并發(fa)性提出了更(geng)高的(de)(de)要求(qiu)。在設定8k上下文窗口的(de)(de)情(qing)況下，單張銳(rui)炫Pro B60無(wu)法支撐DeepSeek-R1 32B FP8精度模(mo)型的(de)(de)運行(xing)。使(shi)用(yong)(yong)(yong)(yong)兩張顯(xian)(xian)卡(ka)時(shi)，系統(tong)可支持(chi)5-6個并發(fa)用(yong)(yong)(yong)(yong)戶。而當采用(yong)(yong)(yong)(yong)四(si)張顯(xian)(xian)卡(ka)、利用(yong)(yong)(yong)(yong)全部96GB顯(xian)(xian)存(cun)時(shi)，系統(tong)可支持(chi)超過50個并發(fa)用(yong)(yong)(yong)(yong)戶，足以滿(man)足中小企業的(de)(de)大部分需求(qiu)。

英特爾自己也用銳炫(xuan)Pro B60來解(jie)決問題(ti)。在(zai)開發酷睿Ultra第二代Lunar Lake產品時(shi)，英特爾在(zai)VPC解(jie)碼(ma)過程(cheng)中發現(xian)(xian)了一個(ge)Bug，表現(xian)(xian)出現(xian)(xian)花屏(ping)現(xian)(xian)象。這類問題(ti)通(tong)常非常復(fu)雜，可能跨越多個(ge)軟件層，且(qie)代碼(ma)量(liang)巨大。一位經驗(yan)豐富的工程(cheng)師通(tong)常需要花費數天時(shi)間，從數萬(wan)行(xing)log中發現(xian)(xian)問題(ti)，debug找到根源(yuan)，并提供代碼(ma)修復(fu)方案，然(ran)后重(zhong)新(xin)進行(xing)測試。

而英特爾在配備4張銳炫Pro B60和至強W處理(li)器的(de)(de)服務器上部署運(yun)行多(duo)AI agent協同方(fang)案(an)，僅花費數小(xiao)時便完成了從問(wen)題定位到(dao)代碼修(xiu)復的(de)(de)全過程，并最終完成了所有問(wen)題的(de)(de)修(xiu)復和重新測試。

三、8張銳炫Pro B60互連，可跑1500億參數大模型

推理工(gong)作站(zhan)具有(you)廣(guang)闊的(de)發展前(qian)景，主(zhu)要(yao)體現在：1）安全(quan)部署，數據(ju)無(wu)需上傳至云端，可(ke)在本(ben)地處理；2）提供一站(zhan)式解決方案，將所有(you)軟件置于(yu)(yu)容器中，幫助客戶解決問題，易(yi)于(yu)(yu)設置；3）易(yi)于(yu)(yu)擴展，可(ke)靈活配(pei)置不(bu)同數量(liang)的(de)顯卡；4）成本(ben)效益具有(you)顯著(zhu)優勢(shi)。

英特爾發布了一款可配置的工作站級英特爾至強平臺（代號Project Battlematrix），旨(zhi)在減少AI開發人員的摩擦點。

借助高達192GB的視頻隨機存取存儲器（VRAM），它最多可支持8張英特爾銳炫Pro B60 24GB GPU，運行高達1500億個參數的(de)中等規模(mo)(mo)且精度(du)高(gao)的(de)AI模(mo)(mo)型。

為了優化(hua)AI推(tui)理(li)性能，英特爾在(zai)底層軟件(jian)上(shang)引(yin)入GPUDirect Peer-to-Peer技術，可(ke)(ke)在(zai)GPU之間直(zhi)接拷貝數據，不需要CPU參與。此外，其張(zhang)量并(bing)行算法則可(ke)(ke)以把(ba)一張(zhang)顯卡放不下的大模(mo)型(xing)平均(jun)切分到4張(zhang)或者是8張(zhang)卡上(shang)進行推(tui)理(li)，然后把(ba)結果合并(bing)輸出給用(yong)戶(hu)。

英特爾采用容(rong)器化方案(an)來幫助(zhu)客戶解決軟件(jian)部署的復雜性問題，在容(rong)器內部對大(da)語(yu)言模型進行了大(da)量(liang)的優化，包括Linux軟件(jian)棧的支持、驗證以(yi)及(ji)分(fen)階段的軟件(jian)發布。

其(qi)Project Battlematrix Linux軟件(jian)棧如下圖所(suo)示，Linux操(cao)作系(xi)(xi)統位于容器(qi)之(zhi)外，往上是用戶(hu)層(ceng)驅(qu)動(dong)，Level 0是英特(te)爾的底層(ceng)驅(qu)動(dong)，再向(xiang)上是英特(te)爾OneAPI和(he)XPU Manager，上層(ceng)是英特(te)爾對生態系(xi)(xi)統的支(zhi)持(chi)。目前該(gai)軟件(jian)棧采用vLLM Serving，未來也將支(zhi)持(chi)SGLang等其(qi)他開源軟件(jian)。英特(te)爾對各層(ceng)軟件(jian)進行了(le)完整的驗證和(he)優(you)化(hua)，并通過(guo)容器(qi)形(xing)式一鍵(jian)交付給(gei)客(ke)戶(hu)，以方便部署。

英特爾還(huan)展示了軟件(jian)功能(neng)路線圖，預計第三季度發布經(jing)過完整驗證(zheng)和產品化的(de)容器，第四(si)季度推出SR-IOV、VDI虛擬桌面(mian)的(de)軟件(jian)性能(neng)優化以(yi)及(ji)完整的(de)管(guan)理功能(neng)。

四、英特爾Gaudi 3：PCIe卡AI峰值算力達1678TFLOPS，機架級配備8.2TB HBM

英特(te)爾進一步推進其AI戰略(lve)，推出英特(te)爾Gaudi 3 AI加速器(qi)的全新部署方(fang)案。

英特爾Gaudi 3 PCIe卡配(pei)備128GB HBM2e，FP8精(jing)度下AI峰值(zhi)算力達到1678TFLOPS，支持在現有服務(wu)器數據中心(xin)環境中進行可擴展的AI推(tui)理(li)。

以AI大(da)模型Llama為例，得益于可擴展配置(zhi)，可靈(ling)活運行從輕量級Llama 3.1 8B到(dao)規模較大(da)的Llama 4 Scout或Maverick等各(ge)種規模的AI模型。

英特爾Gaudi 3機架級系統參考設計帶來了極大的靈活性和可擴展性，每個機架最多可容納64個加速器，并擁有高達8.2TB的高帶寬(kuan)內存（HBM）。

其機架級架構針對大型(xing)AI模型(xing)進行深度(du)優化，可提供(gong)實時(shi)推理(li)性能(neng)。

開放式(shi)模塊化(hua)設計打破了供應商的限制(zhi)，而有(you)線(xian)背(bei)板和盲插2D全機架布線(xian)讓安裝和維護變得更(geng)加簡單(dan)。通過液冷(leng)，這些系統(tong)可提供強大(da)的性能，并有(you)助于TCO的控制(zhi)。

這些配置支持云服務提供商(shang)（CSP）的定制化需求和開放(fang)計算項目（OCP）設(she)計規范。英特爾(er)承諾構建開放(fang)、靈活和安全AI基(ji)礎(chu)設(she)施。

結語：英特爾邁向全面轉型，力補AI產品實力，強調“執行力”與“說真話”

此次(ci)新品發(fa)布正值英特(te)(te)爾與臺灣科技生態系統合作(zuo)40周年。英特(te)(te)爾進一步擴大專業(ye)級GPU陣容(rong)，提供大顯存、高性價比以及為(wei)AI推理(li)和專業(ye)工作(zuo)站量身定制(zhi)的配置(zhi)，并展示(shi)了其(qi)AI加速器產(chan)品及AI Assistant Builder的可用性。這些新產(chan)品有望為(wei)英特(te)(te)爾開辟新的局面(mian)。

在英特(te)爾臺灣40周年晚(wan)宴活動上，陳立武(wu)發表致辭，談到英特(te)爾將全面轉(zhuan)型，重回工(gong)程導(dao)向，不(bu)僅做CPU，還要構建完整的AI計(ji)算系統，包括芯片、軟件(jian)、存儲、互(hu)連(lian)及(ji)工(gong)作負載(zai)整合，并(bing)強化與(yu)中國臺灣科(ke)技供應(ying)鏈及(ji)客(ke)戶的交流合作。

陳立武再度表露改造英特爾的決心和策略，以及對“新英特爾”的期許。英特爾在PC市場有超過68%的市占率，在服務器市場有55%的市占率。據陳(chen)立武透露，一些(xie)客(ke)戶反(fan)饋為(wei)了提高系統性能，正在評估(gu)推(tui)動(dong)開發定制芯片。

陳立(li)武強調(diao)了兩個目標：打造好(hao)產(chan)品(pin)，令客(ke)戶滿意。為此，他讓英(ying)特(te)爾工程(cheng)團(tuan)(tuan)隊直接向他匯報(bao)，確保做(zuo)出正(zheng)確的(de)芯片產(chan)品(pin)，并積極招募人才。他告訴團(tuan)(tuan)隊：“如果(guo)你(ni)不(bu)先告訴我壞消息(xi)，而是(shi)讓我從客(ke)戶口(kou)中得(de)知，那你(ni)就麻煩(fan)大了。我要(yao)的(de)是(shi)誠實、真實的(de)文化。”

此次來臺行程中，陳立(li)武拜訪了(le)許多OEM客戶，聽到很多反(fan)饋。“你會看到一個(ge)全(quan)新的英特(te)爾(er)。”他相(xiang)信英特(te)爾(er)未來將(jiang)以(yi)更謙卑、更開放的態度，主動傾(qing)聽客戶聲音，不僅要(yao)推(tui)出(chu)好產品，更要(yao)讓生產穩(wen)定、準時、品質穩(wen)定。

“我相信(xin)只(zhi)要持續執行、執行、執行，就能讓(rang)英(ying)特爾恢(hui)復元(yuan)氣。”陳立武說(shuo)，他(ta)不是搞營(ying)銷的(de)，不會(hui)吹噓(xu)表現，英(ying)特爾將用成果說(shuo)話。

久久婷婷五月综合97色直播,日本日本熟妇中文在线视频,精品国精品自拍自在线,7777精品伊人久久久大香线蕉,男人用嘴添女人下身免费视频

一、銳炫Pro B50：AI性能提升至3倍，性價比較RTX A1000翻番

二、銳炫Pro B60：AI峰值算力197TOPS，跑DeepSeek-R1倍殺RTX 5060Ti

三、8張銳炫Pro B60互連，可跑1500億參數大模型

四、英特爾Gaudi 3：PCIe卡AI峰值算力達1678TFLOPS，機架級配備8.2TB HBM

結語：英特爾邁向全面轉型，力補AI產品實力，強調“執行力”與“說真話”

相關推薦