芯東西(公眾號:aichip001)
作者 | ?ZeR0
編輯 | ?漠影

芯東西6月17日報道,上個月,英特爾推出3款全新英特爾至強6系列處理器,特別滿足搭載領先GPU的AI系統的需求。其中英特爾至強6776P處理器將作為主控CPU,被應用于英偉達最新一代AI加速系統DGX B300中(zhong)。據(ju)英特爾(er)技術專家介紹,英特爾(er)目前是(shi)英偉達(da)B300唯一的主控(kong)CPU合(he)作伙伴。

英特爾至強6技術揭秘:被英偉達DGX B300選中的主控CPU,PCT助攻GPU加速AI計算

這三款新品配備性能核(P-core),并集成了英特爾創新的Priority Core Turbo(PCT)以及英特爾Speed Select – 睿頻頻率(Intel SST-TF)技(ji)術(shu)(shu),可提(ti)供定(ding)制化的(de)CPU核心頻率,進(jin)而提(ti)升GPU在高(gao)強度AI工作負載下的(de)性能。針對這些技(ji)術(shu)(shu)細節,英特爾技(ji)術(shu)(shu)專(zhuan)家(jia)與(yu)芯東(dong)西等(deng)媒體進(jin)行了(le)深入交流。

三款新品的一大技術(shu)亮點是通過PCT技術(shu)實現(xian)頻(pin)(pin)率提升(sheng)。PCT能夠動(dong)態地讓高(gao)優先(xian)級核(he)心以更高(gao)的睿頻(pin)(pin)頻(pin)(pin)率運(yun)行,而(er)低(di)優先(xian)級核(he)心以基礎頻(pin)(pin)率運(yun)行,從而(er)實現(xian)CPU資源的優化配置。

以至強6776P為例,該處理器有64核,TDP為350W,基礎頻率是2.3GHz,所有核心的睿頻(All Core Turbo)是3.6GHz,最大睿頻(Max Turbo)是3.9GHz,而PCT頻率可以達到4.6GHz,相比傳統64核SKU的3.9GHz高出0.7GHz

英特爾至強6技術揭秘:被英偉達DGX B300選中的主控CPU,PCT助攻GPU加速AI計算

在(zai)(zai)PCT SKU推出前(qian),其SKU支持(chi)的最高頻(pin)率為Max Turbo。Max Turbo是指(zhi)在(zai)(zai)假設一(yi)半(ban)核心處(chu)于活躍(yue)狀(zhuang)態,而另一(yi)半(ban)核心處(chu)于休眠(mian)狀(zhuang)態時,活躍(yue)的核心能夠運行在(zai)(zai)更高的頻(pin)率。在(zai)(zai)云場(chang)景(jing)中,由于需要將(jiang)一(yi)個CPU插(cha)槽(cao)配(pei)置為不同的虛(xu)擬機(VM)并租(zu)給不同客戶,因(yin)此需要在(zai)(zai)性能和資源(yuan)分(fen)配(pei)之(zhi)間(jian)進行平衡,通常會選(xuan)擇(ze)All Core Turbo模(mo)式。

而三(san)款全新(xin)至(zhi)強6 SKU最多支持8個PCT核心(xin),也就是說,8個PCT核心(xin)可以(yi)(yi)運(yun)行(xing)到更高(gao)(gao)頻(pin)率上(shang),64核最高(gao)(gao)可以(yi)(yi)跑(pao)到4.6GHz,72核可以(yi)(yi)跑(pao)到4.4GHz,剩下的核心(xin)運(yun)行(xing)在基頻(pin)上(shang)。

英特爾(er)Speed Select?technology(SST)技術(shu)則可(ke)針對單(dan)(dan)路中的(de)不(bu)(bu)同(tong)核心配(pei)置分配(pei)不(bu)(bu)同(tong)頻(pin)率(lv),使其有不(bu)(bu)同(tong)性能。其中的(de)一個子技術(shu)SST-TF(Turbo Frequency),將單(dan)(dan)路中的(de)核心分成兩組(zu),即高優(you)組(zu)和(he)低(di)優(you)組(zu),高優(you)組(zu)配(pei)置為高頻(pin)率(lv),低(di)優(you)組(zu)配(pei)置為低(di)頻(pin)率(lv)。

如果GPU需(xu)要(yao)(yao)相對(dui)高頻率的核心(xin)來驅(qu)動,更快地(di)傳輸GPU的數據(ju),提高GPU利(li)用率,那么PCT設計可以幫助實現(xian),進而顯著提高整個(ge)系統的運行效率。因此這一功能對(dui)于需(xu)要(yao)(yao)順(shun)序或串行處理(li)的AI工作負載至關重要(yao)(yao)。

英偉達DGX B300使用英特爾(er)至(zhi)強6776P作(zuo)為主(zhu)控CPU,選擇2 DPC(每通道2個(ge)(ge)DIMM)配置,如果采用最大容量的(de)DIMM,最多(duo)(duo)支(zhi)持(chi)(chi)8TB的(de)CPU內(nei)存。下圖(tu)是在(zai)AI系統中使用至(zhi)強6為主(zhu)控CPU的(de)示(shi)意圖(tu),有2個(ge)(ge)CPU、8個(ge)(ge)GPU,兩個(ge)(ge)GNR-SP的(de)雙路通過(guo)UPI互連,每路最多(duo)(duo)支(zhi)持(chi)(chi)8個(ge)(ge)PCT核心(xin),客(ke)戶可按需選擇8個(ge)(ge)、6個(ge)(ge)、4個(ge)(ge)或2個(ge)(ge)。

英特爾至強6技術揭秘:被英偉達DGX B300選中的主控CPU,PCT助攻GPU加速AI計算

英(ying)特(te)爾技術專家談道,作為主控CPU,至強6與(yu)GPU協同(tong)工作,其系統(tong)性能(neng)(neng)受到(dao)多種因素的影響(xiang),包(bao)括I/O、核心性能(neng)(neng)、內存帶(dai)寬和容量、CPU上的預處理或卸載能(neng)(neng)力(li)、整體CPU系統(tong)的RAS,以及(ji)各種硬件的形態設(she)計等(deng)。

與(yu)上一代相比,英特爾至(zhi)強(qiang)6性能(neng)核處理器(qi)優化的主要特性包(bao)括:

英特爾至強6技術揭秘:被英偉達DGX B300選中的主控CPU,PCT助攻GPU加速AI計算

(1)增強的I/O性能:相比上一代至強處理器,PCIe通道數量增加20%至192個通道,加速了針對I/O密集型(xing)工作負載(zai)的(de)數據傳輸(shu)。

(2)高核心數與高單線程性能:每顆CPU最多集成128個性能核,確(que)保在密集型AI任務中實(shi)現有效的(de)(de)工(gong)作負(fu)載(zai)分(fen)配。PCT技術是在更(geng)高的(de)(de)單線程性能的(de)(de)基礎上(shang),針(zhen)對特(te)定AI負(fu)載(zai)的(de)(de)優化(hua)增強。

(3)內存速度更快:相比標準DDR5-6400,內存容量和帶寬更高;在高容量配置下提供更優異的內存性能,并通過MRDIMMCXL提供領先(xian)的內存帶寬。

(4)英特爾高級矩陣擴展(AMX):支持FP16精度運算(suan),為AI工作負載(zai)中的數據預處理(li)及關(guan)鍵CPU任務(wu)提供高效支持。市場上已(yi)有不少(shao)關(guan)于(yu)通過英特爾AMX將部分(fen)MoE(混(hun)合專家)模型中的專家層卸載(zai)至至強處理(li)器的案例,這種方式有助于(yu)提升端到端的吞(tun)吐量(liang),降低TCO。

(5)更高穩定性與便于維護:提(ti)供豐(feng)富RAS支持(RAS即Reliability、Availability、Serviceability,指(zhi)的(de)(de)是可(ke)靠性(xing)、可(ke)用性(xing)和可(ke)維(wei)護性(xing)),專(zhuan)為最大化正(zheng)常運行時間(uptime)而(er)設計(ji),具備更(geng)出色的(de)(de)穩定(ding)性(xing)和便捷的(de)(de)維(wei)護特(te)性(xing),可(ke)降低將業務中斷(duan)的(de)(de)可(ke)能(neng)性(xing)。通常I/O連接(jie)方案選定(ding)后,其帶寬便固(gu)定(ding)不可(ke)更(geng)改,RAS特(te)性(xing)可(ke)減少(shao)故障,提(ti)高I/O的(de)(de)穩定(ding)性(xing)。

(6)支持不同硬件的形態:支持DC-MHS全球標(biao)準,面向英偉達MGX和DGX均有與英偉達合作的主控CPU設(she)計。

企業正在持續(xu)推進基礎設施升級,以適應日益(yi)增(zeng)長的(de)AI需求(qiu)。在此背景下,英(ying)特(te)爾(er)至強6性能核處理器的(de)這些(xie)特(te)性,使其進一(yi)步鞏固(gu)了英(ying)特(te)爾(er)針(zhen)對AI優化(hua)的(de)CPU解決方案的(de)領先優勢,能夠更充分(fen)地(di)滿足日益(yi)增(zeng)長的(de)AI模型和數據集的(de)需求(qiu)。

英(ying)特(te)爾技術專家稱,英(ying)特(te)爾始終秉(bing)持開放態度,為主控(kong)CPU提供最佳(jia)選擇(ze),以(yi)滿足客戶(hu)的(de)多樣化需求(qiu)。