對(duì)AMD而言,近兩年算是喜憂參半的兩年。
洗心革面的英特爾,帶來(lái)了重整旗鼓后的第十二代酷睿處理器。全新的高性能混合架構(gòu),將性能內(nèi)核和效率內(nèi)核相互結(jié)合,讓處理器性能、生產(chǎn)力和創(chuàng)作力較之以往實(shí)現(xiàn)了飛躍,將AMD的常規(guī)處理器產(chǎn)品壓得喘不過(guò)氣。
【資料圖】
但另一方面,得益于大型游戲?qū)θ?jí)緩存的充分利用,AMD 3D V-Cache堆疊緩存近兩年大放異彩。最新發(fā)布的R7 7800X3D更是憑借相對(duì)領(lǐng)先的性能、更低的理論功耗和更高的性價(jià)比大殺四方,和i9-13900打得難分高下。
作為PC行業(yè)的霸主,英特爾顯然不會(huì)任由AMD這樣占有技術(shù)優(yōu)勢(shì)。
4月24日訊,英特爾2020年12月的專利顯示,該公司下一代CPU架構(gòu)又稱「Meteor Lake架構(gòu)」將具有封裝緩存功能,預(yù)計(jì)L4緩存將成為基礎(chǔ)區(qū)塊的一部分,可以被下一代CPU的任何構(gòu)建塊訪問(wèn)。該消息在近期發(fā)布的Linux Patch補(bǔ)丁中得以證實(shí),相關(guān)產(chǎn)品最快會(huì)在今年下半年正式發(fā)布。
如果說(shuō),AMD是在片上緩存設(shè)計(jì)的當(dāng)下做功夫,那么英特爾盯上的可能是片上緩存設(shè)計(jì)的未來(lái)。
緩存的發(fā)展史
首先,緩存是什么?
在CPU行業(yè)中,緩存即Cache Memory,指的是可以和CPU/集成GPU進(jìn)行高速數(shù)據(jù)交換的存儲(chǔ)器。
當(dāng)然這種概念,在早年P(guān)C行業(yè)是不存在的。維基百科顯示,早年間(指1980年前)的CPU普遍采用馮·諾依曼架構(gòu)。這是一個(gè)非常簡(jiǎn)單的結(jié)構(gòu),內(nèi)存、CPU 和I/O都根據(jù)一個(gè)主時(shí)鐘以鎖步方式發(fā)生,CPU直接從主存儲(chǔ)器中讀取數(shù)據(jù),借此解決了當(dāng)時(shí)計(jì)算機(jī)存儲(chǔ)容量太小,運(yùn)算速度過(guò)慢的問(wèn)題。
(圖源:程序員大本營(yíng),馮·諾依曼架構(gòu))
然而,隨著時(shí)間推移,CPU和內(nèi)存的發(fā)展速度出現(xiàn)了嚴(yán)重不對(duì)等的情況。
為了解決CPU速率和主存訪問(wèn)速率差距過(guò)大的問(wèn)題,IBM的Maurice Wilkes在1965年提出了緩存的概念,即在兩者之間插入一塊速度比內(nèi)存更快的高速緩存。只要將近期 CPU 要用的信息調(diào)入緩存,CPU 便可以直接從緩存中獲取信息,從而提高訪問(wèn)速度。
至于落實(shí)到消費(fèi)級(jí)市場(chǎng)上,則需要再往后推移。
1989年,英特爾發(fā)布了Intel i486處理器,這顆CPU創(chuàng)新性地集成了浮點(diǎn)運(yùn)算處理器和多重管線,而且在X86系列中首次使用了 RISC(精簡(jiǎn)指令集)技術(shù),可以在一個(gè)時(shí)鐘周期內(nèi)執(zhí)行一條指令,最重要的是,它還擁有8KB的L1 Cache,使整個(gè)芯片的性能得到大幅度提升。
盡管在后續(xù)數(shù)十年時(shí)間里,緩存的具體概念歷經(jīng)了幾次變化,但整體架構(gòu)在1990年代后期便趨于穩(wěn)定。
目前市面上常見的CPU Cache通常分為三級(jí)緩存:L1 Cache、L2 Cache、L3 Cache,級(jí)別越低的離CPU核心越近,訪問(wèn)速度也快,但是存儲(chǔ)容量相對(duì)就會(huì)越小。其中,在多核心的CPU里,每個(gè)核心都有各自的L1/L2Cache,而L3 Cache是所有核心共享使用的。
然后出現(xiàn)的,便是我們今天要講的四級(jí)緩存(L4 Cache)。
改良,加以再現(xiàn)
不過(guò)四級(jí)緩存這個(gè)概念,并非第一次出現(xiàn)在市面上。
為了滿足多個(gè)處理器之間的協(xié)同需求,進(jìn)入2010年代后,IBM開始嘗試性地在System z11大型機(jī)的NUMA互連芯片組中添加了L4緩存。
最有趣的是,他們?cè)诮鼉赡旮哒{(diào)宣布取消L3/L4物理緩存,將所有緩存都用eDRAM來(lái)實(shí)現(xiàn)——由此實(shí)現(xiàn)了至高32MB的L2緩存 ,256MB的共享L3緩存以及8GB共享L4緩存。
英特爾這邊,則是在四代酷睿Haswell架構(gòu)處理器上搭載了eDRAM,作為CPU和iGPU的L4四級(jí)緩存。
舉個(gè)例子,當(dāng)時(shí)的頂級(jí)移動(dòng)端CPU——i7-4950QH,便在常規(guī)的三級(jí)緩存以外,額外搭載了一塊針對(duì)iris Pro系列核顯的128MB緩存芯片,英特爾希望以此來(lái)緩解核顯對(duì)于內(nèi)存本身的占用,和AMD APU搭載的A系列核顯抗衡的同時(shí),提升CPU的運(yùn)行效率。
遺憾的是,因?yàn)楫?dāng)時(shí)設(shè)計(jì)不成熟的原因,英特爾配備的這塊四級(jí)緩存幾乎沒(méi)有用武之地,除了核顯在運(yùn)行游戲時(shí)會(huì)產(chǎn)生比較積極的調(diào)度,以及提升挖礦能力以外,在CPU運(yùn)行軟件的時(shí)候,大部分情況下,各種應(yīng)用程序還是會(huì)主動(dòng)調(diào)用三級(jí)緩存,在性能上并沒(méi)有什么優(yōu)勢(shì)。
(圖源:快科技,i7-4750QH實(shí)測(cè))
正因如此,這項(xiàng)配置延續(xù)到Coffee Lake 9代酷睿便沒(méi)了下文。
在吸取教訓(xùn)后,如今英特爾已經(jīng)準(zhǔn)備好代號(hào)為Adamantine L4的高速緩存,希望從另外一個(gè)角度推動(dòng)四級(jí)緩存的普及。
根據(jù)外媒VideoCardz發(fā)現(xiàn)的專利表明,英特爾的Adamantine緩存將提供比任何典型緩存(如L3緩存等)更快的訪問(wèn)速度,不僅可以改善CPU和內(nèi)存之間的傳輸效率,還可以改善CPU和安全控制器之間的通信,甚至在重置時(shí)保留緩存中的數(shù)據(jù)以縮短加載時(shí)間。
不僅如此,因?yàn)閑DRAM的特性,Adamantine緩存不必再拘泥于現(xiàn)有的容量限制,英特爾Meteor Lake的Adamantine緩存甚至可以擴(kuò)展到“GB”級(jí)別。即便是目前測(cè)試的大?。?28MB到512MB,也已經(jīng)是傳統(tǒng)三緩的數(shù)倍,甚至可以和AMD 3D V-Cache同臺(tái)較量。
而這,正是英特爾目前想要實(shí)現(xiàn)的效果。
新緩存,新革命
也就是說(shuō),四級(jí)緩存的時(shí)代要來(lái)了?
在我看來(lái),即便英特爾方面野心勃勃,但是想要革新目前的PC緩存機(jī)制并沒(méi)有那么簡(jiǎn)單。
首先,應(yīng)用的適配程度始終是個(gè)問(wèn)題。即便是目前大熱的AMD 3D V-Cache堆疊緩存,也僅有在部分非常吃緩存容量的大型3A游戲/MMO網(wǎng)絡(luò)游戲上面,才能體現(xiàn)出明顯的優(yōu)勢(shì),在高分辨率的情況下,甚至可能出現(xiàn)游戲性能被主頻和核心數(shù)更多的英特爾處理器超越的情況。
其次,則在于產(chǎn)品的成本問(wèn)題。即便Adamantine緩存真的像英特爾所述,速度更快、延遲更低,但它必然需要更大的面積和更復(fù)雜的設(shè)計(jì),也會(huì)增加處理器的功耗和發(fā)熱,從而影響散熱和電池續(xù)航(參考AMD 3D V-Cache過(guò)熱),最終導(dǎo)致硬件成本的成倍增加。
不管怎么說(shuō),對(duì)普通用戶而言,一款產(chǎn)品是否值得購(gòu)買,是要從性能、功能、價(jià)格等各個(gè)方面來(lái)決策選擇的。隨著計(jì)算機(jī)技術(shù)的不斷進(jìn)步,未來(lái)必然會(huì)出現(xiàn)更多層次的緩存設(shè)計(jì),即便因?yàn)閮r(jià)格問(wèn)題無(wú)法快速普及,像Adamantine緩存這種在工程上付出了較大努力的產(chǎn)品,還是值得相當(dāng)程度的肯定的。
英特爾能否再度引領(lǐng)緩存技術(shù)的未來(lái)?或許只有時(shí)間能給我們答案。
關(guān)鍵詞: