AMD“推土機”和Intel Xeon 5600以及 Xeon E7性能評測對比
AMD新一代處理器架構(gòu)Bulldozer(推土機)在兩年前就已經(jīng)引起業(yè)界的廣泛注意,由于其新穎的“物理雙線程”設(shè)計讓很多人對于AMD首次涉足多線程領(lǐng)域的表現(xiàn)非常期待。2009年11月11日,AMD正式明確了Bulldozer的架構(gòu),而隨著日后Bulldozer的細(xì)節(jié)公布,本站也做了相應(yīng)的報道,其雙核模塊的設(shè)計確實讓人眼前一亮,好奇心也因此更上一層樓。近日,桌面版的Bulldozer處理器率先亮相,8核心的FX8100與4核心的FX4100的評測已經(jīng)鋪天蓋地,而11月14日,面向企業(yè)級應(yīng)用市場的皓龍(Opteron)版Bulldozer終于正式亮相,分別是最高16核心/8模塊的Opteron 6200系列與最高8核心/4模塊的Opteron 4200系列。由此也正式向世人宣布了AMD的最新服務(wù)器平臺。在AMD的聲明中強調(diào),新一代基于Bulldozer的皓龍?zhí)幚砥鲗樵茣r代提供強大的動力,同時也為企業(yè)帶來高效、節(jié)能的基礎(chǔ)運算平臺。那么從理論到實踐,從期盼到現(xiàn)實,Bulldozer能為將來的云“推”出多大 的天空任其馳騁呢?我們今天就來做一分析,而重點就是Opteron 6200系列。
Opteron 6200處理器新特性簡介
有關(guān)Bulldozer處理器架構(gòu)的介紹,已經(jīng)有很多了,但為了文章的完整性,我們今天也在此做一簡單的回顧與介紹(參見上面提到的本站專文),首先要明確的是,從Bulldozer開始,傳統(tǒng)意義上的“CPU核心”的概念已經(jīng)有了變化。
Bulldozer的“模塊”架構(gòu)圖,可以看作是兩個整數(shù)處理核心共享一個浮點處理單元的設(shè)計 ,因為日常的處理運算中,更多的是整數(shù)處理,所以這就變向的等于在一個模塊可以同時處理兩個整數(shù)處理線程,而無需共享處理管線
AMD當(dāng)初開發(fā)Bulldozer架構(gòu)的初衷在于,經(jīng)調(diào)查發(fā)現(xiàn)日常的IT應(yīng)用主要集中于整數(shù)運算,而浮點運算相對較少。為了提高多線程處理的性能,AMD設(shè)想可不可以用2+1的方式來解決,即兩個整數(shù)處理核心+1個浮點處理單元,以組成一個新架構(gòu)的處理單元——Module(模塊)。 眾所周知,在多線程處理方面,英特爾最早提出了Hyper-Threading(超線程)的理念,可以使操作系統(tǒng)或者應(yīng)用軟件的多個線程,同時運行于一個超線程處理器上,其內(nèi)部的兩個邏輯處理器共享一組處理器執(zhí)行單元。而AMD CPU的兩個線程使用各自的單元,但兩個線程是共享命令解碼器和浮點運算等資源的。因為是整數(shù)運算,所有線程之間沒有沖突,因此吞吐量有所提高。
從芯片級別看Bulldozer模塊,每個模塊擁有自己的L2緩存,L3緩存則為晶片級共享
Opteron 6200與4200的晶片設(shè)計圖,4200由單晶片(功能單元略有不同)構(gòu)成,最多4個模塊(8核心),6200由兩塊該晶片組成,最多8個模塊(16個核心)
由于這種2+1的核心設(shè)計,在Bulldozer的架構(gòu)中,其核心(Core)的概念已經(jīng)與傳統(tǒng)認(rèn)識有了較大的不同,單一的核心并不是一個具備完整功能的處理單位,所以AMD一直在用Bulldozer Module來表示Bulldozer處理器的處理單元,所以在后文的介紹中,對于Opteron 6200我們也將用模塊和核心兩個概念表述——在這里,核心是指組成模塊中的整數(shù)處理單元,它們共享一個彈性浮點處理單元(Flex FP)。
Opteron 6200的內(nèi)部架構(gòu)圖,相當(dāng)于用兩塊4200組成,兩個芯片之間由HyperTransport總線互聯(lián)
在Bulldozer架構(gòu)中,非常值得一提的是由兩個整數(shù)處理核心共享的Flex FP處理單元與新增加的獨家指令集。這一Flex FP由兩個128bit FMAC(Fused Multiply–Add Capability,混合乘加)處理單元組成,之所以稱為彈性(Flex),是因為這兩個單元可以各自獨立,為每個整數(shù)核心提供獨享的128bit浮點處理單元(此時可以認(rèn)為是兩個具備有整數(shù)運算+128bit浮點運算單元的處理核心,組成了Bulldozer Module),也可以組合成一個256bit的浮點處理單元為一個模塊提供服務(wù),這其實給編程人員提供了很好的彈性,但也預(yù)示著對現(xiàn)有的應(yīng)用需要進(jìn)一步的優(yōu)化。 #p#page_title#e#
Opteron 6200與6100、英特爾的SandyBridge之間的浮點處理模式的對比
簡單來說,這種兩個128bit單元彈性組合的方式,提供了有多種指令處理的模式,比如對于同時執(zhí)行兩個128bit的AVX指令,SandyBridge單一的256bit FP單元就不行了,而Flex FP則可以,同樣的,這也適用于SSE指令。所以,AMD強調(diào),除非是256bit的AVX指令環(huán)境,否則6200的單周期浮點處理能力是SandyBridge的兩倍,顯然靈活的可分拆也可組合的Flex FP功不可沒。
Opteron 6200除了具備與英特爾SandyBridge相同的指令集外,還獨家提供了兩套指令集
目前主流的編譯器大多已經(jīng)支持AMD的FMA4和XOP指令集
而為了發(fā)揮Flex FP的強大的威力,AMD也專門開發(fā)了兩套針對浮點運算的指令集FMA4與XOP,兩者可以說都是為高性能計算所服務(wù),但側(cè)重點不太相同,F(xiàn)MA4更有針對性,比如向量和矩陣計算、多項式評估、數(shù)據(jù)信號處理等,而XOP則針對數(shù)學(xué)、多媒體應(yīng)用等。目前,主流的編譯器大多已經(jīng)全部或部分支持AMD的新指令集,因此在發(fā)揮Bulldozer的浮點威力方面,還是很讓人期待的。
新一代Opteron 6200/4200的主要特性
說完主要的處理架構(gòu)的亮點外,我們再來看看其他方面的改。AMD強調(diào)了新一代處理器在三個方面的靈活性優(yōu)勢,分別是處理性能的靈活性,能耗的靈活性與平臺及虛擬化的靈活性。而相較上一代的6100處理器平臺,我認(rèn)為前兩者的改進(jìn)最為明顯。
Opteron 6200與6100對比,請注意整數(shù)處理的每周期發(fā)射數(shù)的提高(預(yù)示整數(shù)性能提升更明顯)、Turbo CORE超頻、C6能耗控制等新的變化
每個核心都有6個能耗/性能等級(P-States),可以根據(jù)TDP的設(shè)定而將最高性能限制在某一等級之下,而當(dāng)與TurboCORE技術(shù)相配合時,我們能發(fā)現(xiàn)又多出兩個等級,以提供最強的核心性能。在Opteron 6200平臺上,用戶可以在BIOS中通過AMD新推出的TDP Power Cap功能設(shè)定總功耗限制,而P-States也就會做出相應(yīng)的限定
新增加的C6能耗控制狀態(tài),在這一狀態(tài),空閑的模塊可以單獨進(jìn)入C6狀態(tài),此時模塊停止供電與時鐘信號,從而可最多節(jié)省95%的能耗。在Bulldozer處理器,每個模塊的狀態(tài)將保存在內(nèi)存中
AMD TurboCORE技術(shù)實現(xiàn)了類似于英特爾“睿頻”(TurboBoost)的功能
我們已經(jīng)對英特爾的“睿頻”技術(shù)有所了解,它可以在處理器的能耗不超出TDP功率限制的前提下,根據(jù)應(yīng)用的性能需求,提升處理器核心的運行頻率以最大限度挖掘核心的處理性能,而在Opteron 6200上也同樣具備了這一能力,它就是AMD 的TurboCORE技術(shù),它可分為兩個模式。一種是All Core模式,所有的模塊都可以提升300至500MHz的主頻,另一種是Max Turbo,即如果一些輕負(fù)載線程讓一半的模塊可以將進(jìn)入C6狀態(tài),但余下的模塊又需要最大的處理性能,此時可以在All Core的基礎(chǔ)上再增加500MHz(即最高可超頻1GHz)。
Opteron 6200處理器價格信息與規(guī)格比較
我們在4月份曾做過Opteron 6100與至強7500和5600之間的對比。今天將延續(xù)我們以往的風(fēng)格,我們在此會列出Opteron 6200的規(guī)格信息,以及與Opteron 4200的價格信息,并將開始與主要的競爭對手進(jìn)行對比。在這里需要強調(diào)的是,從6100系列來,AMD就放棄了4路以上的服務(wù)器市場,并且主攻雙插槽市場,這一點與英特爾的戰(zhàn)略明顯不同。所以,AMD將Opteron 6200定位于主流的雙插槽及4路服務(wù)器市場,4200則主要是面向云計算集群應(yīng)用以及輕負(fù)載的企業(yè)應(yīng)用,只有雙插槽平臺可供選擇。
Opteron 6200與Opteron 4200的官方報價,4200最低價為125美元,6200最高為1019美元
年初發(fā)布的6100系列處理器的價格表,可以看出6200居然更便宜
24.jpg
英特爾E7處理器的價格,4路型號最高價格4394美元,雙插槽最高價格4227美元,相比之下Opteron 6200太廉價了……
25.jpg
與6100一樣,6200同樣面對兩個強大的對手,但4路平臺從至強7500換成E7,而雙插槽平臺仍然是至強5600
以價格段為區(qū)間,至強5600與Opteron 6200的型號對位表,這也將影響到我們下面的評測處理器的選擇