Appro借助Nehalem和GPU打造超級計算機HyperPower
Tesla圖形處理器和他們相關的CUDA工具去年秋天實現商業(yè)化,并成為Penguin Computing和幾家銷售私人超級計算機的廠商的選擇。搭載Tesla圖形處理器的塔式X64服務器在浮點計算能力上表現出色。
Appro公司高級技術解決方案副總裁約翰.李表示,Appro公司一直保持謹慎,等待Tesla技術的日臻成熟。對于最新的Tesla卡,nVidia公司針對大規(guī)模工作負載將提供雙精度數學計算能力。盡管目前這些卡比起他們在單精度計算上的表現來說,在雙精度性能上還有一定差距--即Tesla單元的內存上缺乏糾錯能力。但李表示用戶希望能開始使用目前的CUDA環(huán)境來配置混合X64-GPU系統(tǒng),因此他們在新一代nVidia GPU協(xié)處理器上已經準備就緒。
這些新一代Tesla協(xié)處理器的精確設計規(guī)格目前尚不清楚,不過李表示它將比目前的Tesla PCI-Express卡更加先進,雙精度性能表現也更加出色。這些全新的Tesla圖形處理器預計會在2010年上半年推出。
Appro HyperPower集群采用內置兩個服務器的1U機箱。這兩個雙路半高服務器能支持英特爾公司目前最新推出的"Nehalem EP"至強5500處理器。每個Nehalem服務器與一個配置了Tesla S1070圖形處理器的服務器應用工具相連接。Tesla S1070可以容納4個圖形處理器,每個處理器集成了240個核心,主頻在1.3GHZ和1.44GHz之間,單個服務器機箱的內存為16GB。
這個應用工具通過兩個PCI-Express 2.0 x16插槽(每個雙路半高服務器有有1個插槽)和服務器連接在一起。根據時鐘頻率的不同,
占據整個1U機箱的Tesla S1070圖形處理器單精度浮點計算能力從3.73萬億次到4.14萬億次,但是雙精度浮點計算能力僅在3110億到340億此之間。
Appro HyperPower在標準的42U機架內容納了19對Nehalem EP服務器和交叉連接了19個Tesla應用工具,核心總數達到304x64個,圖形處理器核心達到18240個。機架峰值性能的單精度浮點計算能力超過70萬億次,雙精度浮點計算能力為6.56萬億次。這是一個令人驚嘆的位數,但卻并不令人意外:當這些應用工具滿載運行時,Tesla應用工具的功耗為800瓦特。
李表示Appro公司正在考慮使用現場可編程門陣列和其他協(xié)處理器技術,但是在每種情況下技術會帶來顯著的性能提升,編程模式必須做出改進,而且盡管這些技術能帶來很好的效果,但執(zhí)行起來的費用也非常昂貴。這對于采用現場可編程門陣列和其他定制超級計算機是個巨大的障礙。但是隨著CUDA C++和Fortran編程環(huán)境的成熟以及雙精度計算在Teslas上的使用,用戶希望能從中受益。即使Appro HyperPower根據配置的不同,可能的售價在25萬美元到50萬美元之間。
由此可得出在執(zhí)行單精度工作負載時,每千兆的費用在3.18美元到6.36美元之間。這與Penguin Computing使用同樣的Tesla S1070應用工具服務器對16萬億浮點計算能力和32萬億浮點計算能力的收費在一個市場區(qū)域內。在雙精度計算上,HyperPower機型每千兆的費用大概在38美元到76美元之間,而Penguin Computing每千兆的相關費用會有所上升。
Appro可以在HyperPower集群上支持紅帽的Enterprise Linux 5 Update 2 and Update 3,將來面向歐洲用戶還能支持NOVELL的SUSE Linux Enterprise Server 10和11。李表示出于銷售的目的,他們可能還會支持微軟的Windows HPC Server操作系統(tǒng),不過他承認在
Appro銷售超級計算機的市場上,用戶并沒有要求使用Windows系統(tǒng)(Tesla GPUs和CUDA編程環(huán)境可以在Windows服務器上運行,但是Appro只是根據用戶的需求提供的備選)。
盡管Appro目前與日本服務器制造商NEC公司之間存在分銷協(xié)議,NEC將負責亞洲市場的銷售。但HyperPowers并不在此項協(xié)議之列