地表最強深度學(xué)習(xí)訓(xùn)練平臺~UltraLAB GPU硬件選型
目錄
1 深度學(xué)習(xí)訓(xùn)練平臺與理想計算架構(gòu)
2 深度神經(jīng)網(wǎng)絡(luò)計算特點與硬件配置分析
3 UltraLAB GXM圖靈工作站與配置推薦
2018年8月最新深度學(xué)習(xí)基準(zhǔn)配置報價下載(直接點擊,GPU更新為RTX2080/2080Ti)
(一)深度學(xué)習(xí)訓(xùn)練平臺現(xiàn)狀與完美計算架構(gòu)
深度神經(jīng)網(wǎng)絡(luò)(DNN)計算數(shù)據(jù)模型繁多,結(jié)構(gòu)復(fù)雜,主流模型含幾十個隱含層,每層都在上千上萬級的神經(jīng)元,整個網(wǎng)絡(luò)更多,其計算量巨大,
市場上用于深度學(xué)習(xí)的訓(xùn)練計算機大致情況,
(1)服務(wù)器/工作站(支持2、4、8塊GPU架構(gòu)):普遍存在噪音大,無法放置于辦公環(huán)境,必須放到專門的機房,維護成本高,另外數(shù)據(jù)存儲帶寬、延遲、容量也不盡如意
(2)分布式集群架構(gòu):性能強大,但是開發(fā)成本太高,是大多數(shù)科研單位無法承受
那么問題來了,市場上是否有一個理想產(chǎn)品,彌補上述缺陷,讓更多單位都能用的起~人工智能AI超級異構(gòu)計算機
UltraLAB GXM圖靈計算工作站是西安坤隆計算機公司2017年上半年推出的、目前市場上一款集GPU超算、海量存儲于一體、基于辦公靜音環(huán)境、應(yīng)用于深度學(xué)習(xí)(機器學(xué)習(xí)、人工智能)的AI超級計算機系統(tǒng)。
和市面上深度學(xué)習(xí)計算機系統(tǒng)相比,顯著優(yōu)勢:
- 完全處于辦公環(huán)境(靜音級)、不在被噪音所困擾
- 配備基于PCIe總線的海量高速并行存儲(最大容量180TB),延遲低,支持最大15個并行讀,硬盤io性能大幅提升,性能和管理遠超傳統(tǒng)的DAS/NAS存儲系統(tǒng)
- 配備超級強大的計算能力,最大10個GPU卡,3.82萬計算核,單精度浮點120Tflops
- 不需要專門的機房,不占過多空間,維護成本極低
- 不需要作業(yè)調(diào)度系統(tǒng),管理難度大幅降低
(二)深度神經(jīng)網(wǎng)絡(luò)計算特點與硬件配置分析
市場上大部分GPU計算機(服務(wù)器/工作站),重點都放在GPU卡數(shù)量上,似乎只要配上足夠GPU卡,就可以了,實際情況是,機器硬件配置還需要整體均衡,只有這樣這臺機器性能才能更好的發(fā)揮
上述圖示,深度神經(jīng)網(wǎng)絡(luò)計算大致流程,下面通過深度神經(jīng)網(wǎng)絡(luò)計算環(huán)節(jié),分析核心硬件配置理想要求
1.數(shù)據(jù)存儲要求
做深度學(xué)習(xí)首先需要一個好的存儲系統(tǒng),將歷史資料保存起來
主要任務(wù):歷史數(shù)據(jù)存儲,如:文字、圖像、聲音、視頻、數(shù)據(jù)庫等。。。
性能要求:
a.數(shù)據(jù)容量:提供足夠高的存儲能力,
b.讀寫帶寬:多硬盤并行讀寫架構(gòu)提高數(shù)據(jù)讀寫帶寬
c.接口:高帶寬,同時延遲低
傳統(tǒng)解決方式:專門的存儲服務(wù)器,借助萬兆端口訪問
缺點:帶寬不高,對深度學(xué)習(xí)的數(shù)據(jù)讀取過程時間長(延遲大,兩臺機器之間數(shù)據(jù)交換),成本高
UltraLAB解決方案:將并行存儲直接通過PCIe接口,提供最大16個硬盤的并行讀取,數(shù)據(jù)量大并行讀取要求高,無論是總線還是硬盤并行帶寬,都得到加大提升,滿足海量數(shù)據(jù)密集io請求和計算需要
2.CPU要求
主要任務(wù):
(1)數(shù)據(jù)從存儲系統(tǒng)調(diào)入到內(nèi)存的解壓計算
(2)GPU計算前的數(shù)據(jù)預(yù)處理
(3)運行在代碼中寫入并讀取變量執(zhí)行指令,如函數(shù)調(diào)用啟動在GPU上函數(shù)調(diào)用,創(chuàng)建小批量數(shù)據(jù)啟動到GPU的數(shù)據(jù)傳輸
(4)GPU多卡并行計算前,每個核負責(zé)一塊卡的所需要的數(shù)據(jù)并行切分處理和控制
(5)求解后數(shù)據(jù)保存前的壓縮計算
上述每一類操作基本都是單核計算模式, 如果要加速這些過程,唯有提升CPU頻率
傳統(tǒng)解決方式:CPU規(guī)格很隨意,核數(shù)和頻率沒有任何要求
UltraLAB合理推薦:
a.CPU頻率:越高越好
b.CPU三級緩存:越大越好
c.CPU核數(shù):比GPU卡數(shù)量大(原則:1核對應(yīng)1卡,核數(shù)要有至少2個冗余)
3.GPU要求
主要任務(wù):承擔(dān)深度學(xué)習(xí)的數(shù)據(jù)建模計算、運行復(fù)雜算法
傳統(tǒng)架構(gòu):提供1~8塊GPU
UltraLAB合理推薦:
a.數(shù)據(jù)帶寬:PCIe8x 3.0以上
b.數(shù)據(jù)容量:顯存大小也很關(guān)鍵
c.計算匹配:CPU核-GPU卡 1對1
d.GPU卡加速:多卡提升并行處理效率
4 內(nèi)存要求
主要任務(wù):存放預(yù)處理的數(shù)據(jù),待GPU讀取處理,中間結(jié)果存放
UltraLAB合理推薦:
a.數(shù)據(jù)帶寬最大化:單Xeon E5v4 4通道內(nèi)存,雙Xeon E5v4 8通道內(nèi)存,內(nèi)存帶寬最大化
b.內(nèi)存容量合理化:大于GPU總顯存
#p#page_title#e#
(三)UltraLAB GXM圖靈計算工作站介紹與配置推薦
針對上述深度學(xué)習(xí)應(yīng)用計算特點,UltraLAB圖靈工作站具有深度學(xué)習(xí)最合理硬件配置架構(gòu),保證整個機器是一臺理想化異構(gòu)超算系統(tǒng),完美強大高效還靜音,目前提供兩種機型:GX480M和GX610M
3.1 圖靈計算工作站技術(shù)規(guī)格
機型 |
硬件配置規(guī)格 |
|||
CPU |
GPU |
內(nèi)存 |
存儲 |
|
GX480M |
單CPU架構(gòu),6核4.5GHz,8核4.3GHz,10核43GHz |
最大6塊GPU |
最大256GB |
并行存儲, 最大180TB |
GX610M |
雙Xeon架構(gòu), 2*Xeon E5 2637v4(共計8核3.5GHz) 2*Xeon E5 2643v4(共計12核3.4GHz) 2*Xeon E5 2667v4(共計16核3.2GHz) |
最大10塊GPU |
最大1TB |
并行存儲, 最大180TB |
技術(shù)規(guī)格一覽表
(1)GX480M技術(shù)規(guī)格一覽表
NO |
主要項 |
技術(shù)規(guī)格 |
1 |
CPU |
1顆intel 至尊處理器 推薦型號:6850K OC(6核4.5GHz) 6900K OC(8核4.3GHz) 6950X OC(10核4.3GHz) Xeon E5 2687Wv4(12核3.0GHz) |
2 |
芯片組 |
intel X99+PCH |
3 |
內(nèi)存 |
插槽:8個, 規(guī)格:DDR4 2400 Reg ECC 最大容量:256GB(8根32GB) |
4 |
GPU卡 |
數(shù)量:最大7個 接口:PCIE 8x 3.0 GPU種類:Nvidia Geforce、Quadro、Tesla Intel Xeon Phi,AMD Firepro 備注:散熱系統(tǒng)必須是主動式 |
5 |
系統(tǒng)盤 |
數(shù)量: 2塊 單盤容量:512GB/1TB/2TB/4TB SSD SATA-6Gbps接口, 支持RAID1 |
|
數(shù)據(jù)盤 |
數(shù)量:16塊, 單盤容量:4TB/6TB/8TB/10TB/12TB SATA 企業(yè)級, 最大容量180TB(RAID5),PCIe 4x 2.0接口 |
6 |
光驅(qū) |
DVD刻錄 |
7 |
平臺 |
型號UltraLAB S2AGDT01PCS 電源 1600w,數(shù)量1個(四塊GPU卡)或2個(5個以上) 機箱:雙塔式 機箱尺寸:深度658mm,寬度478mm,高度674mm 輸出口: 2個千兆以太端口(可選萬兆), 4個USB 3.0口,2個USB2.0,1個VGA口 硬盤位:16個3.5”熱插拔,最大容量180TB PCI擴展槽:7個PCIe 16x |
8 |
鍵盤鼠標(biāo) |
鍵盤:104鍵、有線、USB口, 鼠標(biāo):1000dpi精度、光電、有線、USB口 |
9 |
顯示器 |
23”圖顯(高清,可升降轉(zhuǎn)向,數(shù)量2臺) |
10 |
整機優(yōu)化 |
*2.1 自動超頻加速優(yōu)化; *2.2 高性能低延遲優(yōu)化; |
11 |
操作系統(tǒng) |
支持Window 7/8/10, Windows 2008/2012/2016 支持Ubuntu 全系列 |
12 |
支持深度學(xué)習(xí)框架 |
Nvidia GPU驅(qū)動程序,CUDA , Nvidia Digits, Nvidia cuDNN Caffe,Torch ,TensorFlow,CNTK,Theano, Chainer,DL4J,MXNet |
(2)GX610M技術(shù)規(guī)格一覽表
NO |
主要項 |
技術(shù)規(guī)格 |
1 |
CPU |
2顆Xeon E5 2600v4 推薦型號:Xeon E5 2637v4(4核3.5GHz) Xeon E5 2643v4 (6核3.4GHz) Xeon E5 2667v4(8核3.2GHz) Xeon E5 2687Wv4(12核3.0GHz) |
2 |
芯片組 |
intel C612+PCH |
3 |
內(nèi)存 |
插槽:16個, 規(guī)格:DDR4 2400 Reg ECC 最大容量:1TB(16根64GB) |
4 |
GPU卡 |
數(shù)量:最大10個 接口:PCIE 8x 3.0 GPU種類:Nvidia Geforce、Quadro、Tesla Intel Xeon Phi,AMD Firepro 備注:散熱系統(tǒng)必須是主動式 |
5 |
系統(tǒng)盤 |
數(shù)量: 2塊 單盤容量:512GB/1TB/2TB/4TB SSD SATA-6Gbps接口 支持RAID1 |
|
數(shù)據(jù)盤 |
數(shù)量:16塊, 單盤容量4TB/6TB/8TB/10TB/12TB SATA 企業(yè)級, 最大容量180TB(RAID5),PCIe 4x 2.0接口 |
6 |
光驅(qū) |
DVD刻錄 |
7 |
平臺 |
型號UltraLAB S2AGDT01PCS 電源 1600w,數(shù)量1個(四塊GPU卡) 或2個(5個以上) 機箱:雙塔式 機箱尺寸:深度658mm,寬度478mm,高度674mm 輸出口: 2個千兆以太端口(可選萬兆) 4個USB 3.0口,2個USB2.0,1個VGA口 硬盤位:16個3.5”熱插拔,最大容量180TB PCI擴展槽:10個PCIe 8x 3.0, 1個PCIe 4x 2.0 |
8 |
鍵盤鼠標(biāo) |
鍵盤:104鍵、有線、USB口, 鼠標(biāo):1000dpi精度、光電、有線、USB口 |
9 |
顯示器 |
23”圖顯(高清,可升降轉(zhuǎn)向,數(shù)量2臺) |
10 |
整機優(yōu)化 |
*2.1 自動超頻加速優(yōu)化; *2.2 高性能低延遲優(yōu)化; |
11 |
操作系統(tǒng) |
支持Window 7/8/10, Windows 2008/2012/2016 支持Ubuntu 全系列 |
12 |
支持深度學(xué)習(xí)框架 |
Nvidia GPU驅(qū)動程序,CUDA ,Nvidia Digits, Nvidia cuDNN,Caffe,Torch ,TensorFlow, CNTK,Theano,Chainer,DL4J,MXNet |
3.2 產(chǎn)品特點
(1)集GPU超算、并行存儲于一體的超級訓(xùn)練系統(tǒng)
基于辦公環(huán)境,靜音級
支持最大10塊GPU超算,單精度浮點最大到120Tflops
配備高速并行存儲(16個盤位),最大180TB容量
支持雙Xeon E5v4高頻處理器,加速密集預(yù)處理、高強度數(shù)據(jù)壓縮等計算環(huán)節(jié)
擁有CPU+GPU完美的深度學(xué)習(xí)架構(gòu)
(2)預(yù)裝完整開發(fā)工具的硬件系統(tǒng),幫助快速啟動深度學(xué)習(xí)研究項目
基于GPU工作站系統(tǒng),預(yù)裝深度學(xué)習(xí)所需的軟件:Nvidia 驅(qū)動程序,CUDA工具包,cuDNN,開源工具TensorFlow,Cafe,Torch,NVIDIA DIGITS等

#p#page_title#e#
3.3深度學(xué)習(xí)工作站硬件配置參考
(1)GX480M機型配置參考(超值型)
該機型特點:支持最大到6塊GPU卡,CPU的頻率達到極致,每個環(huán)節(jié)保證達到最理想性能,整體配置均衡無死角,滿足深度學(xué)習(xí)訓(xùn)練硬件配置要求
NO |
CPU |
內(nèi)存 |
GPU/總顯存 |
單精度 |
系統(tǒng)盤 |
并行存儲 |
平臺 |
售價 |
1 |
6850K OC (6核4.5GHz) |
32GB |
1塊GTX1080 8GB |
8Tflops |
512GB SSD |
4TB |
雙塔單電 |
46500 |
2 |
6850K OC (6核4.5GHz) |
32GB |
2塊GTX1080 16GB |
16Tflops |
512GB SSD |
2*4TB |
雙塔單電 |
55000 |
3 |
6850K OC (6核4.5GHz) |
64GB |
3塊GTX1080 24GB |
24Tflops |
512GB SSD |
3*4TB |
雙塔單電 |
67500 |
4 |
6900K OC (8核4.3GHz) |
64GB |
4塊GTX1080 32GB |
32Tflops |
1TB SSD |
28TB |
雙塔單電 |
98000 |
5 |
6900K OC (8核4.3GHz) |
96GB |
6塊GTX1080Ti 66GB |
68Tflops |
1TB SSD |
36TB |
雙塔雙電 |
149990 |
備注:含雙23”高清圖顯
(2)GX610M機型配置參考(高性能型)
該機型特點:支持最大到10塊GPU卡,CPU的頻率和核數(shù)達到最大均衡,每個環(huán)節(jié)保證達到最高性能,整體配置均衡無死角,滿足深度學(xué)習(xí)訓(xùn)練對配置的要求
NO |
CPU |
內(nèi)存 |
GPU/總顯存 |
單精度浮點 |
系統(tǒng)盤 |
并行存儲 |
平臺 |
售價 |
1 |
2*Xeon E5v4 8核3.5GHz |
64GB |
4塊GTX1080 32GB |
33Tflops |
512GB SSD |
28TB |
雙塔單電 |
111000 |
2 |
2*Xeon E5v4 12核3.4GHz |
128GB |
6塊GTX1080Ti 66GB |
68Tflops |
1TB SSD |
36TB |
雙塔單電 |
182000 |
3 |
2*Xeon E5v4 12核3.4GHz |
192GB |
8塊GTX1080Ti 88GB |
91Tflops |
1TB SSD |
44TB |
雙塔雙電 |
215000 |
4 |
2*Xeon E5v4 16核3.2GHz |
256GB |
9塊GTX1080Ti 99GB |
102Tflops |
1TB SSD |
60TB |
雙塔雙電 |
248000 |
5 |
2*Xeon E5v4 16核3.2GHz |
512GB |
9塊GTX1080Ti 99GB |
102Tflops |
1TB SSD |
120TB |
雙塔雙電 |
310000 |
6 |
2*Xeon E5v4 16核3.2GHz |
512GB |
9塊 Quadro P5000 144GB |
79.74Tflops |
2TB SSD |
120TB |
雙塔雙電 |
415000 |
7 |
2*Xeon E5v4 24核3.0GHz |
512GB |
9塊 Quadro P6000 216GB |
107.8Tflops |
2TB SSD |
150TB |
雙塔雙電 |
735000 |
備注:含雙23”高清圖顯
關(guān)于GPU計算卡主要型號參考
No |
型號 |
顯存 |
流處理器SP |
顯存帶寬 (GBs) |
浮點計算指標(biāo) TFLOPs (單精度) |
功耗 |
備注 |
1 |
Quadro P6000 |
24GB |
3840 |
432 |
11.98 |
250w |
顯存和性能最大 |
2 |
Quadro P5000 |
16GB |
2560 |
288 |
8.86 |
180w |
顯存更大 |
3 |
TITAN X |
12GB |
3584 |
480 |
10.97 |
250w |
|
4 |
GTX1080Ti |
11GB |
3584 |
484 |
11.33 |
250w |
性價比高 |
5 |
GTX1080 |
8GB |
2560 |
320 |
8.22 |
180w |
超值 |
6 |
GTX1070 |
8GB |
1920 |
256 |
5.78 |
150w |
超值 |
UltraLAB GXM在深度學(xué)習(xí)模型訓(xùn)練領(lǐng)域
除了熱門的語音識別、圖像識別、自然語言處理(機器翻譯)外,更多應(yīng)用
制造業(yè) |
生產(chǎn)管理,事故預(yù)防,技術(shù)更新,不合格產(chǎn)品預(yù)判 |
醫(yī)療與護理 |
影像診斷,用藥管理 |
零售,飲食,食品 |
自動記賬,庫存控制,店面防盜預(yù)防,內(nèi)部檢測,污染檢測,可疑人物檢測 |
安全監(jiān)控 |
電梯監(jiān)控,設(shè)備監(jiān)控,店面監(jiān)控 |
建筑與房地產(chǎn) |
工程管理,事故預(yù)防,房地產(chǎn)信息查詢,設(shè)施監(jiān)控 |
農(nóng)業(yè)與海洋 |
澆水附加肥料,除草和培育作物管理和病蟲害防治,野生動物損害控制,水質(zhì)監(jiān)測管理,飼養(yǎng)和運輸調(diào)整,航運 |
倉儲與物流 |
庫存管理,事故預(yù)防,轉(zhuǎn)運和設(shè)備維護,異常監(jiān)測 |
廣告與營銷 |
客戶響應(yīng)分析,客戶行為分析 |
總結(jié)
UltraLAB GXM是一款靜音級超級異構(gòu)計算能力的深度學(xué)習(xí)訓(xùn)練計算機,比市面上的機器,更安靜,性能更強大,適合科研、研究部門在安靜的辦公環(huán)境下運行。
此外,該機型用途極廣,擴展能力強, 調(diào)整配置后,可為電磁仿真計算(CST)、量子化學(xué)/分子動力學(xué)計算(VASP、AMBER等)、超大屏拼接(8X9=72路視頻拼接合成)、視頻剪輯合成、指紋識別等應(yīng)用,提供強悍的計算、圖形生成能力
方案咨詢
西安坤隆計算機科技有限公司
國內(nèi)知名高端定制圖形工作站廠家
業(yè)務(wù)電話:400-705-6800
微信