電磁仿真(HFSS、CST、FEKO)時域頻域臺式集群配置推薦2018
目錄
1.電磁仿真計算特點與硬件配資分析
2.電磁仿真計算絕配~UltraLAB工作站介紹
3.電磁仿真計算硬件配置(單機與集群)推薦
一.電磁仿真計算特點與硬件配置分析
電磁場仿真軟件廣泛應用于無線和有線通信、計算機、衛(wèi)星、雷達、半導體和微波集成電路、航空航天等領域,從毫米波電路、射頻電路封裝設計驗證,到混合集成電路、PCB板、無源板級器件、RFIC/MMIC設計,天線設計,微波腔體、衰減器、微波轉接頭、波導錄波器等設計等
1.1 電磁仿真算法分類、計算特點
計算電磁學(CEM)方法大致可分為2類:精確算法和高頻近似方法。
(1)全波精確計算法
包括差分法(FDTD,F(xiàn)DFD)、有限元(FEM)、矩量法(MoM)以及基于矩量法的快速算法(如快速多極子FMM和多層快速多極子MLFMA)等,其中,在解決電大目標電磁問題中最有效的方法為多層快速多極子方法。
(2)高頻近似方法
一般可歸作2類:一類基于射線光學,包括幾何光學(GO)、幾何繞射理論(GTD)以及在GTD 基礎上發(fā)展起來的一致性繞射理論(UTD)等;另一類基于波前光學,包括物理光學(PO)、物理繞射理論(PTD)、等效電磁流方法(MEC)以及增量長度繞射系數(shù)法(ILDC)等
算法計算特點匯總如下
NO |
關鍵項 |
時域算法 |
頻域算法 |
||
1 |
主要算法 |
時域有限差分 FDTD |
時域有限積分 FIT |
有限元 FEM |
矩量法 MOM |
2 |
典型軟件 |
EMPIRE XPU XFDTD EMPro |
CST |
HFSS EMPro JMAG FLU |
FEKO Momentum Sonnet |
3 |
計算特點 |
線性加速比高、高度多線程, 支持多核CPU 支持大型GPU 內(nèi)存要求不高 回寫很少 |
多線程,線性加速有限 支持多核CPU并行求解 內(nèi)存要求高 回寫有
|
小結
1.時域算法,屬于顯式算法,傳統(tǒng)的CPU多核加速比好,核數(shù)越多計算越快,此外,并行度高,支持GPU加速計算,注意大部分求解器對GPU要求是雙精度計算為主,也就是說需要用雙精度性能高的GPU卡
2 頻域算法,屬于隱式算法,支持多核并行計算,但核數(shù)并行計算有限,不支持GPU計算,提升性能的手段,就是提升CPU的頻率,足夠大的內(nèi)存,值得注意當內(nèi)存非常大的時候(超過192GB),硬盤io性能非常關鍵
1.2 對并行計算求解過程分析
如何配置CPU要根據(jù)求解過程和算法特點,尤其要了解時域、頻域兩大算法特點緊密結合,這樣才能更高效更合理,從并行求解流程圖看,循環(huán)計算過程是單核和多核交叉過程
上圖可以看出,CPU選型非常重要,CPU睿頻足夠高,大幅縮短【階段1】求解時間,和整機足夠核數(shù)+高頻運行,大幅縮短【階段2】的求解器解算時間
常規(guī)工作站賣家,提供的機器往往多核忽視了睿頻的重要性,整個計算過程效率非常低,
因此 硬件配置注意:
1.如果是時域算法為主,例如 FDTD、FIT求解器,由于并行度高,工作站配置盡量多核,可顯著提升求解速度,同時注意階段1睿頻高的處理器更快,如果是以GPU計算為主,可以配置CPU頻率高,核數(shù)少的,這樣整個過程顯著提升
2.如果是隱式算法為主,例如 FEM,MOM求解器,由于并行度有限,一定要睿頻盡可能高,同時保證足夠的核數(shù)的并行,這樣整個求解過程無死角瓶頸
3.如果是多種算法并用,CPU要足夠核數(shù)與高睿頻之間選擇一個兼顧的規(guī)格,三種應用(時域算法、頻域算法、混合算法)都均能確保工作站硬件計算性能最大化
考慮到上述計算特點,CPU的選擇對整個求解過程極其重要,下面是最新上市的intel Xeon Schalable(可擴展)處理器多種規(guī)格,UltraLAB選型分析:
1.3 CEM求解規(guī)模與硬件配置推薦
a)基于時域算法~UltraLAB硬件配置參考(CPU類)
NO |
分類 |
規(guī)模劃分 |
核數(shù) |
全核頻率 |
睿頻 |
內(nèi)存 |
并行存儲 |
1 |
小規(guī)?!?/span> |
<50倍波長 |
14核 |
4.6GHz |
4.6GHz |
32GB |
|
18核 |
4.5GHz |
4.5GHz |
64GB |
|
|||
2 |
中等規(guī)模 |
50~100倍波長 |
36核 |
3.1GHz |
3.7GHz |
64GB |
|
40核 |
3.1GHz |
3.7GHz |
96GB |
|
|||
3 |
大規(guī)?!?/span> |
100~200倍波長 |
48核 |
3.5GHz |
3.7GHz |
96GB |
|
56核 |
3.3GHz |
3.8GHz |
192GB |
13*4TB |
|||
4 |
超大規(guī)模 |
>200倍波長 |
96核 |
2.8GHz |
3.3GHz |
512GB |
13*4TB |
b)基于頻域算法~UltraLAB硬件配置參考
NO 分類 規(guī)模劃分 核數(shù) 全核頻率 睿頻 內(nèi)存 并行存儲 1 小規(guī)模 <20萬網(wǎng)格(</100萬未知量) 14核 4.6GHz 4.6GHz 128GB 20萬~80萬網(wǎng)格(100~400萬未知量) 18核 4.5GHz 4.5GHz 192GB 2 中等規(guī)模 80萬~200萬網(wǎng)格(400萬~1000萬未知量) 24核 4GHz 4.2GHz 256GB 200萬~500萬網(wǎng)格 36核 3.7GHz 3.7GHz 384GB 8*4TB (1000萬~2500萬未知量) 3 大規(guī)模 500萬~1000萬網(wǎng)格(2500萬~5000萬未知量) 48核 3.5GHz 3.7GHz 768GB 10*4TB 4 超大規(guī)模 1000萬~2000萬網(wǎng)格 (5000萬~1億未知量) 56核 3.3GHz 3.8GHz 1.5TB 13*4TB 5 超大規(guī)模 >2000萬網(wǎng)格(>1億個未知量) 集群18*6 =108 4.4GHz 4.4GHz 192GB 并行存儲
c)基于超大規(guī)模時域算法求解GPU選型
如果以GPU求解為為主,可選的GPU卡參考下表
No 型號 顯存(MB) CUDA核 顯存帶寬 (GBs) 浮點計算指標 TFlops -單精度 浮點計算指標 TFlops -雙精度 散熱 1 Tesla V100 16GB HBM2 5120 900 14.90 7.45 服務器 2 Tesla P100 16GB HBM2 3584 721 9.52 4.76 服務器 3 Tesla P100 12GB HBM2 3584 721 9.52 4.73 服務器 4 Quadro GV100 32GB 5120 870 14.85 7.42 主動式 5 Quadro GP100 16GB HBM2 3584 717 10.25 5.13 主動式 6 Quadro K6000 12GB 2880 288 5.18 1.73 主動式 7 Quadro K5200 8GB 2304 192 3.07 1.03 主動式
#p#page_title#e#
二.基于電磁仿真計算的UltraLAB機型介紹
UltraLAB是西安坤隆計算機科技有限公司推出的定制圖形工作站品牌,經(jīng)過多年發(fā)展,該產(chǎn)品擁有傲視群雄的三大領先優(yōu)勢:先進計算硬件架構、完整齊全行業(yè)應用定制方案、專業(yè)硬件系統(tǒng)優(yōu)化技術,大幅超越同類的“圖形工作站”產(chǎn)品,我們提供基于電磁仿真計算應用最快硬件架構產(chǎn)品系列
2.1 極速圖形工作站H490介紹
配置特點:
(1)CPU具有超高的頻率,中小規(guī)模時域與頻域求解,發(fā)揮極致性能
6核5.0GHz,8~10核4.8GHz,12~14核4.6GHz,16~18核4.4GHz
(2)GPU 支持雙GPU架構超算
顯著優(yōu)勢:
和市場上單路cpu架構的工作站(單Xeon E5v4,單Xeon W-2100系列,單Xeon Schalable系列)相比,擁有超高頻率,在多核并行計算(特別是頻域求解),性能出眾
2.2 高性能計算工作站EX620
配置特點:
CPU 支持雙Xeon Schalable(可擴展)處理器,擁有更高頻率和更低延遲,中大規(guī)模時域與頻域求解,發(fā)揮極致性能
提供規(guī)格:
24核*4GHz/4.2GHz
36核3.7GHz/3.7GHz
40核3.1GHz/3.7GHz
48核*3.5GHz/3.7GHz
56核*3.3GHz/3.8GHz
GPU 支持雙GPU架構超算
顯著優(yōu)勢:
和市場上常規(guī)雙路cpu工作站(雙Xeon E5v4,雙Xeon Schalable系列)相比,擁有更高頻率,多核并行計算(時域、頻域算法),定位精準高效,顯式計算(EX620i)、顯式隱式計算通吃(EX620)
2.3 超大規(guī)模仿真計算機型Alpha720
配置特點:
CPU 支持4顆Xeon E7v4處理器(最高到96核),擁有更高頻率和更低延遲,超大規(guī)模時域算法求解,極致性能
提供規(guī)格:72核2.8GHz,96核2.7GHz
GPU 支持雙GPU架構超算
顯著優(yōu)勢 市面上唯一的最快時域求解(CPU計算架構)工作站,極致性能還靜音
2.4 圖靈超算工作站GX490M或GX620M
GX490M配置特點:
CPU 具有超高的頻率,中小規(guī)模時域與頻域求解,發(fā)揮極致性能
提供規(guī)格:10核4.8GHz,12~14核4.6GHz,16~18核4.4GHz
GPU 支持7塊雙槽GPU卡
GX620M配置特點:
CPU 支持雙Xeon Schalable(可擴展)處理器,擁有更高頻率和更低延遲,中大規(guī)模時域與頻域求解,發(fā)揮極致性能
提供規(guī)格:24核4GHz,36核3.7GHz,40核3.1GHz,48核3.5GHz,56核3.3GHz
GPU 支持9塊雙槽GPU卡
顯著優(yōu)勢 市面上唯一的基于辦公環(huán)境(靜音級)最強大GPU超算性能時域求解計算系統(tǒng),同時兼顧頻域隱式算法極致性能展現(xiàn)
各種機型性能與差異對比表
NO 機型 硬件配置特點 適合應用 1 H490 單CPU+雙GPU (14核4.7GHz,18核4.5GHz) 中小規(guī)模頻域、時域算法求解 2 EX620i 雙CPU(56核)+雙CPU 大規(guī)模時域、頻域算法求解 3 EX620 雙CPU(56核)+雙GPU+并行存儲 大規(guī)模的全能求解 4 GX490M 單CPU+7個GPU+并行存儲 超大規(guī)模時域GPU超級 5 GX620M 雙CPU(56核)+9個GPU+并行存儲(16) 超大規(guī)模全能求解、時域GPU求解 6 Alpha720 四CPU(96核)+雙GPU+并行存儲 超大規(guī)模CPU架構時域求解 No 產(chǎn)品系列 主要配置 價格 備注 1 UltraLAB H490 14632-S5TBA intel第7代至尊處理器(14核4.6GHz+睿頻4.6GHz) /32GB DDR4 2666/512GB SSD +2TBSATA企業(yè)級/QP600 2GB/23"圖顯 39,990 CPU全能高效、高性價比 2 UltraLAB H490 14464-S5TCA intel第7代至尊處理器(18核4.4GHz+睿頻4.5GHz)/64GB DDR4 2666/500GB SSD+4TB SATA企業(yè)級/Quadro K6000 12GB/23"圖顯 72,000 CPU+GPU全能極致高性價比 3 UltraLAB EX620i 24096-SATCB 2*Xeon Gold6146處理器(24核4.0GHz,睿頻4.2GHz) /96GB DDR4 2666/1TB SSD+6TB SATA /QP2000 5GB/23"圖顯 112,000 頻域極致性能 4 UltraLAB EX620i 23196-SATCE 2*Xeon Gold6148處理器(40核3.1GHz+睿頻3.7GHz) /96GB DDR4 2666/1TB SSD +6TB SATA /Quadro K6000 12GB/23"圖顯 126,000 CPU+GPU時域全能求解 5 UltraLAB EX620 237192-SA28TB 2*Xeon Gold6154處理器(36核3.7GHz+睿頻3.7GHz) /192GB DDR4 2666/1TB SSD+28TB并行存儲/QP2000 5GB/23"圖顯 145,000 CPU全能高效 6 UltraLAB EX620 23596-MSATCC 2*Xeon Platinum8168處理器(48核3.5GHz +睿頻3.7GHz) /96GB DDR4 2666 /1TB閃電二代+1TB SSD+6TB SATA/QP4000 8GB /23"圖顯 189,000 時域求解 7 UltraLAB EX620 23596-MSATCC 2*Xeon Platinum8168處理器(48核3.5GHz +睿頻3.7GHz) /192GB DDR4 2666 /2TB SSD +28TB并行存儲/QP4000 8GB /23"圖顯 215,000 CPU全能高效 8 UltraLAB EX620 233384-SB28TC 2*Xeon Platinum 8180(56核3.3GHz+睿頻3.8GHz) /384GB DDR4/2TB SSD +28TB并行存儲/QP4000/23"圖顯 285,000 CPU全能高效 9 UltraLAB Alpha720 427256-SB42TF 4*Xeon E7 8890v4(96核2.7GHz+睿頻3.3GHz)/256GB DDR4/2TB SSD +42TB并行存儲/Quadro GP100/32"-2K圖顯 399,990 超大規(guī)模CPU+GPU時域求解
#p#page_title#e#
三.電磁仿真計算硬件配置(單機與集群)推薦
提供單機CPU、單機GPU、集群架構的全面完整,代表追求目前最快計算架構硬件配置方案
3.1 基于多種算法(CPU計算)單機工作站硬件配置方案
3.2 基于時域求解(GPU計算架構)單機硬件配置方案 No 產(chǎn)品系列 主要配置 價格 GPU指標 1 UltraLAB GX490M 14832-S5TB2E intel第7代至尊處理器 (10核4.8GHz+睿頻4.8GHz) /32GB DDR4 2666/500GB SSD +4TB SATA企業(yè)級 /2*Quadro K6000 12GB/23"圖顯 87,500 3.46Tflops 2 UltraLAB GX490M 14464-S5TC4E intel第7代至尊處理器 (18核4.5GHz+睿頻4.5GHz) /64GB DDR4 2666/500GB SSD+4TB SATA企業(yè)級/4*Quadro K6000 12GB/23"圖顯 159,990 6.92Tflops 3 UltraLAB GX620M 23196-SATD2F 2*Xeon Gold6148處理器 (40核3.1GHz,睿頻3.7GHz) / 96GB DDR4 2666/1TB SSD+6TB SATA / 2*Quadro GP100 16GB HBM2/23"圖顯 228,000 10.2Tflops 4 UltraLAB GX620M 234192-SB28T8E 2*Xeon Platium8168處理器 (48核3.4GHz+睿頻3.7GHz) / 192GB DDR4 2666/ 2TB SSD +28T并行存儲 /8*Quadro K6000 12GB/23"圖顯 365,000 13.8Tflops 5 UltraLAB Alpha720 427256-SB42T2F 4*Xeon E7 8890v4 (96核2.7GHz+睿頻3.3GHz )/ 256GB DDR4/2TB SSD +42TB并行存儲/ 2*Quadro GP100/32"-2K圖顯 399,990 10.2Tflops 6 UltraLAB GX620M 233192-SB28T4F 2*Xeon Platinum 8180 (56核3.3GHz+睿頻3.8GHz) / 192GB DDR4/2TB SSD +28TB并行存儲/ 4*Quadro GP100/32"-2K圖顯 499,990 20.4Tflops 7 UltraLAB GX620M 233384-SB36T8F 2*Xeon Platinum 8180 (56核3.3GHz+睿頻3.8GHz) / 384GB DDR4/2TB SSD +36TB并行存儲/ 8*Quadro GP100/32-2K"圖顯 758,000 40.4Tflops
3.3 基于分布式集群的硬件配置方案 NO 貨物名稱 型號 數(shù)量 單價 小計 1 主計算節(jié)點 18核4.4Ghz/128GB DDR4 2666 /NVS310/500GB SSD工作站級/4U機架式/無顯示器 1 55000 55000 2 從計算節(jié)點 18核4.4Ghz/64GB DDR4 2666 /NVS310/500GB SSD工作站級/4U機架式/無顯示器 5 46500 232500 3 管理/ 存儲節(jié)點 4核4Ghz/32GB DDR4 ECC/集成顯卡/256GB SSD+28TB單通道并行存儲/4U機架式/23"圖顯 1 36500 36500 4 網(wǎng)絡設備 16口萬兆交換機 1 9500 9500 5 機柜 42U服務器機柜(含PDU機柜插座) 1 3500 3500 6 KVM 8口 HDMI KVM切換器 1 2800 2800 7 高速交換機 Mellanox 12口56Gbps交換機 1 39500 39500 8 IB卡 Mellanox IB卡56Gbps,含2米線 7 4500 31500 9 10 11 12 13 累計(人民幣) 410800 安裝調(diào)試費用(累計金額*10%) 41080 合計: ¥451,880
方案1 基于CPU計算的分布式集群方案
方案2 基于CPU+GPU異構超算的分布式集群方案
NO 貨物名稱 型號 數(shù)量 單價 小計 1 主計算節(jié)點 18核4.4Ghz/128GB DDR4 2666 /Quadro K6000/ 500GB SSD工作站級/4U機架式/無顯示器 1 75500 75500 2 從計算節(jié)點 18核4.4Ghz/64GB DDR4 2666 /Quadro K6000/ 500GB SSD工作站級/4U機架式/無顯示器 5 67000 335000 3 管理/存儲節(jié)點 4核4Ghz/32GB DDR4 ECC/集成顯卡/256GB SSD+28TB單通道并行存儲/4U機架式/23"圖顯 1 36500 36500 4 網(wǎng)絡設備 16口萬兆交換機 1 9500 9500 5 機柜 42U服務器機柜(含PDU機柜插座) 1 3500 3500 6 KVM 8口 HDMI KVM切換器 1 2800 2800 7 高速交換機 Mellanox 12口56Gbps交換機 1 39500 39500 8 IB卡 Mellanox IB卡56Gbps,含2米線 7 4500 31500 9 10 11 12 13 累計(人民幣) 533800 安裝調(diào)試費用(累計金額*10%) 53380 合計: ¥587,180
說明:
(1)上述報價僅僅是硬件系統(tǒng),還需要作業(yè)調(diào)度系統(tǒng)及安裝調(diào)試、培訓、維護費用
(2)該集群中,每個計算節(jié)點比市場上低頻雙Xeon架構配置,性能更高,保證循環(huán)過程中,每個環(huán)節(jié)計算性能發(fā)揮到極致
方案咨詢
UltraLAB圖形工作站供貨商:
西安坤隆計算機科技有限公司
國內(nèi)知名高端定制圖形工作站廠家
業(yè)務電話:400-705-6800
咨詢微信號: