電磁仿真(HFSS、CST、FEKO)時(shí)域頻域臺(tái)式集群配置推薦2018
目錄
1.電磁仿真計(jì)算特點(diǎn)與硬件配資分析
2.電磁仿真計(jì)算絕配~UltraLAB工作站介紹
3.電磁仿真計(jì)算硬件配置(單機(jī)與集群)推薦
一.電磁仿真計(jì)算特點(diǎn)與硬件配置分析
電磁場(chǎng)仿真軟件廣泛應(yīng)用于無線和有線通信、計(jì)算機(jī)、衛(wèi)星、雷達(dá)、半導(dǎo)體和微波集成電路、航空航天等領(lǐng)域,從毫米波電路、射頻電路封裝設(shè)計(jì)驗(yàn)證,到混合集成電路、PCB板、無源板級(jí)器件、RFIC/MMIC設(shè)計(jì),天線設(shè)計(jì),微波腔體、衰減器、微波轉(zhuǎn)接頭、波導(dǎo)錄波器等設(shè)計(jì)等
1.1 電磁仿真算法分類、計(jì)算特點(diǎn)
計(jì)算電磁學(xué)(CEM)方法大致可分為2類:精確算法和高頻近似方法。
(1)全波精確計(jì)算法
包括差分法(FDTD,F(xiàn)DFD)、有限元(FEM)、矩量法(MoM)以及基于矩量法的快速算法(如快速多極子FMM和多層快速多極子MLFMA)等,其中,在解決電大目標(biāo)電磁問題中最有效的方法為多層快速多極子方法。
(2)高頻近似方法
一般可歸作2類:一類基于射線光學(xué),包括幾何光學(xué)(GO)、幾何繞射理論(GTD)以及在GTD 基礎(chǔ)上發(fā)展起來的一致性繞射理論(UTD)等;另一類基于波前光學(xué),包括物理光學(xué)(PO)、物理繞射理論(PTD)、等效電磁流方法(MEC)以及增量長(zhǎng)度繞射系數(shù)法(ILDC)等
算法計(jì)算特點(diǎn)匯總?cè)缦?br />
NO |
關(guān)鍵項(xiàng) |
時(shí)域算法 |
頻域算法 |
||
1 |
主要算法 |
時(shí)域有限差分 FDTD |
時(shí)域有限積分 FIT |
有限元 FEM |
矩量法 MOM |
2 |
典型軟件 |
EMPIRE XPU XFDTD EMPro |
CST |
HFSS EMPro JMAG FLU |
FEKO Momentum Sonnet |
3 |
計(jì)算特點(diǎn) |
線性加速比高、高度多線程, 支持多核CPU 支持大型GPU 內(nèi)存要求不高 回寫很少 |
多線程,線性加速有限 支持多核CPU并行求解 內(nèi)存要求高 回寫有
|
小結(jié)
1.時(shí)域算法,屬于顯式算法,傳統(tǒng)的CPU多核加速比好,核數(shù)越多計(jì)算越快,此外,并行度高,支持GPU加速計(jì)算,注意大部分求解器對(duì)GPU要求是雙精度計(jì)算為主,也就是說需要用雙精度性能高的GPU卡
2 頻域算法,屬于隱式算法,支持多核并行計(jì)算,但核數(shù)并行計(jì)算有限,不支持GPU計(jì)算,提升性能的手段,就是提升CPU的頻率,足夠大的內(nèi)存,值得注意當(dāng)內(nèi)存非常大的時(shí)候(超過192GB),硬盤io性能非常關(guān)鍵
1.2 對(duì)并行計(jì)算求解過程分析
如何配置CPU要根據(jù)求解過程和算法特點(diǎn),尤其要了解時(shí)域、頻域兩大算法特點(diǎn)緊密結(jié)合,這樣才能更高效更合理,從并行求解流程圖看,循環(huán)計(jì)算過程是單核和多核交叉過程
上圖可以看出,CPU選型非常重要,CPU睿頻足夠高,大幅縮短【階段1】求解時(shí)間,和整機(jī)足夠核數(shù)+高頻運(yùn)行,大幅縮短【階段2】的求解器解算時(shí)間
常規(guī)工作站賣家,提供的機(jī)器往往多核忽視了睿頻的重要性,整個(gè)計(jì)算過程效率非常低,
因此 硬件配置注意:
1.如果是時(shí)域算法為主,例如 FDTD、FIT求解器,由于并行度高,工作站配置盡量多核,可顯著提升求解速度,同時(shí)注意階段1睿頻高的處理器更快,如果是以GPU計(jì)算為主,可以配置CPU頻率高,核數(shù)少的,這樣整個(gè)過程顯著提升
2.如果是隱式算法為主,例如 FEM,MOM求解器,由于并行度有限,一定要睿頻盡可能高,同時(shí)保證足夠的核數(shù)的并行,這樣整個(gè)求解過程無死角瓶頸
3.如果是多種算法并用,CPU要足夠核數(shù)與高睿頻之間選擇一個(gè)兼顧的規(guī)格,三種應(yīng)用(時(shí)域算法、頻域算法、混合算法)都均能確保工作站硬件計(jì)算性能最大化
考慮到上述計(jì)算特點(diǎn),CPU的選擇對(duì)整個(gè)求解過程極其重要,下面是最新上市的intel Xeon Schalable(可擴(kuò)展)處理器多種規(guī)格,UltraLAB選型分析:
1.3 CEM求解規(guī)模與硬件配置推薦
a)基于時(shí)域算法~UltraLAB硬件配置參考(CPU類)
NO |
分類 |
規(guī)模劃分 |
核數(shù) |
全核頻率 |
睿頻 |
內(nèi)存 |
并行存儲(chǔ) |
1 |
小規(guī)?!?/span> |
<50倍波長(zhǎng) |
14核 |
4.6GHz |
4.6GHz |
32GB |
|
18核 |
4.5GHz |
4.5GHz |
64GB |
|
|||
2 |
中等規(guī)模 |
50~100倍波長(zhǎng) |
36核 |
3.1GHz |
3.7GHz |
64GB |
|
40核 |
3.1GHz |
3.7GHz |
96GB |
|
|||
3 |
大規(guī)?!?/span> |
100~200倍波長(zhǎng) |
48核 |
3.5GHz |
3.7GHz |
96GB |
|
56核 |
3.3GHz |
3.8GHz |
192GB |
13*4TB |
|||
4 |
超大規(guī)模 |
>200倍波長(zhǎng) |
96核 |
2.8GHz |
3.3GHz |
512GB |
13*4TB |
b)基于頻域算法~UltraLAB硬件配置參考
NO 分類 規(guī)模劃分 核數(shù) 全核頻率 睿頻 內(nèi)存 并行存儲(chǔ) 1 小規(guī)模 <20萬網(wǎng)格(</100萬未知量) 14核 4.6GHz 4.6GHz 128GB 20萬~80萬網(wǎng)格(100~400萬未知量) 18核 4.5GHz 4.5GHz 192GB 2 中等規(guī)模 80萬~200萬網(wǎng)格(400萬~1000萬未知量) 24核 4GHz 4.2GHz 256GB 200萬~500萬網(wǎng)格 36核 3.7GHz 3.7GHz 384GB 8*4TB (1000萬~2500萬未知量) 3 大規(guī)模 500萬~1000萬網(wǎng)格(2500萬~5000萬未知量) 48核 3.5GHz 3.7GHz 768GB 10*4TB 4 超大規(guī)模 1000萬~2000萬網(wǎng)格 (5000萬~1億未知量) 56核 3.3GHz 3.8GHz 1.5TB 13*4TB 5 超大規(guī)模 >2000萬網(wǎng)格(>1億個(gè)未知量) 集群18*6 =108 4.4GHz 4.4GHz 192GB 并行存儲(chǔ)
c)基于超大規(guī)模時(shí)域算法求解GPU選型
如果以GPU求解為為主,可選的GPU卡參考下表
No 型號(hào) 顯存(MB) CUDA核 顯存帶寬 (GBs) 浮點(diǎn)計(jì)算指標(biāo) TFlops -單精度 浮點(diǎn)計(jì)算指標(biāo) TFlops -雙精度 散熱 1 Tesla V100 16GB HBM2 5120 900 14.90 7.45 服務(wù)器 2 Tesla P100 16GB HBM2 3584 721 9.52 4.76 服務(wù)器 3 Tesla P100 12GB HBM2 3584 721 9.52 4.73 服務(wù)器 4 Quadro GV100 32GB 5120 870 14.85 7.42 主動(dòng)式 5 Quadro GP100 16GB HBM2 3584 717 10.25 5.13 主動(dòng)式 6 Quadro K6000 12GB 2880 288 5.18 1.73 主動(dòng)式 7 Quadro K5200 8GB 2304 192 3.07 1.03 主動(dòng)式
#p#page_title#e#
二.基于電磁仿真計(jì)算的UltraLAB機(jī)型介紹
UltraLAB是西安坤隆計(jì)算機(jī)科技有限公司推出的定制圖形工作站品牌,經(jīng)過多年發(fā)展,該產(chǎn)品擁有傲視群雄的三大領(lǐng)先優(yōu)勢(shì):先進(jìn)計(jì)算硬件架構(gòu)、完整齊全行業(yè)應(yīng)用定制方案、專業(yè)硬件系統(tǒng)優(yōu)化技術(shù),大幅超越同類的“圖形工作站”產(chǎn)品,我們提供基于電磁仿真計(jì)算應(yīng)用最快硬件架構(gòu)產(chǎn)品系列
2.1 極速圖形工作站H490介紹
配置特點(diǎn):
(1)CPU具有超高的頻率,中小規(guī)模時(shí)域與頻域求解,發(fā)揮極致性能
6核5.0GHz,8~10核4.8GHz,12~14核4.6GHz,16~18核4.4GHz
(2)GPU 支持雙GPU架構(gòu)超算
顯著優(yōu)勢(shì):
和市場(chǎng)上單路cpu架構(gòu)的工作站(單Xeon E5v4,單Xeon W-2100系列,單Xeon Schalable系列)相比,擁有超高頻率,在多核并行計(jì)算(特別是頻域求解),性能出眾
2.2 高性能計(jì)算工作站EX620
配置特點(diǎn):
CPU 支持雙Xeon Schalable(可擴(kuò)展)處理器,擁有更高頻率和更低延遲,中大規(guī)模時(shí)域與頻域求解,發(fā)揮極致性能
提供規(guī)格:
24核*4GHz/4.2GHz
36核3.7GHz/3.7GHz
40核3.1GHz/3.7GHz
48核*3.5GHz/3.7GHz
56核*3.3GHz/3.8GHz
GPU 支持雙GPU架構(gòu)超算
顯著優(yōu)勢(shì):
和市場(chǎng)上常規(guī)雙路cpu工作站(雙Xeon E5v4,雙Xeon Schalable系列)相比,擁有更高頻率,多核并行計(jì)算(時(shí)域、頻域算法),定位精準(zhǔn)高效,顯式計(jì)算(EX620i)、顯式隱式計(jì)算通吃(EX620)
2.3 超大規(guī)模仿真計(jì)算機(jī)型Alpha720
配置特點(diǎn):
CPU 支持4顆Xeon E7v4處理器(最高到96核),擁有更高頻率和更低延遲,超大規(guī)模時(shí)域算法求解,極致性能
提供規(guī)格:72核2.8GHz,96核2.7GHz
GPU 支持雙GPU架構(gòu)超算
顯著優(yōu)勢(shì) 市面上唯一的最快時(shí)域求解(CPU計(jì)算架構(gòu))工作站,極致性能還靜音
2.4 圖靈超算工作站GX490M或GX620M
GX490M配置特點(diǎn):
CPU 具有超高的頻率,中小規(guī)模時(shí)域與頻域求解,發(fā)揮極致性能
提供規(guī)格:10核4.8GHz,12~14核4.6GHz,16~18核4.4GHz
GPU 支持7塊雙槽GPU卡
GX620M配置特點(diǎn):
CPU 支持雙Xeon Schalable(可擴(kuò)展)處理器,擁有更高頻率和更低延遲,中大規(guī)模時(shí)域與頻域求解,發(fā)揮極致性能
提供規(guī)格:24核4GHz,36核3.7GHz,40核3.1GHz,48核3.5GHz,56核3.3GHz
GPU 支持9塊雙槽GPU卡
顯著優(yōu)勢(shì) 市面上唯一的基于辦公環(huán)境(靜音級(jí))最強(qiáng)大GPU超算性能時(shí)域求解計(jì)算系統(tǒng),同時(shí)兼顧頻域隱式算法極致性能展現(xiàn)
各種機(jī)型性能與差異對(duì)比表
NO 機(jī)型 硬件配置特點(diǎn) 適合應(yīng)用 1 H490 單CPU+雙GPU (14核4.7GHz,18核4.5GHz) 中小規(guī)模頻域、時(shí)域算法求解 2 EX620i 雙CPU(56核)+雙CPU 大規(guī)模時(shí)域、頻域算法求解 3 EX620 雙CPU(56核)+雙GPU+并行存儲(chǔ) 大規(guī)模的全能求解 4 GX490M 單CPU+7個(gè)GPU+并行存儲(chǔ) 超大規(guī)模時(shí)域GPU超級(jí) 5 GX620M 雙CPU(56核)+9個(gè)GPU+并行存儲(chǔ)(16) 超大規(guī)模全能求解、時(shí)域GPU求解 6 Alpha720 四CPU(96核)+雙GPU+并行存儲(chǔ) 超大規(guī)模CPU架構(gòu)時(shí)域求解 No 產(chǎn)品系列 主要配置 價(jià)格 備注 1 UltraLAB H490 14632-S5TBA intel第7代至尊處理器(14核4.6GHz+睿頻4.6GHz) /32GB DDR4 2666/512GB SSD +2TBSATA企業(yè)級(jí)/QP600 2GB/23"圖顯 39,990 CPU全能高效、高性價(jià)比 2 UltraLAB H490 14464-S5TCA intel第7代至尊處理器(18核4.4GHz+睿頻4.5GHz)/64GB DDR4 2666/500GB SSD+4TB SATA企業(yè)級(jí)/Quadro K6000 12GB/23"圖顯 72,000 CPU+GPU全能極致高性價(jià)比 3 UltraLAB EX620i 24096-SATCB 2*Xeon Gold6146處理器(24核4.0GHz,睿頻4.2GHz) /96GB DDR4 2666/1TB SSD+6TB SATA /QP2000 5GB/23"圖顯 112,000 頻域極致性能 4 UltraLAB EX620i 23196-SATCE 2*Xeon Gold6148處理器(40核3.1GHz+睿頻3.7GHz) /96GB DDR4 2666/1TB SSD +6TB SATA /Quadro K6000 12GB/23"圖顯 126,000 CPU+GPU時(shí)域全能求解 5 UltraLAB EX620 237192-SA28TB 2*Xeon Gold6154處理器(36核3.7GHz+睿頻3.7GHz) /192GB DDR4 2666/1TB SSD+28TB并行存儲(chǔ)/QP2000 5GB/23"圖顯 145,000 CPU全能高效 6 UltraLAB EX620 23596-MSATCC 2*Xeon Platinum8168處理器(48核3.5GHz +睿頻3.7GHz) /96GB DDR4 2666 /1TB閃電二代+1TB SSD+6TB SATA/QP4000 8GB /23"圖顯 189,000 時(shí)域求解 7 UltraLAB EX620 23596-MSATCC 2*Xeon Platinum8168處理器(48核3.5GHz +睿頻3.7GHz) /192GB DDR4 2666 /2TB SSD +28TB并行存儲(chǔ)/QP4000 8GB /23"圖顯 215,000 CPU全能高效 8 UltraLAB EX620 233384-SB28TC 2*Xeon Platinum 8180(56核3.3GHz+睿頻3.8GHz) /384GB DDR4/2TB SSD +28TB并行存儲(chǔ)/QP4000/23"圖顯 285,000 CPU全能高效 9 UltraLAB Alpha720 427256-SB42TF 4*Xeon E7 8890v4(96核2.7GHz+睿頻3.3GHz)/256GB DDR4/2TB SSD +42TB并行存儲(chǔ)/Quadro GP100/32"-2K圖顯 399,990 超大規(guī)模CPU+GPU時(shí)域求解
#p#page_title#e#
三.電磁仿真計(jì)算硬件配置(單機(jī)與集群)推薦
提供單機(jī)CPU、單機(jī)GPU、集群架構(gòu)的全面完整,代表追求目前最快計(jì)算架構(gòu)硬件配置方案
3.1 基于多種算法(CPU計(jì)算)單機(jī)工作站硬件配置方案
3.2 基于時(shí)域求解(GPU計(jì)算架構(gòu))單機(jī)硬件配置方案 No 產(chǎn)品系列 主要配置 價(jià)格 GPU指標(biāo) 1 UltraLAB GX490M 14832-S5TB2E intel第7代至尊處理器 (10核4.8GHz+睿頻4.8GHz) /32GB DDR4 2666/500GB SSD +4TB SATA企業(yè)級(jí) /2*Quadro K6000 12GB/23"圖顯 87,500 3.46Tflops 2 UltraLAB GX490M 14464-S5TC4E intel第7代至尊處理器 (18核4.5GHz+睿頻4.5GHz) /64GB DDR4 2666/500GB SSD+4TB SATA企業(yè)級(jí)/4*Quadro K6000 12GB/23"圖顯 159,990 6.92Tflops 3 UltraLAB GX620M 23196-SATD2F 2*Xeon Gold6148處理器 (40核3.1GHz,睿頻3.7GHz) / 96GB DDR4 2666/1TB SSD+6TB SATA / 2*Quadro GP100 16GB HBM2/23"圖顯 228,000 10.2Tflops 4 UltraLAB GX620M 234192-SB28T8E 2*Xeon Platium8168處理器 (48核3.4GHz+睿頻3.7GHz) / 192GB DDR4 2666/ 2TB SSD +28T并行存儲(chǔ) /8*Quadro K6000 12GB/23"圖顯 365,000 13.8Tflops 5 UltraLAB Alpha720 427256-SB42T2F 4*Xeon E7 8890v4 (96核2.7GHz+睿頻3.3GHz )/ 256GB DDR4/2TB SSD +42TB并行存儲(chǔ)/ 2*Quadro GP100/32"-2K圖顯 399,990 10.2Tflops 6 UltraLAB GX620M 233192-SB28T4F 2*Xeon Platinum 8180 (56核3.3GHz+睿頻3.8GHz) / 192GB DDR4/2TB SSD +28TB并行存儲(chǔ)/ 4*Quadro GP100/32"-2K圖顯 499,990 20.4Tflops 7 UltraLAB GX620M 233384-SB36T8F 2*Xeon Platinum 8180 (56核3.3GHz+睿頻3.8GHz) / 384GB DDR4/2TB SSD +36TB并行存儲(chǔ)/ 8*Quadro GP100/32-2K"圖顯 758,000 40.4Tflops
3.3 基于分布式集群的硬件配置方案 NO 貨物名稱 型號(hào) 數(shù)量 單價(jià) 小計(jì) 1 主計(jì)算節(jié)點(diǎn) 18核4.4Ghz/128GB DDR4 2666 /NVS310/500GB SSD工作站級(jí)/4U機(jī)架式/無顯示器 1 55000 55000 2 從計(jì)算節(jié)點(diǎn) 18核4.4Ghz/64GB DDR4 2666 /NVS310/500GB SSD工作站級(jí)/4U機(jī)架式/無顯示器 5 46500 232500 3 管理/ 存儲(chǔ)節(jié)點(diǎn) 4核4Ghz/32GB DDR4 ECC/集成顯卡/256GB SSD+28TB單通道并行存儲(chǔ)/4U機(jī)架式/23"圖顯 1 36500 36500 4 網(wǎng)絡(luò)設(shè)備 16口萬兆交換機(jī) 1 9500 9500 5 機(jī)柜 42U服務(wù)器機(jī)柜(含PDU機(jī)柜插座) 1 3500 3500 6 KVM 8口 HDMI KVM切換器 1 2800 2800 7 高速交換機(jī) Mellanox 12口56Gbps交換機(jī) 1 39500 39500 8 IB卡 Mellanox IB卡56Gbps,含2米線 7 4500 31500 9 10 11 12 13 累計(jì)(人民幣) 410800 安裝調(diào)試費(fèi)用(累計(jì)金額*10%) 41080 合計(jì): ¥451,880
方案1 基于CPU計(jì)算的分布式集群方案
方案2 基于CPU+GPU異構(gòu)超算的分布式集群方案
NO 貨物名稱 型號(hào) 數(shù)量 單價(jià) 小計(jì) 1 主計(jì)算節(jié)點(diǎn) 18核4.4Ghz/128GB DDR4 2666 /Quadro K6000/ 500GB SSD工作站級(jí)/4U機(jī)架式/無顯示器 1 75500 75500 2 從計(jì)算節(jié)點(diǎn) 18核4.4Ghz/64GB DDR4 2666 /Quadro K6000/ 500GB SSD工作站級(jí)/4U機(jī)架式/無顯示器 5 67000 335000 3 管理/存儲(chǔ)節(jié)點(diǎn) 4核4Ghz/32GB DDR4 ECC/集成顯卡/256GB SSD+28TB單通道并行存儲(chǔ)/4U機(jī)架式/23"圖顯 1 36500 36500 4 網(wǎng)絡(luò)設(shè)備 16口萬兆交換機(jī) 1 9500 9500 5 機(jī)柜 42U服務(wù)器機(jī)柜(含PDU機(jī)柜插座) 1 3500 3500 6 KVM 8口 HDMI KVM切換器 1 2800 2800 7 高速交換機(jī) Mellanox 12口56Gbps交換機(jī) 1 39500 39500 8 IB卡 Mellanox IB卡56Gbps,含2米線 7 4500 31500 9 10 11 12 13 累計(jì)(人民幣) 533800 安裝調(diào)試費(fèi)用(累計(jì)金額*10%) 53380 合計(jì): ¥587,180
說明:
(1)上述報(bào)價(jià)僅僅是硬件系統(tǒng),還需要作業(yè)調(diào)度系統(tǒng)及安裝調(diào)試、培訓(xùn)、維護(hù)費(fèi)用
(2)該集群中,每個(gè)計(jì)算節(jié)點(diǎn)比市場(chǎng)上低頻雙Xeon架構(gòu)配置,性能更高,保證循環(huán)過程中,每個(gè)環(huán)節(jié)計(jì)算性能發(fā)揮到極致
方案咨詢
UltraLAB圖形工作站供貨商:
西安坤隆計(jì)算機(jī)科技有限公司
國(guó)內(nèi)知名高端定制圖形工作站廠家
業(yè)務(wù)電話:400-705-6800
咨詢微信號(hào):