研究室的微軟高性能計(jì)算系統(tǒng)解決方案
集成MPI及集群管理系統(tǒng) 并內(nèi)含InfiniBand或Myrient驅(qū)動(dòng)程序
高性能計(jì)算廣泛應(yīng)用于網(wǎng)格運(yùn)算、工程運(yùn)算、科學(xué)運(yùn)算、IC設(shè)計(jì)、汽車碰撞模擬,以及財(cái)務(wù)風(fēng)險(xiǎn)控管等;回顧歷史,只要提及HPC,用戶腦海中立即浮現(xiàn)的首選平臺(tái),非Linux莫屬,其次才是Unix,至于微軟的Windows操作系統(tǒng),卻始終未能在此一市場(chǎng)成氣候。究其主因,乃在于現(xiàn)今HPC所采用之并行程序,絕大多數(shù)皆由FORTRAN、C或C++等程序編寫而成,僅能在Unix或 Linux環(huán)境執(zhí)行所致
隨著四核處理器性能不斷提升、同時(shí)價(jià)格下調(diào),并行計(jì)算的整體成本大幅降低,微軟推出的并行計(jì)算Windows Compute Cluster Server 2003,將給HPC市場(chǎng)帶來低成本高效率。該操作系統(tǒng)最大優(yōu)勢(shì),即配備了MPI、作業(yè)調(diào)度器與資源管理功能,已將HPC所需套件全部囊括在內(nèi)。
傳統(tǒng)linux的HPC環(huán)境,無異像一個(gè)深不可測(cè)的科技黑匣子,每個(gè)環(huán)節(jié)之間,都是不易跨越的鴻溝;舉個(gè)最簡(jiǎn)單的例子,程序開發(fā)者或IT人員,通常很難參透專業(yè)研究員或科學(xué)家的邏輯思維,故甚難編寫出精確符合研究計(jì)劃的應(yīng)用程序,且IT人員也不知從何管理或設(shè)定諸如消息傳遞接口(MPI)、Private Network或Public Network等細(xì)節(jié),導(dǎo)致研究員或科學(xué)家必須自己動(dòng)手,嘗試搞懂MPI函數(shù)庫、程序開發(fā)語言,自行跳下來編程、管理和維護(hù)。
因此,微軟遂以Windows Server 2003操作系統(tǒng)為核心,繼而加入了諸如MPI、作業(yè)調(diào)度程序、集群計(jì)算工作管理員等重要HPC的套件,孕育出Windows Compute Cluster Server 2003(以下簡(jiǎn)稱WCCS 2003)這個(gè)專為HPC量身訂做的操作系統(tǒng),同時(shí)搭配了包括Active Directory、MOM、Visual Studio等已為市場(chǎng)熟知的技術(shù),讓HPC應(yīng)用不管在于并行計(jì)算程序開發(fā)、調(diào)試,乃至于集群計(jì)算環(huán)境的監(jiān)控、管理、部署、設(shè)定及安全防護(hù)等環(huán)節(jié),都不再像從前那般艱深困難。

微軟Windows Compute Cluster Server2003操作系統(tǒng)說明
品名
|
微軟Windows Compute Cluster Server2003
|
CPU要求
|
64位,intel Pentium或Xeon系列的EM64T處理器,或AMD Opteron、Athlon等系列處理器,支持四路處理器
|
內(nèi)存
|
最小512MB,最大32GB
|
安裝硬盤空間
|
4GB
|
硬盤空間
|
主節(jié)點(diǎn)需要最少2個(gè)硬盤空間(C: 和D:),節(jié)點(diǎn)需要至少2塊網(wǎng)卡,以建立公用和私人網(wǎng)絡(luò),視所選擇的網(wǎng)絡(luò)拓?fù)涠?,各?jié)點(diǎn)可能需要額外NIC,以存取公用網(wǎng)絡(luò)或支持MPI網(wǎng)絡(luò)
|
■提供RIS自動(dòng)部署工具 并藉由AD整合既有IT架構(gòu)
WCCS 2003提供了1項(xiàng)名為Remote Installation Services(簡(jiǎn)稱RIS)的工具,其就如同安裝精靈一般,旨在簡(jiǎn)化計(jì)算節(jié)點(diǎn)的安裝作業(yè)。具體而言,WCCS 2003用戶于完成主節(jié)點(diǎn)的安裝程序后,便可透過RIS工具的協(xié)助,從而以最快的效率,自動(dòng)于遠(yuǎn)程完成其它節(jié)點(diǎn)的部署、安裝等程序。
不過,雖有RIS工具可供自動(dòng)部署,然用戶仍可選擇以手動(dòng)方式完成部署工作,或是采用非微軟的部署工具。
此外,WCCS 2003內(nèi)含Microsoft Management Console(MMC)管理控制,透過此一GUI主控臺(tái),管理者便可快速且輕易地設(shè)定MPI、網(wǎng)絡(luò)(含Private Network與Public Network),同時(shí)可進(jìn)一步利用節(jié)點(diǎn)管理機(jī)制,隨時(shí)監(jiān)控各個(gè)遠(yuǎn)程運(yùn)算節(jié)點(diǎn)的主機(jī)健康狀態(tài),掌握諸如CPU、內(nèi)存、硬盤、供電系統(tǒng)或散熱風(fēng)扇等組件之實(shí)時(shí)信息。 #p#page_title#e#
值得一提的,MMC經(jīng)由與Active Directory之整合,便能讓W(xué)CCS 2003融合客戶端權(quán)限控管、賬號(hào)管理等既有IT基礎(chǔ)架構(gòu),從而精準(zhǔn)定義管理者及使用者的權(quán)限,進(jìn)行以角色為基礎(chǔ)的安全性叢集管理,致使所有的程序,都能夠在提交使用者的環(huán)境與憑證下運(yùn)行。
■支持Visual Studio開發(fā)環(huán)境 降低HPC程序編譯與調(diào)試之復(fù)雜度
WCCS 2003的一大特色,便是讓開發(fā)人員能夠以其所嫻熟的基于Windows技巧與經(jīng)驗(yàn),運(yùn)用業(yè)界普及率頗高的Visual Studio整合開發(fā)平臺(tái)(Integrated Development Platform;IDE),展現(xiàn)前所未見的程序開發(fā)效率。
據(jù)悉,Visual Studio 2005業(yè)已支持HPC應(yīng)用程序開發(fā)中,所亟需之并行編譯和調(diào)試能力;而綜觀當(dāng)前HPC應(yīng)用的主流操作平臺(tái)-Linux,則并未整合類似的開發(fā)環(huán)境,故用戶必須參透諸如FORTRAN、C或C++等不同函數(shù)庫,且需因應(yīng)Linux操作系統(tǒng)版本之歧異,蓄積不同的維護(hù)或管理技巧,而相關(guān)人才的取得,亦有相當(dāng)程度的困擾,相形之下,WCCS 2003可謂占盡上風(fēng)。
■集成消息傳遞接口MPI 同時(shí)內(nèi)建作業(yè)調(diào)度器
較諸Linux操作系統(tǒng),WCCS 2003最顯著的競(jìng)爭(zhēng)優(yōu)勢(shì),便在于內(nèi)建了MPI信息傳遞接口、作業(yè)調(diào)度器;至于Linux用戶,還需透過第三方供貨商所提供之MPI或編程工具,在可用度方面,難免存有若干風(fēng)險(xiǎn)。
微軟所提供的MPI,系依循MPI2、WinSock Direct等業(yè)界標(biāo)準(zhǔn)協(xié)議,旨在為不同的計(jì)算節(jié)點(diǎn)之間,在兼顧性能及CPU資源利用率的前提下,建立彼此溝通、傳送、同步更新信息之管道,對(duì)于大多數(shù)分布式運(yùn)算程序的執(zhí)行,皆屬至為關(guān)鍵。WCCS 2003除支持以太網(wǎng)絡(luò)連結(jié)外,也可藉由制造商所提供的WinSock Direct驅(qū)動(dòng)程序,繼而支持InfiniBand或Myrient高速網(wǎng)絡(luò),輔以內(nèi)建Remote Direct Menory Access功能,達(dá)到降低延遲的效果。
另外,WCCS 2003本身也內(nèi)建了1個(gè)命令列作業(yè)調(diào)度器與集群計(jì)算作業(yè)管理器(Compute Cluster Job Manager),允許使用者得以傳統(tǒng)命令行(Command Line)方式進(jìn)行操作;此一作業(yè)調(diào)度器,提供了1個(gè)Win32使用者接口,據(jù)以建立、提交與監(jiān)控集群節(jié)點(diǎn)的任務(wù)。據(jù)了解,此一命令列接口(Command-Line Interface;CLI)的支持范圍,橫跨Perl、FORTRAN、C/C++、C#與Java,論及作業(yè)調(diào)度器的功能,亦含故障監(jiān)測(cè)、自動(dòng)清除與安全防護(hù)等任務(wù)。
▲Windows Compute Cluster Server 2003內(nèi)建命令列作業(yè)調(diào)度器與集群計(jì)算作業(yè)調(diào)度器。
▲透過GUI畫面,WCCS 2003用戶可快速且輕易地行網(wǎng)絡(luò)拓?fù)湓O(shè)定。
▲WCCS 2003提供了節(jié)點(diǎn)管理和監(jiān)控機(jī)制。
電話:010-62680056,13391900608