Fermi不僅是GPU 十問(wèn)NVIDIA首席科學(xué)家
2009年9月30日至10月2日,NVIDIA公司在美國(guó)加州圣何塞市舉辦GPU技術(shù)大會(huì)(GPU Technology Conference,GTC)并首次公開(kāi)了其新一代GPU——Fermi架構(gòu)。2009年10月27日上午,帶著對(duì)Fermi架構(gòu)的種種問(wèn)題,我們對(duì)來(lái)京參加CUDA卓越中心授權(quán)儀式等一系列活動(dòng)的NVIDIA公司首席科學(xué)家Bill Dally先生進(jìn)行了專(zhuān)訪(fǎng)。值得一提的是,我們是對(duì)Bill Dally先生進(jìn)行一對(duì)一專(zhuān)訪(fǎng)的僅有的兩家國(guó)內(nèi)IT媒體之一。
Tesla(特斯拉)是NVIDIA公司高性能計(jì)算產(chǎn)品的統(tǒng)稱(chēng),這個(gè)源自著名物理學(xué)家Nikola Tesla(尼古拉·特斯拉)姓氏的稱(chēng)呼其實(shí)也是我們熟悉的G80/GT200架構(gòu)的名字,而新一代GPU架構(gòu)Fermi(費(fèi)米)實(shí)際上也是采用一位著名物理學(xué)家Enrico Fermi(恩里科·費(fèi)米)的姓氏命名的,要知道Enrico Fermi負(fù)責(zé)設(shè)計(jì)建造了人類(lèi)歷史上公認(rèn)的第一個(gè)核反應(yīng)堆,以此給新架構(gòu)命名,看來(lái)NVIDIA公司也要在視覺(jué)計(jì)算領(lǐng)域發(fā)動(dòng)一場(chǎng)“核裂變”了。
關(guān)于Fermi在高性能計(jì)算市場(chǎng)的問(wèn)題
問(wèn):對(duì)于高性能計(jì)算用戶(hù)來(lái)說(shuō),F(xiàn)ermi架構(gòu)能給他們帶來(lái)哪些好處?如何去幫到他們?
Bill Dally答:首先,優(yōu)化的雙精度浮點(diǎn)運(yùn)算可以直接提升GPU的計(jì)算能力;其次,ECC容錯(cuò)技術(shù)更加適用于數(shù)據(jù)中心的應(yīng)用;另外,很多并行計(jì)算都需要GPU片載內(nèi)存以外的緩存結(jié)構(gòu)來(lái)提供協(xié)作。
問(wèn):數(shù)十倍甚至是數(shù)百倍效能的提升確實(shí)能把高性能計(jì)算用戶(hù)吸引到GPU平臺(tái)上,不過(guò)CPU也是在進(jìn)步的。關(guān)鍵在于應(yīng)用GPU平臺(tái)需要你們(NVIDIA)更多的介入,客戶(hù)方面缺少相關(guān)人才,您對(duì)此如何評(píng)價(jià)?
Bill Dally答:關(guān)于GPU和CPU的問(wèn)題,我想說(shuō)CPU所增加的線(xiàn)程數(shù)量在并行計(jì)算面前也是捉襟見(jiàn)肘的,而Fermi就不一樣了,它有512個(gè)核心。關(guān)于應(yīng)用人才的問(wèn)題,我們也正在通過(guò)諸多途徑讓更多人使用CUDA工具進(jìn)行編程,比如在大學(xué)里開(kāi)設(shè)CUDA的相關(guān)課程。
問(wèn):我們認(rèn)為CPU和GPU之間的競(jìng)爭(zhēng)不僅僅是兩種技術(shù)架構(gòu)的競(jìng)爭(zhēng),也不僅僅是NVIDIA、AMD以及Intel這三家公司之間的競(jìng)爭(zhēng),而是代表了兩條產(chǎn)業(yè)鏈之間的競(jìng)爭(zhēng)。雖然在GPU產(chǎn)業(yè)鏈上NVIDIA和諸多軟硬件廠商都有合作,但是CPU產(chǎn)業(yè)鏈也已經(jīng)高度成熟,您對(duì)此有何看法?
Bill Dally答:我并不否認(rèn)CPU產(chǎn)業(yè)鏈?zhǔn)且墒煲恍┑模贿^(guò)我對(duì)GPU產(chǎn)業(yè)鏈的發(fā)展同樣持樂(lè)觀態(tài)度。對(duì)于串行計(jì)算的CPU來(lái)說(shuō),核心數(shù)量的增加和運(yùn)算能力的提升遠(yuǎn)不如并行計(jì)算的GPU來(lái)的容易,加之像是Adobe這樣的軟件領(lǐng)導(dǎo)廠商也已經(jīng)采用CUDA,GPU的競(jìng)爭(zhēng)優(yōu)勢(shì)就更大了。
問(wèn):沒(méi)有人會(huì)否認(rèn)NVIDIA在GPU并行計(jì)算方面的領(lǐng)導(dǎo)地位。當(dāng)然,我們也不能忽視ATI的流處理技術(shù),畢竟推動(dòng)這個(gè)技術(shù)發(fā)展還是需要整個(gè)行業(yè)來(lái)支持,您對(duì)此有何看法?
Bill Dally答:NVIDIA之所以在并行計(jì)算方面走在前面,是因?yàn)槲覀冊(cè)谶@里投入了大量的資金來(lái)做研發(fā),無(wú)論是在硬件方面還是在軟件方面。當(dāng)然,要推動(dòng)整個(gè)并行計(jì)算發(fā)展,還是要有一個(gè)標(biāo)準(zhǔn)和第三方軟件開(kāi)發(fā)商的支持。 #p#page_title#e#
問(wèn):GPU并行計(jì)算目前在中國(guó)還算是“新生事物”,相對(duì)集中在一些科研院所和高等院校的項(xiàng)目上,而在實(shí)際生產(chǎn)生活中商業(yè)化、市場(chǎng)化的案例并不算多,吉星吉達(dá)公司在石油領(lǐng)域的案例算是一個(gè)代表,您能不能向我們介紹一下GPU并行計(jì)算在歐美國(guó)家的普及情況?
Bill Dally答:我比較同意GPU并行計(jì)算在中國(guó)處于初級(jí)階段的說(shuō)法,不過(guò)在石油、天然氣、水利等能源行業(yè)的應(yīng)用算是開(kāi)了個(gè)好頭。在美國(guó),很多金融企業(yè)以及汽車(chē)廠商都會(huì)采用GPU并行計(jì)算來(lái)做數(shù)據(jù)分析和設(shè)計(jì)工作。而個(gè)人用戶(hù)也會(huì)用它來(lái)做視頻的剪輯、編解碼等等。相信隨著GPU并行計(jì)算技術(shù)越來(lái)越成熟,相關(guān)的應(yīng)用也會(huì)覆蓋到更多的領(lǐng)域上。
問(wèn):Fermi架構(gòu)更多的考慮了GPU在并行計(jì)算上的設(shè)計(jì),它已經(jīng)不再是圖形處理器那么簡(jiǎn)單。那么,F(xiàn)ermi架構(gòu)在NVIDIA公司GPU的發(fā)展歷史上甚至說(shuō)整個(gè)計(jì)算機(jī)行業(yè)的發(fā)展歷史上又會(huì)處于一個(gè)什么樣的位置呢?
Bill Dally答:我想說(shuō)Fermi架構(gòu)是一款達(dá)到了我們預(yù)期的產(chǎn)品。當(dāng)然,它也不可能是完美的,它同樣還有進(jìn)步的空間。不過(guò)就現(xiàn)在看來(lái),無(wú)論是在圖形處理還是在并行計(jì)算上,F(xiàn)ermi架構(gòu)都可以讓高性能計(jì)算和個(gè)人用戶(hù)的工作變得更高效。
關(guān)于Fermi在個(gè)人消費(fèi)類(lèi)市場(chǎng)的問(wèn)題
問(wèn):現(xiàn)在CPU制程和架構(gòu)隔年就會(huì)更新一次,那么GPU會(huì)不會(huì)也遵循這樣的規(guī)律?
Bill Dally答:其實(shí)GPU的每一次更新?lián)Q代都可以帶來(lái)50%左右的效能提升,像是Fermi架構(gòu)甚至可以達(dá)到70%,而CPU每一顆核心的效能提升幅度也就是在10%左右。更重要的是,GPU是并行處理器,是傳統(tǒng)的串行處理器(CPU)所無(wú)法取代的。
問(wèn):和把大部分晶體管都用在緩存上的CPU不同,GPU主要還是以邏輯電路為主,這勢(shì)必會(huì)造成對(duì)芯片制程和晶體管數(shù)量的依賴(lài),我們的問(wèn)題是Fermi架構(gòu)在實(shí)現(xiàn)性能突破的同時(shí),在功耗方面又會(huì)有怎樣的表現(xiàn)?
Bill Dally答:雖然Fermi架構(gòu)512顆的核心比上一代產(chǎn)品多出了很多,不過(guò)實(shí)際上兩者的功耗是差不多的。再退一步講,在單位功耗上,GPU的計(jì)算能力要遠(yuǎn)比CPU大的多,或者說(shuō)要完成同樣的計(jì)算量,GPU的功耗也要低很多,因?yàn)樗遣⑿械摹N覀冇幸恍┖芎玫募夹g(shù)來(lái)控制功耗,因此并不需要擔(dān)心這些。
問(wèn):從以前的PCIe 1.0,到現(xiàn)在的PCIe 2.0,再到以后的PCIe 3.0,GPU一直都是通過(guò)PCIe總線(xiàn)來(lái)運(yùn)作的,那么什么時(shí)候會(huì)出現(xiàn)新的界面來(lái)承載GPU的工作?
Bill Dally答:我們的確有在研究一些潛在的總線(xiàn)方案,但問(wèn)題是我們現(xiàn)在只能控制總線(xiàn)的一端,而另一端則是由CPU廠商所控制的。當(dāng)然,這件事并不是由一家公司控制的,PCIe總線(xiàn)是一個(gè)組織所制定的標(biāo)準(zhǔn),我們也身在其中,我們當(dāng)然也希望在未來(lái)能夠有更好的界面問(wèn)世。
問(wèn):Fermi架構(gòu)的一大改良就是優(yōu)化的雙精度浮點(diǎn)運(yùn)算,其實(shí)之前在這個(gè)方面上,NVIDIA和ATI做的都不是很好,而Fermi架構(gòu)的單精度和雙精度之間的比值已經(jīng)達(dá)到了2比1,那么以一顆512核心的Fermi芯片計(jì)算,它究竟能給出多大的雙精度浮點(diǎn)運(yùn)算能力?
Bill Dally答:我們上一代GPU單精度和雙精度之間的比值還是8比1,而Fermi架構(gòu)已經(jīng)可以做到2比1了!當(dāng)然,具體的計(jì)算能力還要視產(chǎn)品的最終頻率而定,因此現(xiàn)在還沒(méi)有一個(gè)準(zhǔn)確的數(shù)字,不過(guò)這個(gè)數(shù)字肯定是相當(dāng)可觀的。
問(wèn):Fermi架構(gòu)能夠給消費(fèi)級(jí)市場(chǎng)帶來(lái)怎樣的好處?也就是說(shuō)NVIDIA的GeForce和Quadro產(chǎn)品。
Bill Dally答:Fermi架構(gòu)肯定是會(huì)被投放到我們不同的產(chǎn)品線(xiàn)上的,先是高性能計(jì)算的Tesla產(chǎn)品,然后是娛樂(lè)級(jí)的GeForce產(chǎn)品以及工作站級(jí)的Quadro產(chǎn)品。當(dāng)然,F(xiàn)ermi架構(gòu)本身的強(qiáng)大是不會(huì)變的,因此無(wú)論你把它投放到哪條產(chǎn)品線(xiàn)上,它所帶來(lái)的好處都是顯而易見(jiàn)的。
問(wèn):NVIDIA公司有沒(méi)有把GPU支持Windows操作系統(tǒng)提到議事日程上來(lái)?
Bill Dally答:對(duì)于Windows操作系統(tǒng)的支持,我們還沒(méi)有太多的計(jì)劃,我們更關(guān)注的是異構(gòu)計(jì)算。我們從來(lái)不會(huì)說(shuō)GPU就要好過(guò)CPU,不過(guò)我們堅(jiān)信在并行計(jì)算上我們的GPU肯定要比CPU更加出色?,F(xiàn)時(shí)對(duì)于一臺(tái)PC來(lái)說(shuō),CPU加上GPU的異構(gòu)計(jì)算無(wú)疑是很好的方式,讓CPU去運(yùn)行操作系統(tǒng),而并行計(jì)算就交給GPU去做。 #p#page_title#e#