雙芯合力“CPU-GPU”技術(shù)解析
時間:2008-12-17 12:18:00
來源:UltraLAB圖形工作站方案網(wǎng)站
人氣:9511
作者:admin
-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`
雙芯合力“CPU-GPU”
-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`
在剛剛過去的2007年,NVIDIA率先引入了Tesla通用GPU計算架構(gòu),最終目的是將CPU和GPU合二為一,然而NVIDIA并沒有 CPU的研發(fā)歷史,在整合的道路上遇到了重重困難。另一方面,AMD計劃于2009年推出內(nèi)建GPU核心的Fusion處理器,而Intel整合GPU的 Nehalem處理器將與之正面交火,屆時,處理器將全面進入整合GPU時代。
三足鼎立:CPU與GPU整合計劃在PC技術(shù)領域,CPU和GPU始終是相輔相成,在二者已經(jīng)發(fā)展到出現(xiàn)新的瓶頸時,“結(jié)合”也許是明智的解決方案,因此,關于整合CPU和GPU的方案就一直被人們所津津樂道。
自收購ATI之后,AMD公布了整合CPU和GPU的Fusion計劃(為了不給大家在閱讀上造成混亂,我們下文仍將集成在AMD處理器中的顯示核心稱為GPU),并計劃于2008年年底發(fā)布。在2007年年底,AMD最終確定了Fusion處理器的細節(jié),并將在2009年下半年以APU(加速處理器)的面目出現(xiàn),首款APU的代號為Swift,初步計劃采用45nm的SOI(Silicon on insulator,絕緣體硅片)工藝,集成GPU和北橋。
作為處理器領域的霸主,Intel顯然不會坐以待斃,為了對抗AMD的Fusion處理器,Intel計劃在下一代Nehalem處理器家族中,將代號為Havendale的處理器整合GPU,同樣會在2009年上半年如期上市。
作為圖形芯片領域的領頭羊,NVIDIA此前推出了Tesla通用GPU計算架構(gòu),但這并不是NVIDIA的最終目的,不管是GPU集成CPU,還是CPU整合GPU,NVIDIA意識到未來GPU的發(fā)展趨勢,那就是CPU與GPU的完美融合,NVIDIA已經(jīng)搶先買下UlI Electronics,并收購了Stexar公司,獲得了整體芯片組和x86架構(gòu)的設計團隊,并計劃于2009年推出一款45nm處理器,為未來推出整合CPU和GPU做準備,屆時,CPU和GPU整合市場將形成三足鼎立的局勢。
-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`
整合GPU的實際價值
-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`
談到CPU與GPU的整合,相信不少用戶都會想到板載GPU,它的目的是為了降低用戶的使用成本,然而在CPU里整合GPU,是否也僅為了降低成本那么簡單呢?實際并非如此,在GPU剛剛誕生的時候,它的用途比較簡單、專一,主要是為了處理圖像貼圖,然而隨著3D技術(shù)的發(fā)展,GPU不僅具有可編程能力,而且還具備高強度并行計算能力。GPU有兩個重要特征:在視覺上提供非常逼真的效果;可以分擔CPU在計算中的負載,起到減負的作用。CPU的設計則不同,它適合管理多個離散的任務,但在處理并行化任務時顯得力不從心,CPU進入多核時代后,依然不能滿足用戶的需求。因而,GPU在浮點運算能力上要遠強于 CPU,據(jù)說這個差距在25倍。
如果能夠發(fā)揮GPU的性能潛力,讓它協(xié)助CPU處理復雜的任務,比如CPU負責一般任務計算,而GPU則負責專門浮點計算,這樣就可以解決未來CPU發(fā)展的性能瓶頸。為此,通用“CPU-GPU”計算構(gòu)架被一致看好,但實現(xiàn)二者的整合有兩個途徑:CPU整合GPU,或GPU集成CPU。就目前的情況來看,盡管PCI-E總線的帶寬雖高,但始終未能滿足CPU與GPU之間頻繁的數(shù)據(jù)交換工作,加上GPU受PCI-E總線的限制,GPU集成CPU還不夠成熟,CPU整合GPU才是最終出路,由于CPU通用處理器的設計,令它得以應付日常生活形形色色的工作,所以它與GPU的關系是并存的。CPU與GPU都是由晶體管組成的,而且CPU以后都是向著雙核/多核的道路發(fā)展,制程方面也向著更精細的工藝前進,CPU與GPU整合在一起可以更充分地利用好各自的資源,無論是進行非游戲運算,還是3D游戲運算,兩者都可以擁有最高的效率,同時也可以把兼容性提升到一個更高的檔次。盡管這種整合會產(chǎn)生很多實際問題,但對于用戶來說,一顆芯片擁有CPU與GPU的全部功能,也意味著擁有更出色的性價比。與此同時,CPU與GPU合二為一,也使得PC邁向更大規(guī)模的集成化之路,而且越簡單的PC就越容易標準化統(tǒng)一化,也會更加廉價而實用,在未來,PC也可以像手機一樣,拿在手里到處移動使用。 #p#page_title#e#
-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`
現(xiàn)實的問題:CPU如何與GPU整合?
-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`
要讓CPU與GPU完美結(jié)合,擺在廠商面前的問題是如何去整合,對于AMD而言,它將直接在Fusion處理器中整合GPU核心。AMD將本來內(nèi)建雙核CPU的其中一個Core更換為GPU,使得CPU與GPU之間以 Crossbar(交叉開關)方式交換數(shù)據(jù),更適合CPU的代碼將在Fusion處理器的CPU部分被執(zhí)行,而更適合GPU的代碼將在GPU部分被執(zhí)行。在這種新架構(gòu)下,GPU也可以讀取CPU的Cache資料,這是PCI-E 總線所未能提供的功能,F(xiàn)usion處理器還整合了內(nèi)存控制器,以同時滿足CPU的DDR2/3及GPU的GDDR內(nèi)存控制器的需求。無疑,F(xiàn)usion處理器將內(nèi)建完整的DirectX GPU核心、緩存和PCI-E通道,將是一款非常有價值的GPU處理器。
實際上,F(xiàn)usion處理器整合GPU的原理,與目前的Crossfire互聯(lián)方案非常類似——CPU與GPU事實上仍是獨立的,通過內(nèi)部總線進行通信,同時還分別擁有獨立的緩存,處理器中的GPU和CPU會共享系統(tǒng)內(nèi)存,從而實現(xiàn)GPU與CPU的數(shù)據(jù)交換。值得注意的是,F(xiàn)usion處理器還內(nèi)置了1個HT總線,允許Fusion處理器的平臺擴展外部顯卡,AMD表示,F(xiàn)usion處理器不僅以一個整合了北橋、GPU的單芯片面目出現(xiàn),還將會整合不同數(shù)量的GPU和CPU核心,比如兩個Fusion處理器連接在一起,可以達成并行GPU模式。在未來,AMD新一代整合GPU的處理器還將提供多條HT總線,以實現(xiàn)更高的帶寬外接顯卡,甚至會提供內(nèi)建GPU與外接顯卡的Crossfire新方案。
與AMD有所不同的是,Intel的設計路線并不是簡單的內(nèi)建GPU核心,Nehalem處理器是通過多芯片系統(tǒng)封裝(Multi-Chip Package)方式,將北橋芯片及圖形芯片直接整合在CPU之中,而CPU內(nèi)核心與GPU核心是通過Quick Path Interconnect(QPI)方式連接,QPI內(nèi)置內(nèi)存控制器,有助于解決CPU和GPU從內(nèi)存中讀取數(shù)據(jù)時的延遲,內(nèi)存延遲和帶寬有了大幅度改進,QPI還具備處理器間的直接連接技術(shù),使芯片能夠共享數(shù)據(jù),1個處理器能夠存取與其他處理器相連接的內(nèi)存中的數(shù)據(jù),大大提升了整合GPU處理器的運行效率。Intel如此的設計方案,還可縮短產(chǎn)品設計周期,有助于降低生產(chǎn)成本。
雙芯合力“CPU-GPU”
-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`
在剛剛過去的2007年,NVIDIA率先引入了Tesla通用GPU計算架構(gòu),最終目的是將CPU和GPU合二為一,然而NVIDIA并沒有 CPU的研發(fā)歷史,在整合的道路上遇到了重重困難。另一方面,AMD計劃于2009年推出內(nèi)建GPU核心的Fusion處理器,而Intel整合GPU的 Nehalem處理器將與之正面交火,屆時,處理器將全面進入整合GPU時代。
三足鼎立:CPU與GPU整合計劃在PC技術(shù)領域,CPU和GPU始終是相輔相成,在二者已經(jīng)發(fā)展到出現(xiàn)新的瓶頸時,“結(jié)合”也許是明智的解決方案,因此,關于整合CPU和GPU的方案就一直被人們所津津樂道。
自收購ATI之后,AMD公布了整合CPU和GPU的Fusion計劃(為了不給大家在閱讀上造成混亂,我們下文仍將集成在AMD處理器中的顯示核心稱為GPU),并計劃于2008年年底發(fā)布。在2007年年底,AMD最終確定了Fusion處理器的細節(jié),并將在2009年下半年以APU(加速處理器)的面目出現(xiàn),首款APU的代號為Swift,初步計劃采用45nm的SOI(Silicon on insulator,絕緣體硅片)工藝,集成GPU和北橋。
作為處理器領域的霸主,Intel顯然不會坐以待斃,為了對抗AMD的Fusion處理器,Intel計劃在下一代Nehalem處理器家族中,將代號為Havendale的處理器整合GPU,同樣會在2009年上半年如期上市。
作為圖形芯片領域的領頭羊,NVIDIA此前推出了Tesla通用GPU計算架構(gòu),但這并不是NVIDIA的最終目的,不管是GPU集成CPU,還是CPU整合GPU,NVIDIA意識到未來GPU的發(fā)展趨勢,那就是CPU與GPU的完美融合,NVIDIA已經(jīng)搶先買下UlI Electronics,并收購了Stexar公司,獲得了整體芯片組和x86架構(gòu)的設計團隊,并計劃于2009年推出一款45nm處理器,為未來推出整合CPU和GPU做準備,屆時,CPU和GPU整合市場將形成三足鼎立的局勢。
-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`
整合GPU的實際價值
-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`
談到CPU與GPU的整合,相信不少用戶都會想到板載GPU,它的目的是為了降低用戶的使用成本,然而在CPU里整合GPU,是否也僅為了降低成本那么簡單呢?實際并非如此,在GPU剛剛誕生的時候,它的用途比較簡單、專一,主要是為了處理圖像貼圖,然而隨著3D技術(shù)的發(fā)展,GPU不僅具有可編程能力,而且還具備高強度并行計算能力。GPU有兩個重要特征:在視覺上提供非常逼真的效果;可以分擔CPU在計算中的負載,起到減負的作用。CPU的設計則不同,它適合管理多個離散的任務,但在處理并行化任務時顯得力不從心,CPU進入多核時代后,依然不能滿足用戶的需求。因而,GPU在浮點運算能力上要遠強于 CPU,據(jù)說這個差距在25倍。

如果能夠發(fā)揮GPU的性能潛力,讓它協(xié)助CPU處理復雜的任務,比如CPU負責一般任務計算,而GPU則負責專門浮點計算,這樣就可以解決未來CPU發(fā)展的性能瓶頸。為此,通用“CPU-GPU”計算構(gòu)架被一致看好,但實現(xiàn)二者的整合有兩個途徑:CPU整合GPU,或GPU集成CPU。就目前的情況來看,盡管PCI-E總線的帶寬雖高,但始終未能滿足CPU與GPU之間頻繁的數(shù)據(jù)交換工作,加上GPU受PCI-E總線的限制,GPU集成CPU還不夠成熟,CPU整合GPU才是最終出路,由于CPU通用處理器的設計,令它得以應付日常生活形形色色的工作,所以它與GPU的關系是并存的。CPU與GPU都是由晶體管組成的,而且CPU以后都是向著雙核/多核的道路發(fā)展,制程方面也向著更精細的工藝前進,CPU與GPU整合在一起可以更充分地利用好各自的資源,無論是進行非游戲運算,還是3D游戲運算,兩者都可以擁有最高的效率,同時也可以把兼容性提升到一個更高的檔次。盡管這種整合會產(chǎn)生很多實際問題,但對于用戶來說,一顆芯片擁有CPU與GPU的全部功能,也意味著擁有更出色的性價比。與此同時,CPU與GPU合二為一,也使得PC邁向更大規(guī)模的集成化之路,而且越簡單的PC就越容易標準化統(tǒng)一化,也會更加廉價而實用,在未來,PC也可以像手機一樣,拿在手里到處移動使用。 #p#page_title#e#
-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`
現(xiàn)實的問題:CPU如何與GPU整合?
-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`
要讓CPU與GPU完美結(jié)合,擺在廠商面前的問題是如何去整合,對于AMD而言,它將直接在Fusion處理器中整合GPU核心。AMD將本來內(nèi)建雙核CPU的其中一個Core更換為GPU,使得CPU與GPU之間以 Crossbar(交叉開關)方式交換數(shù)據(jù),更適合CPU的代碼將在Fusion處理器的CPU部分被執(zhí)行,而更適合GPU的代碼將在GPU部分被執(zhí)行。在這種新架構(gòu)下,GPU也可以讀取CPU的Cache資料,這是PCI-E 總線所未能提供的功能,F(xiàn)usion處理器還整合了內(nèi)存控制器,以同時滿足CPU的DDR2/3及GPU的GDDR內(nèi)存控制器的需求。無疑,F(xiàn)usion處理器將內(nèi)建完整的DirectX GPU核心、緩存和PCI-E通道,將是一款非常有價值的GPU處理器。


與AMD有所不同的是,Intel的設計路線并不是簡單的內(nèi)建GPU核心,Nehalem處理器是通過多芯片系統(tǒng)封裝(Multi-Chip Package)方式,將北橋芯片及圖形芯片直接整合在CPU之中,而CPU內(nèi)核心與GPU核心是通過Quick Path Interconnect(QPI)方式連接,QPI內(nèi)置內(nèi)存控制器,有助于解決CPU和GPU從內(nèi)存中讀取數(shù)據(jù)時的延遲,內(nèi)存延遲和帶寬有了大幅度改進,QPI還具備處理器間的直接連接技術(shù),使芯片能夠共享數(shù)據(jù),1個處理器能夠存取與其他處理器相連接的內(nèi)存中的數(shù)據(jù),大大提升了整合GPU處理器的運行效率。Intel如此的設計方案,還可縮短產(chǎn)品設計周期,有助于降低生產(chǎn)成本。

-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`
觀點:CPU整合GPU前景廣闊,困難也不少
-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`
盡管CPU整合GPU成為未來發(fā)展趨勢,但至少可以肯定,在2009之前,對應產(chǎn)品不會上市,此外,CPU與GPU整合看起來容易,但實際遇到的問題還很多,比如現(xiàn)有主流GPU內(nèi)建的晶體管目數(shù)目達到7億之多,比CPU還要復雜,這意味著CPU還難以集成高端GPU內(nèi)核。就算以后能集成高端的 GPU,但GPU的發(fā)熱量比CPU大許多,也是一個亟待解決的問題。
因此,AMD與Intel初期將以整合簡單的GPU為主。同時,由于GPU在設計上的特殊性,它的核心工作頻率遠比CPU要低,這將會制約GPU與CPU之間的數(shù)據(jù)互通能力,在傳輸速度上會存在一定的延遲,至少不會有理想中那么好。
正是由于技術(shù)上的不足,導致了CPU整合CPU暫時并不會馬上普及起來,畢竟對于高端游戲玩家或圖形工作站用戶而言,對CPU整合GPU的產(chǎn)品需求并不是那么迫切。他們更在乎強勁的圖形處理性能,但對于普通用戶而言,初期CPU整合的GPU已經(jīng)達到了DirectX 10入門級水平,可以全面支持Windows Vista及高清視頻播放等能力,不僅可滿足日常娛樂應用需求,同時進一步降低了用戶購買成本,更為重要的是,由于GPU被集成在CPU里,可以讓系統(tǒng)的體積做到更小,整機功耗也更低,這符合未來低功耗、低噪音的節(jié)能環(huán)保PC的發(fā)展方向。 #p#page_title#e#
幸運的是,技術(shù)的發(fā)展總是永無止境,針對PCI-E總線存在的延遲問題,Intel推出了PCI-E 3.0標準,將幫助Nehalem處理器內(nèi)建GPU核心的性能優(yōu)勢,同時對于GPU頻率落后CPU的問題,AMD方面表示會致力于以CPU技術(shù)改良 GPU,使之實現(xiàn)3GHz的工作頻率,此時GPU的浮點運算能力可達更高的水平。另外隨著GPU技術(shù)的進步,到2010年時,GPU可實現(xiàn) Petaflops(千萬億級)的超級浮點運算能力,是現(xiàn)在CPU的 40倍以上,完全改變計算機功能,此時CPU整合GPU的時代才會開始普及起來。
對于時下的主流應用,Windows Vista的3D性能、多媒體性能,對GPU并不會構(gòu)成運算負擔,隨著CPU-GPU技術(shù)的發(fā)展,更多的浮點運算任務被安排給GPU計算,因為GPU強大的浮點運算能力比CPU的執(zhí)行效率更高。GPU不僅僅是一顆3D圖形處理器,它不是只能用于玩游戲,未來GPU更多實用的功能將會被開發(fā)出來,比如大型文檔加速、視頻轉(zhuǎn)換、編碼、查毒殺毒、壓縮解壓……而如果CPU整合GPU的技術(shù)足夠完善,未來所有的工作都可以交給CPU去執(zhí)行,屆時,電腦體積將變得非常小巧、輕薄。
觀點:CPU整合GPU前景廣闊,困難也不少
-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`-`
盡管CPU整合GPU成為未來發(fā)展趨勢,但至少可以肯定,在2009之前,對應產(chǎn)品不會上市,此外,CPU與GPU整合看起來容易,但實際遇到的問題還很多,比如現(xiàn)有主流GPU內(nèi)建的晶體管目數(shù)目達到7億之多,比CPU還要復雜,這意味著CPU還難以集成高端GPU內(nèi)核。就算以后能集成高端的 GPU,但GPU的發(fā)熱量比CPU大許多,也是一個亟待解決的問題。
因此,AMD與Intel初期將以整合簡單的GPU為主。同時,由于GPU在設計上的特殊性,它的核心工作頻率遠比CPU要低,這將會制約GPU與CPU之間的數(shù)據(jù)互通能力,在傳輸速度上會存在一定的延遲,至少不會有理想中那么好。
正是由于技術(shù)上的不足,導致了CPU整合CPU暫時并不會馬上普及起來,畢竟對于高端游戲玩家或圖形工作站用戶而言,對CPU整合GPU的產(chǎn)品需求并不是那么迫切。他們更在乎強勁的圖形處理性能,但對于普通用戶而言,初期CPU整合的GPU已經(jīng)達到了DirectX 10入門級水平,可以全面支持Windows Vista及高清視頻播放等能力,不僅可滿足日常娛樂應用需求,同時進一步降低了用戶購買成本,更為重要的是,由于GPU被集成在CPU里,可以讓系統(tǒng)的體積做到更小,整機功耗也更低,這符合未來低功耗、低噪音的節(jié)能環(huán)保PC的發(fā)展方向。 #p#page_title#e#
幸運的是,技術(shù)的發(fā)展總是永無止境,針對PCI-E總線存在的延遲問題,Intel推出了PCI-E 3.0標準,將幫助Nehalem處理器內(nèi)建GPU核心的性能優(yōu)勢,同時對于GPU頻率落后CPU的問題,AMD方面表示會致力于以CPU技術(shù)改良 GPU,使之實現(xiàn)3GHz的工作頻率,此時GPU的浮點運算能力可達更高的水平。另外隨著GPU技術(shù)的進步,到2010年時,GPU可實現(xiàn) Petaflops(千萬億級)的超級浮點運算能力,是現(xiàn)在CPU的 40倍以上,完全改變計算機功能,此時CPU整合GPU的時代才會開始普及起來。
對于時下的主流應用,Windows Vista的3D性能、多媒體性能,對GPU并不會構(gòu)成運算負擔,隨著CPU-GPU技術(shù)的發(fā)展,更多的浮點運算任務被安排給GPU計算,因為GPU強大的浮點運算能力比CPU的執(zhí)行效率更高。GPU不僅僅是一顆3D圖形處理器,它不是只能用于玩游戲,未來GPU更多實用的功能將會被開發(fā)出來,比如大型文檔加速、視頻轉(zhuǎn)換、編碼、查毒殺毒、壓縮解壓……而如果CPU整合GPU的技術(shù)足夠完善,未來所有的工作都可以交給CPU去執(zhí)行,屆時,電腦體積將變得非常小巧、輕薄。