網(wǎng)站地圖 | 聯(lián)系我們
首 頁(yè) 產(chǎn)品中心 解決方案 成功案例 服務(wù)支持 新聞動(dòng)態(tài) 關(guān)于我們 聯(lián)系我們
 新聞中心 NEWS
> 公司新聞
> 行業(yè)新聞
 產(chǎn)品搜索 SEARCH
 聯(lián)系方式 CONTACT
南京宇寬科技有限公司
電話:18021511005  王經(jīng)理
QQ:541933892
座機(jī):025-83605860*807
郵箱:18021511005#163.com  (#換@)
地址:南京市玄武區(qū)洪武北路188號(hào)長(zhǎng)發(fā)數(shù)碼大廈12樓C座


 
當(dāng)前位置:首頁(yè) > 新聞動(dòng)態(tài) > 行業(yè)新聞 > IBM 行業(yè)資訊 > Hadoop+GPU強(qiáng)強(qiáng)聯(lián)手的性能探索 | 南京IBM服務(wù)器
Hadoop+GPU強(qiáng)強(qiáng)聯(lián)手的性能探索 | 南京IBM服務(wù)器
來源:    日期:2017-02-24    瀏覽量:        
分享到:

標(biāo)簽:

Hadoop并行處理可以成倍地提高性能,GPU也日益成為計(jì)算任務(wù)的重要分擔(dān)者,Altoros Systems研發(fā)團(tuán)隊(duì)一直致力于探索Hadoop+GPU的可能性,以及在實(shí)際的大規(guī)模系統(tǒng)中的實(shí)現(xiàn),這篇文章就是他們的部分研究成果。

Hadoop并行處理可以成倍地提高性能,F(xiàn)在的問題是如果將一部分計(jì)算工作從CPU遷移到GPU會(huì)怎么樣?能否更快理論上,這些處理如果經(jīng)過了并行計(jì)算的優(yōu)化,在GPU上執(zhí)行會(huì)比CPU快50-100倍。 作為大數(shù)據(jù)專家和PaaS的推動(dòng)者,Altoros Systems研發(fā)團(tuán)隊(duì)一直致力于探索Hadoop+GPU的可能性,以及在實(shí)際的大規(guī)模系統(tǒng)中的實(shí)現(xiàn),這篇文章就是他們的部分研究成果。作者 Vladimir Starostenkov是Altoros Systems的資深研發(fā)工程師,他在實(shí)現(xiàn)復(fù)雜軟件架構(gòu)( 包括數(shù)據(jù)密集型系統(tǒng)和Hadoop驅(qū)動(dòng)的應(yīng)用程序)方面有五年經(jīng)驗(yàn),而且 對(duì)人工智能和機(jī)器學(xué)習(xí)算法也很感興趣。

技術(shù)現(xiàn)狀:

多年來,有很多將Hadoop或MapReduce應(yīng)用到GPU的科研項(xiàng)目。 Mars可能是第一個(gè)成功的GPU的MapReduce框架。采用Mars技術(shù),分析WEB數(shù)據(jù)(搜索和日志)和處理WEB文檔的性能提高了1.5-1.6倍。 根據(jù)Mars的基本原理,很多科研機(jī)構(gòu)都開發(fā)了類似的工具,提高自己數(shù)據(jù)密集型系統(tǒng)的性能。相關(guān)案例包括 分子動(dòng)力學(xué)、數(shù)學(xué)建模(如Monte Carlo)、基于塊的 矩陣乘法、財(cái)務(wù)分析、圖像處理等。

還有針對(duì)網(wǎng)格計(jì)算的 BOING系統(tǒng),它是一個(gè)快速發(fā)展、志愿者驅(qū)動(dòng)的中間件系統(tǒng)。盡管沒有使用Hadoop,BOINC已經(jīng)成為許多科研項(xiàng)目加速的基礎(chǔ)。例如, GPUGRID是一個(gè)基于BOINC的GPU和分布式計(jì)算的項(xiàng)目,它通過執(zhí)行分子模擬,幫助我們了解蛋白質(zhì)在健康和疾病情況下的不同作用。多數(shù)關(guān)于醫(yī)藥、物理、數(shù)學(xué)、生物等的 BOINC項(xiàng)目也可以使用Hadoop+GPU技術(shù)。

因此,使用GPU加速并行計(jì)算系統(tǒng)的需求是存在的。這些機(jī)構(gòu)會(huì)投資GPU的超級(jí)計(jì)算機(jī)或開發(fā)自己的解決方案。硬件廠商,如Cray,已經(jīng)發(fā)布了配置GPU和預(yù)裝了Hadoop的機(jī)器。Amazon也推出了 EMR(Amazon Elastic MapReduce),用戶可以在其配置了GPU的服務(wù)器上使用Hadoop。

超級(jí)計(jì)算機(jī)性能很高,但是成本達(dá)數(shù)百萬(wàn)美元;Amazon EMR也僅適用于延續(xù)幾個(gè)月的項(xiàng)目。對(duì)于一些更大的科研項(xiàng)目(兩到三年),投資自己的硬件更劃算。即使在Hadoop集群內(nèi)使用GPU能提高計(jì)算速度,數(shù)據(jù)傳輸也會(huì)造成一定的性能瓶頸。以下會(huì)詳細(xì)介紹相關(guān)問題。

工作原理

數(shù)據(jù)處理過程中,HDD、DRAM、CPU和GPU必然會(huì)有數(shù)據(jù)交換。

完成任何任務(wù)所需的時(shí)間總量包括:

CPU或GPU進(jìn)行計(jì)算所需的時(shí)間

數(shù)據(jù)在各個(gè)件間傳輸所需的時(shí)間

根據(jù)Tom’s HARDWARE 2012年的CPU圖表,CPU的平均性能在15到130GFLOPS之間,而Nvidia GPU的性能范圍在100到3000+ GFLOPS。這些都是統(tǒng)計(jì)值,而且很大程度上取決于任務(wù)的類型和算法。無論如何,在某些情況下,一個(gè)GPU可以使節(jié)點(diǎn)速度加快5至25倍。一些開發(fā)者聲稱,如果你的集群包括多個(gè)節(jié)點(diǎn),性能可以提高50到200倍。例如,MITHRA項(xiàng)目達(dá)到了254倍的性能提升。

性能瓶頸:

那么,GPU對(duì)數(shù)據(jù)傳輸會(huì)有什么影響?不同類型的硬件傳輸數(shù)據(jù)的速率不同,超級(jí)計(jì)算機(jī)已經(jīng)在GPU上做過相關(guān)優(yōu)化,一個(gè)普通的計(jì)算機(jī)或服務(wù)器在數(shù)據(jù)傳輸時(shí)可能會(huì)慢得多。 通常在一個(gè)CPU和芯片集數(shù)據(jù)傳輸速率在10到20GBps之間(圖中的Y點(diǎn)),GPU和DRAM間的數(shù)據(jù)交換速率在1到10GBps之間(圖中的X點(diǎn))。雖然一些系統(tǒng)速率可達(dá)10GBps(PCI-E v3),大部分標(biāo)準(zhǔn)配置的GDRAM和DRAM間數(shù)據(jù)流速率是1GBps。(建議在真實(shí)的硬件環(huán)境中來測(cè)量實(shí)際值,因?yàn)镃PU內(nèi)存帶寬[X和Y]以及對(duì)應(yīng)的數(shù)據(jù)傳輸速率[C和B]可能差不多也可能相差10倍)。

雖然GPU提供了更快的計(jì)算能力,GPU內(nèi)存和CPU內(nèi)存間的數(shù)據(jù)傳輸(X點(diǎn))卻帶來了性能瓶頸。因此,對(duì)于每一個(gè)特定的項(xiàng)目,要實(shí)際測(cè)量消耗在GPU上的數(shù)據(jù)傳輸時(shí)間(箭頭C)以及GPU加速節(jié)省的時(shí)間。因此,最好的方法是根據(jù)一個(gè)小集群的實(shí)際性能估計(jì)更大規(guī)模系統(tǒng)的運(yùn)行情況。

由于數(shù)據(jù)傳輸速率可能相當(dāng)慢,理想的情況是相比執(zhí)行計(jì)算的數(shù)目,每個(gè)GPU輸入/輸出數(shù)據(jù)的量比較小。切記:第一,任務(wù)類型要和GPU的能力相匹配,第二任務(wù)可以被Hadoop分割為并行獨(dú)立的子流程。 復(fù)雜的數(shù)學(xué)公式計(jì)算(例如矩陣乘法),大量隨機(jī)值的生成,類似的科學(xué)建模任務(wù)或其它通用的GPU應(yīng)用程序都屬于這種任務(wù)。

可用的技術(shù)

JCUDA:JCUDA項(xiàng)目為Nvidia CUDA提供了Java綁定和相關(guān)的庫(kù),如JCublas、JCusparse(一個(gè)矩陣的工作庫(kù))、JCufft(通用信號(hào)處理的Java綁定)、JCurand(GPU產(chǎn)生隨機(jī)數(shù)的庫(kù))等等。但 它只適用于Nvidia GPU。

Java Aparapi。Aparapi在運(yùn)行時(shí)將Java字節(jié)碼轉(zhuǎn)換為OpenCL,并在GPU上執(zhí)行。所有的Hadoop+GPU計(jì)算系統(tǒng)中,Aparapi 和OpenCL的前景最被看好。Aparapi由AMDJava實(shí)驗(yàn)室開發(fā),2011年開放源代碼,在AMD Fusion開發(fā)者峰會(huì)的官網(wǎng)上可以看到Aparapi的一些實(shí)際應(yīng)用。OpenCL是一個(gè)開源的、跨平臺(tái)的標(biāo)準(zhǔn),大量硬件廠商都支持這個(gè)標(biāo)準(zhǔn),并且可以 為CPU和GPU編寫相同的代碼基礎(chǔ)。如果一臺(tái)機(jī)器上沒有GPU,OpenCL會(huì)支持CPU。

創(chuàng)建訪問GPU的本地代碼。訪 問GPU本地代碼進(jìn)行復(fù)雜的數(shù)學(xué)計(jì)算,要比使用綁定和連接器性能高很多,但是,如果你需要在盡可能短的時(shí)間內(nèi)提供一個(gè)解決方案,就要用類似Aparapi 的框架。然后,如果你對(duì)它的性能不滿意,可以將部分或整個(gè)代碼改寫為本地代碼。可以使用C語(yǔ)言的API(使用Nvidia CUDA或OpenCL)創(chuàng)建本地代碼,允許Hadoop通過JNA(如果是Java應(yīng)用程序)或Hadoop Streaming(如果是C語(yǔ)言應(yīng)用程序)使用GPU。

GPU-Hadoop框架

也可以嘗試定制的GPU-Hadoop框架,這個(gè)框架啟動(dòng)于Mars之后,包括Grex、Panda、C-MR、GPMR、Shredder、SteamMR等。但是GPU-Hadoop多用于特定的科研項(xiàng)目,并且不再提供支持了,你甚至很難將Monte Carlo模擬框架應(yīng)用于一個(gè)以其它算法為基礎(chǔ)的生物信息項(xiàng)目。

處理器技術(shù)也在不斷發(fā)展在ony PlayStation 4中出現(xiàn)了革命性的新框架、Adapteva的多核微處理器、ARM的Mali GPU等等。Adapteva和Mali GPU都將兼容OpenCL。

Intel還推出了使用OpenCL的Xeon Phi協(xié)同處理器,這是一個(gè)60核的協(xié)同處理器,架構(gòu)類似于X86,支持PCI-E標(biāo)準(zhǔn)。雙倍精度計(jì)算時(shí)性能可達(dá)1TFLOPS,能耗僅為300Watt。目前最快的超級(jí)計(jì)算機(jī)天河-2就使用了該協(xié)同處理器。

很難說以上哪種框架會(huì)在高性能和分布式計(jì)算領(lǐng)域成為主流。隨著它們的不斷改善,我們對(duì)于大數(shù)據(jù)處理的理解可能也會(huì)改變。

[打印本文] [關(guān)閉窗口] [返回頂部]
   上一篇:NAS需要專用硬盤 | 南京IBM服務(wù)器
   下一篇:蘋果將建太陽(yáng)能電廠供數(shù)據(jù)中心使用 | 南京IBM服務(wù)器

相關(guān)資料  
> IBM服務(wù)器日志文件的切割 | 南京IBM服務(wù)器
> 怎樣指定IBM服務(wù)器日志文件存放路徑? | 南京IBM服務(wù)
> Nginx的完整配置事例 | 南京IBM服務(wù)器
> Nginx的平滑升級(jí) | 南京IBM服務(wù)器
> Nginx如何平滑重啟 | 南京IBM服務(wù)器
> 補(bǔ)丁管理方案的7大好處 | 南京IBM服務(wù)器
> 關(guān)于軟件管理的解決方案 | 南京IBM服務(wù)器
> 虛擬機(jī)管理與系統(tǒng)部署解決方案 | 南京IBM服務(wù)器
> 關(guān)于資產(chǎn)清單管理的解決方案 | 南京IBM服務(wù)器
> 關(guān)于Altiris服務(wù)器管理解決方案 | 南京IBM服務(wù)器
> 服務(wù)器不能啟動(dòng)了怎么辦? | 南京IBM服務(wù)器
> RIS服務(wù)器簡(jiǎn)介 | 南京IBM服務(wù)器
> X3650M4主機(jī)存儲(chǔ)如何掛載? | 南京IBM服務(wù)器
> 年底拋貨,X3300、X3550全系列,X3500I01、I21,X 3650 I01、I21,
> 南京宇寬科技有限公司祝大家元旦快樂! | 南京IBM服務(wù)
> X3630M4I01、X3300M4、X3550M4全系列大量、X3500-I01價(jià)格好,5606
公司信息
 > 公司簡(jiǎn)介
 > 企業(yè)文化
 > 榮譽(yù)證書
 
產(chǎn)品展示
> 聯(lián)想 全系列產(chǎn)品
> IBM 全系列產(chǎn)品
> DELL 全系列產(chǎn)品
> HP 全系列產(chǎn)品
> 深信服 全系列產(chǎn)品
> 華為 全系列產(chǎn)品
 
解決方案
 >聯(lián)想桌面云一體化解決方案
 >ThinkCloud OpenStack 云平臺(tái)
 
技術(shù)服務(wù)
 >資料下載
 >常見問題解答
 >技術(shù)知識(shí)庫(kù)
行業(yè)資訊
 >DELL 行業(yè)資訊
 >華為 行業(yè)資訊
 >IBM 行業(yè)資訊
 >聯(lián)想 行業(yè)資訊
 >HP 行業(yè)資訊
 >深信服 行業(yè)資訊
版權(quán)所有:南京宇寬科技有限公司
久久婷婷综合色丁香五月,人妻无码久久中文字幕专区,青青热久免费精品视频在线播放,亚洲爆乳少妇无码激情,亚洲熟妇久久精品,欧美成人在线视频,国产大学生高潮动态,久久99精品久久久影院老司机,久久亚洲第一网站av,国内精品视频一区二区三区
国产激情无码一区二区| 无码国模国产在线观看| 久久精品亚洲日本桥本有菜| 好吊妞国产欧美日韩免费观看 | 国产日韩精品视频无码| 四虎永久在线精品免费一区二区 | 久久中文字幕2021精品| 凹凸导航第一福利| 欧美成人精品第一区| 狠狠爱无码一区二区三区 | 十八禁无码精品a∨在线观看| 国产精品日韩av在线播放| 99J久久精品久久久久久| 无码成人中文字幕不卡| 亚洲欧美日韩、中文字幕不卡 | 国内高清久久久久久| 国产男女自拍视频| 国产欧美另类久久久精品不卡| 日韩美女VA毛片在线播放| 国产午夜鲁丝片AV无码免费| 亚洲国产精品久久一线不卡| 国产成人无码网站| 99久久久无码国产精品动漫| 亚洲AV无码破坏版在线观看| 亚洲精品乱码久久久久久中文字幕| 久久综合14p| 久久久精品2019中文字幕2020| 五月天婷婷综合成人网| 国产成人精品免费视频版大全软件| 久久精品国产日本波多麻结衣| 久久中文字幕2021精品| 国产色视频一区二区三区QQ号 | 日韩字幕一中文在线综合| 亚洲国产精品日韩一线满| 精品噜噜噜噜久久久久久久久| 国产成人亚洲精品无码电影| 午夜成人影院H在线播放| 国产成人欧美一区二区三区| 久久综合狠狠色综合伊人 | 免费无码不卡视频在线观看| XXXX欧美喷水|