AMD推出Radeon Instinct加速器,全速航向直覺化運(yùn)算的新時代,不久將向夥伴廠商出貨,強(qiáng)化各種深度學(xué)習(xí)與異質(zhì)化高效能運(yùn)算(HPC)解決方案。
 |
AMD推出Radeon Instinct加速器,全速航向直覺化運(yùn)算的新時代,不久將向夥伴廠商出貨,強(qiáng)化各種深度學(xué)習(xí)與異質(zhì)化高效能運(yùn)算(HPC)解決方案。 |
在2016年12月首次對外亮相,全新GPU伺服器加速器系列包含Radeon Instinct MI25、Radeon Instinct MI8以及Radeon Instinct MI6,連同AMD的開源ROCm 1.6軟體平臺,除了協(xié)助大幅提升效能與效率,更易於深度學(xué)習(xí)工作負(fù)載的執(zhí)行,並同時加快深度學(xué)習(xí)的推論與訓(xùn)練,加速推升機(jī)器智慧。
Radeon Instinct最初三款加速器設(shè)計(jì)旨在支援廣泛的機(jī)器智慧應(yīng)用
*Radeon Instinct MI25加速器採用「Vega」架構(gòu),運(yùn)用14奈米FinFET製程,將成為全球最極致的訓(xùn)練加速器,支援各種超大規(guī)模機(jī)器智慧與深度學(xué)習(xí)資料中心應(yīng)用。MI25能在被動式散熱的單GPU伺服器介面卡上提供卓越的FP16與FP32效能,透過本身64個運(yùn)算單元(4,096個串流處理器)提供24.6 TFLOPS浮點(diǎn)運(yùn)算的FP16或12.3 TFLOPS浮點(diǎn)運(yùn)算的FP32尖峰效能。憑藉16GB的超高頻寬HBM2 ECC GPU記憶體以及高達(dá)484 GB/s的記憶體頻寬,Radeon Instinct MI25針對超大規(guī)模平行處理應(yīng)用進(jìn)行優(yōu)化,讓機(jī)器智慧與HPC等級系統(tǒng)工作負(fù)載能處理龐大的資料集。
*Radeon Instinct MI8加速器運(yùn)用高效能低功耗的「Fiji」GPU架構(gòu),這款微型HPC與推論加速器具備8.2 TFLOPS浮點(diǎn)運(yùn)算的尖峰FP16/FP32效能,板卡的功耗不到175瓦,並搭載4GB的高頻寬記憶體(HBM),採用512位元記憶體介面。MI8適用於機(jī)器學(xué)習(xí)推論以及各種HPC應(yīng)用領(lǐng)域。
*Radeon Instinct MI6加速器基於「Polaris」GPU架構(gòu),這款採用被動式散熱設(shè)計(jì)的推論加速器具備5.7 TFLOPS浮點(diǎn)運(yùn)算的尖峰FP16/FP32效能,尖峰功耗僅150瓦,並以256位元記憶體介面搭載16 GB的超高速GDDR5 GPU記憶體。MI6是一款多用途加速器,適合用在HPC與機(jī)器學(xué)習(xí)推論,以及邊緣訓(xùn)練等應(yīng)用領(lǐng)域。
AMD開源解決方案為Radeon Instinct硬體挹注動能
*ROCm 1.6軟體平臺預(yù)計(jì)於6月29日發(fā)布,不僅效能提升且支援MIOpen 1.0函式庫,兼具可擴(kuò)充以及完全開源的特性,為新類別混合式超大規(guī)模與HPC等級系統(tǒng)工作負(fù)載提供高彈性且性能強(qiáng)大的異質(zhì)化運(yùn)算解決方案。ROCm內(nèi)含開源的Linux驅(qū)動程式,針對可擴(kuò)充多重GPU運(yùn)算進(jìn)行優(yōu)化,ROCm軟體平臺能提供多種規(guī)劃模型、HIP CUDA轉(zhuǎn)換工具,以及透過異質(zhì)運(yùn)算編譯器(HCC)支援GPU加速。
*開源MIOpen GPU加速函式庫現(xiàn)已和ROCm平臺一起釋出,並支援各種機(jī)器智慧框架,包含Caffe、TensorFlow以及Torch。
AMD預(yù)計(jì)在2017年第3季開始向技術(shù)夥伴供應(yīng)Radeon Instinct產(chǎn)品,讓他們開發(fā)各種深度學(xué)習(xí)與HPC解決方案,其中包括Boxx、Colfax、Exxact公司、技嘉、英業(yè)達(dá)以及美超微等廠商。