Radeon INSTINCT MI6

Radeon Instinctのサーバーアクセラレータ製品ファミリーは、メタルインテリジェンスとHPCシステムの異機種混在コンピューティング機能の新時代をもたらします。次世代の「Vega」アーキテクチャや、ROCmソフトウェアプラットフォームを介したデータセンター設計へのRadeon Instinctのオープンエコシステムアプローチなどの世界クラスのGPUテクノロジの導入により、より高度なデータセンターのパフォーマンスと効率が実現し、さまざまなシステムアーキテクチャのサポートと業界標準的な相互接続技術をもたらします。

Radeon Instinct製品ファミリーは、Deep LearningとHPCのデータセンターの新しい時代の構築ブロックとなるように設計されています。AMDは、Radeon Instinctのサーバアクセラレータ製品とソフトウェアプラットフォームを設計、最適化し、コスト効率の良いマシンと深い学習の推論、トレーニング、エッジトレーニングソリューションを提供しており、アクセラレータの高度な並列コンピューティング機能を最大限に活用できます。
Radeon Instinct製品は、学術、政府機関、エネルギー、ライフサイエンス、金融、自動車、その他の業界でデータ中心のHPCクラスのシステムにも理想的です。

ピークの半分または4ギガバイトHBM1と単精度8.2 TFLOPSのパフォーマンス

5.7 TFLOPSピークFP16 | FP32 GPUはパフォーマンスを計算

Radeon Instinct MI6サーバアクセラレータは、ピーク5.7 TFLOPSのFP16またはFP32で16GB GDDR5メモリを搭載したシングルボード上でパフォーマンスを計算することにより、マシンとディープラーニングの推論およびエッジトレーニングアプリケーション用のシングルスロットカードで、より多くのメモリを必要とするHPC開発システムのための費用対効果の高いソリューションを提供します。

超高速16GB GDDR5 メモリ（256ビットメモリインタフェース搭載）

Radeon Instinct MI6サーバアクセラレータは、16GB GDDR5 GPUメモリと最大224GB / sのメモリ帯域幅を備え、要求の厳しいマシンインテリジェンスとディープラーニング推論アプリケーションを処理するための、バランスのとれた汎用性の高い単精度のコンピューティングソリューションを提供します。大規模なメモリと低消費電力の要件により、エッジトレーニングアプリケーションに効果的なソリューションです。

ワットあたり最大38 GFLOPSのFP16およびFP32 GPUが性能を発揮

Radeon Instinct MI6サーバアクセラレータは、最大38 GFLOPS / WattピークFP16またはFP32 GPUの性能を発揮し、マシンインテリジェンスやディープラーニングの推論、エッジトレーニングアプリケーションに多目的で効率的なソリューションを提供します。

36コンピュートユニット(2,304ストリームプロセッサ)

Radeon Instinct MI6サーバアクセラレータには、それぞれ64個のストリームプロセッサを搭載した36個の計算ユニットがあり、訓練されたディープラーニングニューラルネットワークに対して多数の小さなバッチデータを同時に実行して迅速な結果を得るために使用できる合計2,304個のストリームプロセッサがあります。これらのタイプのシステム設置には、低コストで効率的なソリューションでの単精度性能が不可欠です。MI6アクセラレータは、シングルスロットGPUカードに優れた単精度性能を提供します。

スケーラブルなサーバー配置に適した受動冷却アクセラレータ

"Polaris"アーキテクチャを採用した受動冷却サーバーアクセラレータ

Radeon Instinct MI6サーバアクセラレータは、14nmのFinFETプロセスを採用した「Polaris」アーキテクチャをベースとしており、HPC汎用および開発システムと一緒に、機械インテリジェンスやディープラーニングの単精度推論やエッジトレーニングアプリケーション用の高効率でスケーラブルなサーバ配備用に設計されています。このGPUサーバアクセラレータは、150WのTDPボード電力を消費するだけで、コスト効率が高く、汎用性の高いコンピューティングソリューションを顧客に提供します。

150W TDPボードパワー、シングルスロット、9.5 " GPUサーバーカード

Radeon Instinct MI6サーバーのGPUカードは、フルハイトのシングルスロットカードで、PCIe® Gen 3準拠のマザーボードで動作します。MI6 GPUカードは、ほとんどの標準サーバ設計に適合するように設計されており、HPCクラスのシステム導入と並行して、ヘテロジーニアスマシンインテリジェンスやディープラーニングの推論、エッジトレーニング向けの低コストで高効率なサーバソリューションを提供します。

最大224GB / sのメモリ帯域幅を備えた超高速GDDR5

Radeon Instinct MI6サーバアクセラレータは、16GBの超高速GDDR5メモリを使用して設計されており、多数のバッチのデータを同時に処理することができ、HPCワークロードに加えて厳しいマシンインテリジェンスやディープラーニングの推論やエッジトレーニングアプリケーションを素早く処理できます。

MxGPU SR-IOVハードウェア仮想化

Radeon Instinct MI6サーバアクセラレータは、AMDのMxGPU SRIOVハードウェア仮想化テクノロジをサポートするように設計されており、データセンターの利用率と容量を拡大させます。

ディープラーニングの推論

今日の指数関数的なデータの増加とそのデータの動的な性質は、データセンターシステム構成の要件を再構成しました。データセンターの設計者は、システムの効率を引き続き向上させながら、より複雑で並列な作業負荷を実行できるシステムを構築する必要があります。過去10年間のディスクリートGPUやその他のアクセラレータの機能の向上により、データセンターの設計者はこれらの新しい課題を解決するためのヘテロジーニアスコンピューティングシステムを構築するための新しいオプションを提供できます。

新しい知識を発見するために、訓練されたニューラルネットワークに対して半精度（FP16）または単精度（FP32）で新しい小さなデータセット入力が多数実行されている推論アプリケーションを実行するデータセンター展開では、データをすばやく実行できる並列コンピューティング対応システムが必要です小型コアのロット間で電力効率の良い方法で入力を行います。

Radeon Instinct MI6アクセラレータは、シングルスロット、150ワットTDPカードで、半精度または単精度浮動小数点パフォーマンスのそれぞれに対して5.7 TFLOPSを提供するデータセンターのマシンインテリジェントでディープラーニングの推論展開のための、強力かつコスト重視のソリューションです。MI6アクセラレータは、16GBの超高速GDDR5メモリと最大224GB / sの帯域幅を備えたAMDの「Polaris」アーキテクチャと、Radeon InstinctのオープンなROCmソフトウェアプラットフォームをベースにしており、データセンター設計者に推論の展開のために、多用途で高効率なソリューションを提供します。

推論の主な利点：

5.7 TFLOPS半分または単精度の計算パフォーマンス
38GFLOPS /ワットピークFP16 |効率的な推論とエッジトレーニングの導入のためのFP32パフォーマンス
358 GFLOPSピーク倍精度（FP64）の計算性能
2.4 GFLOPS /ワットピークFP64性能
16GB GDDR5（256ビットメモリインターフェイス搭載）により、超高速メモリパフォーマンスを実現
受動的に冷却された単一スロット、スケーラブルなサーバ配置用のGPUカード
ROCmソフトウェアプラットフォームは、オープンソースのHyperscaleプラットフォームを提供
オープンソースのLinux®ドライバ、HCCコンパイラ、ツールおよびライブラリは、メタルフォワードからフルコントロール
最適化されたMIOpenディープラーニングフレームワークライブラリ
mGPUピアツーピアの大規模BARサポート
最適化されたシステム利用のためのMxGPU SR-IOVハードウェア仮想化

ディープラーニングのためのエッジトレーニング

今日の指数関数的なデータの増加とそのデータの動的な性質は、データセンターシステム構成の要件を再構成しました。データセンターの設計者は、システムの効率を引き続き向上させながら、より複雑で並列な作業負荷を実行できるシステムを構築する必要があります。過去10年間のディスクリートGPUやその他のアクセラレータの機能の向上により、データセンターの設計者はこれらの新しい課題に対応する異種コンピューティングシステムを構築するための新しいオプションを提供できます。

非常に多数の低コストエッジサーバーを使用したトレーニングタスクのための、費用対効果の高い効率的なコンピューティングシステムに焦点を当てるエッジトレーニングソリューションを使用して、機械インテリジェンスと深い学習アプリケーションを実行するデータセンターデータセンター全体のコストを削減し、より高い効率を実現します。これらのシステムでは、高密度で低消費電力のパッケージで大容量のメモリを備えた単精度性能を提供するアクセラレータが必要です。

Radeon Instinct MI6アクセラレータは、38 GFLOPS /ワットのピーク半精度（FP16）を実現するデータインテリジェンスおよびディープラーニングアプリケーション用の低コストエッジトレーニングソリューションの要件に最適な汎用性の高い低電力サーバーアクセラレータです。または単精度（FP32）の浮動小数点性能を単一スロットの150ワットTDP GPUカードで実現します。Radeon InstinctのR6mソフトウェアプラットフォームを使用したオープンエコシステムアプローチと組み合わされた16GBの超高速GDDR5メモリと最大224GB / sの帯域幅を備えたAMDの「Polaris」アーキテクチャに基づくRadeon Instinct MI6アクセラレータは、エッジトレーニングの導入に多目的で高効率なソリューションを提供します。

エッジトレーニングの主な利点：

5.7 TFLOPSピークハーフまたは単精度演算性能
38 GFLOPS /ワットピークFP16 |シングルスロットカードでのFP32性能
358 GFLOPSピーク倍精度（FP64）の計算性能
2.4 GFLOPS /ワットピークFP64性能
16GB GDDR5（256ビットメモリインターフェイス搭載）により、超高速メモリパフォーマンスを実現
スケーラブルなサーバー展開のために受動的に冷却
ROCmソフトウェアプラットフォームは、オープンソースのHyperscaleプラットフォームを提供
オープンソースのLinux®ドライバ、HCCコンパイラ、ツールおよびライブラリは、メタルフォワードからフルコントロール
最適化されたMIOpenディープラーニングフレームワークライブラリ
mGPUピアツーピアの大規模BARサポート
最適化されたシステム利用のためのMxGPU SR-IOVハードウェア仮想化
複数のアーキテクチャと業界標準の相互接続テクノロジのオープン業界標準サポート

製品名	AMD Radeon INSTINCT MI6
型番
JANコード
GPUアーキテクチャ	AMD "Polaris"
ストリームプロセッサ	2,304
半精度(FP16)	5.7 TFLOPS
単精度(FP32)	5.7 TFLOPS
倍精度(FP64)	358 GFLOPS
GPUメモリ	16GB GDDR5
メモリバンド幅	最大224 GB /秒
バスインターフェース	PCI Express Gen 3 準拠マザーボード
MxGPU機能	〇
ボードフォームファクタ―	フルハイト、シングルスロット
ボード長さ	9.5"
冷却	受動冷却
標準最大電力	150W TDP
保証	２年間保証
サポートOS	Linux 64bit
ROCmソフトウェアプラットフォーム	〇
プログラミング環境	ISO C++, OpenCL™, CUDA (via AMD’s HIP conversion tool) Python5 (via Anaconda’s NUMBA)

製品画像ダウンロード