ニュース

FPGAベースのニューラルネットワークアクセラレータはGPUより優れています

これは、8ビット整数解像度を使用するGoogLeNet Inception-v1 CNNとして実証されました。毎秒16.8テラオペレーション（TOPS）を達成し、ザイリンクスのVirtex UltraScale + XCVU9P-3 fpgaで毎秒5,300以上の画像を推論できます。 Fawcett氏は、モジュール式のスケーラブルなアプローチにより、エッジやクラウドでのオブジェクト検出やビデオ処理アプリケーション、およびデータセンターやインテリジェントカメラでの推論に適しています。

DPUは、並列DSPアーキテクチャ、分散メモリ、さまざまなアルゴリズムのロジックと接続の再構成可能性を使用して、機械学習アプリケーションのニューラルネットワークトポロジに最適な計算パフォーマンスを提供するように構成できます。

DPUは、競合するCNNよりも50％以上高いパフォーマンスを達成し、特定の電力またはコストの予算でGPUよりも優れていると同社は主張しています。「fpgaは世界をリードするプラットフォームとアーキテクチャであり、将来を見据えた柔軟性が高く、レイテンシが低く、AIのGPUよりも優れています」とFawcett氏は付け加えます。

同社はまた、DPhil（オックスフォード大学のphD0がfpgasにディープラーニングアクセラレーションを実装するための技術を研究するためのスポンサーになることを発表しました。この作業は、AI計算エンジンとアルゴリズムに関するOmnitek自身の研究と共同で行われる予定です。