新聞動態

基於FPGA的神經網絡加速器勝過GPU

它使用八位整數分辨率作為GoogLeNet Inception-v1 CNN進行了演示。它在Xilinx Virtex UltraScale + XCVU9P-3 fpga上實現了每秒16.8次terra操作(TOPS),並且每秒可以推斷出5,300張圖像。 Fawcett解釋說,模塊化,可擴展的方法使其適用於邊緣和雲中的對象檢測和視頻處理應用程序,以及數據中心和智能相機中的推理。

DPU可以配置為使用並行DSP架構,分佈式內存以及邏輯的可重配置性和針對不同算法的連接性,為機器學習應用中的神經網絡拓撲提供最佳的計算性能。

該公司稱,在給定的功耗或成本預算下,DPU的性能比任何競爭的CNN都高出50%以上,並且性能優於GPU。 Fawcett補充說:“ fpga是一個世界一流的平台和體系結構,對於將來的開發來說非常靈活,並且可以在AI中優於GPU,並且延遲更短。”

該公司還宣布將贊助牛津大學的DPhil(PhD0)研究在fpgas上實現深度學習加速的技術。這項工作將與Omnitek自己對AI計算引擎和算法的研究合作。