Zprávy

Akcelerátor neuronových sítí na bázi FPGA překonává GPU

Bylo prokázáno jako CNN googleNet Inception-v1, s použitím osmibitového celočíselného rozlišení. Dosáhl 16,8 terra operací za sekundu (TOPS) a může odvodit přes 5 300 snímků za sekundu na Xilinx Virtex UltraScale + XCVU9P-3 fpga. Modulární, škálovatelný přístup je vhodný pro aplikace pro detekci objektů a zpracování videa na okraji a v cloudu, vysvětlil Fawcett, stejně jako pro inference v datových centrech a inteligentních kamerách.

DPU lze nakonfigurovat tak, aby poskytoval optimální výpočetní výkon pro topologie neuronových sítí v aplikacích strojového učení, pomocí paralelní DSP architektury, distribuované paměti a rekonfigurovatelnosti logiky a konektivity pro různé algoritmy.

DPU dosahuje o 50% vyšší výkon než konkurenční CNN a překonává GPU pro daný rozpočet na výkon nebo náklady, tvrdí společnost. "Fpga je světově nejsilnější platforma a architektura, která je velmi flexibilní pro budoucnost a dokáže překonat GPU v AI s nižší latencí," dodal Fawcett.

Společnost také oznámila, že sponzoruje DPhil (PhD0 na Oxfordské univerzitě) s cílem studovat techniky implementace hluboké akcelerace učení na fpgas. Práce bude ve spolupráci s vlastním výzkumem Omnitek v oblasti výpočetních motorů a algoritmů AI.