Nyheder

FPGA-baseret neuralt netværksaccelerator overgår GPU'er

Det blev demonstreret som en GoogLeNet Inception-v1 CNN ved anvendelse af otte-bit heltalopløsning. Det opnåede 16,8 terra-operationer pr. Sekund (TOPS) og kan aflede over 5.300 billeder pr. Sekund på en Xilinx Virtex UltraScale + XCVU9P-3 fpga. Den modulære, skalerbare tilgang gør den velegnet til objektdetektering og videobehandlingsapplikationer i kanten og i skyen, forklarede Fawcett, såvel som til slutninger i datacentre og intelligente kameraer.

DPU'en kan konfigureres til at tilvejebringe optimal beregningsydelse til neurale netværkstopologier i maskinlæringsapplikationer ved hjælp af den parallelle DSP-arkitektur, distribueret hukommelse og omkonfigurerbarhed af logik og forbindelse til forskellige algoritmer.

DPU opnår over 50% højere ydeevne end nogen konkurrerende CNN'er og udfører GPU'er for et givet magt- eller omkostningsbudget, hævder virksomheden. "Fpga er en verdensslående platform og arkitektur, som er meget fleksibel til fremtidssikring og kan overgå GPU'er i AI med lavere latenstid," tilføjede Fawcett.

Virksomheden har også annonceret, at det sponsorerer en DPhil (PhD0 ved Oxford University) til at studere teknikker til implementering af dyb læringsacceleration på fpgas. Arbejdet skal være i samarbejde med Omniteks egen forskning i AI-computermotorer og algoritmer.