Nyheter

FPGA-baserade neurala nätverk accelerator överträffar GPU: er

Det demonstrerades som en GoogLeNet Inception-v1 CNN, med användning av åtta-bitars heltalupplösning. Den uppnådde 16,8 terra-operationer per sekund (TOPS) och kan dra slutsatser över 5 300 bilder per sekund på en Xilinx Virtex UltraScale + XCVU9P-3 fpga. Det modulära, skalbara tillvägagångssättet gör det lämpligt för objektdetektering och videobehandlingsapplikationer i kanten och i molnet, förklarade Fawcett, såväl som för slutsatser i datacenter och intelligenta kameror.

DPU: n kan konfigureras för att ge optimal datorprestanda för neurala nätverkstopologier i maskininlärningsapplikationer, med hjälp av den parallella DSP-arkitekturen, distribuerat minne och omkonfigurerbarhet av logik och anslutning för olika algoritmer.

DPU uppnår över 50% högre prestanda än någon tävlande CNN och utpresterar GPU för en given kraft- eller kostnadsbudget, hävdar företaget. "Fpga är en världsslagen plattform och arkitektur, som är mycket flexibel för framtidssäkerhet och kan överträffa GPU: er i AI, med lägre latens," tilllade Fawcett.

Företaget har också meddelat att det sponsrar en DPhil (PhD0 vid Oxford University för att studera tekniker för att implementera djup inlärningsacceleration på fpgas. Arbetet kommer att samarbeta med Omniteks egen forskning om AI-datormotorer och algoritmer.