Vijesti

Akcelerator neuronske mreže temeljen na FPGA nadmašuje GPU

Dokazano je kao GoogLeNet Inception-v1 CNN, koristeći osmobitnu cjelobrojnu rezoluciju. Postigao je 16,8 teraških operacija u sekundi (TOPS) i može locirati preko 5.300 slika u sekundi na Xilinx Virtex UltraScale + XCVU9P-3 fpga. Modularan, skalabilan pristup čini ga pogodnim za otkrivanje objekata i aplikacije za obradu videozapisa na rubu i u oblaku, objasnio je Fawcett, kao i za zaključivanje u podatkovnim centrima i inteligentnim kamerama.

DPU se može konfigurirati za pružanje optimalnih računarskih performansi za topologije neuronske mreže u aplikacijama strojnog učenja, koristeći paralelnu DSP arhitekturu, raspodijeljenu memoriju i rekonfiguriranje logike i povezivanja za različite algoritme.

DPU postiže preko 50% veće performanse od bilo kojeg konkurentskog CNN-a i nadmašuje GPU-ove za određeni proračun snage ili troškova, tvrdi tvrtka. "Fpga je platforma i arhitektura koja se bije u svijetu, a koja je vrlo fleksibilna za provjeru u budućnosti i može nadmašiti GPU u AI, s nižim kašnjenjem", dodao je Fawcett.

Tvrtka je također objavila da sponzorira DPhil (PhD0 na Sveučilištu Oxford za proučavanje tehnika za implementaciju ubrzanja dubokog učenja na fpgas. Rad će biti u suradnji s Omnitekovim vlastitim istraživanjem AI računskih motora i algoritama.