Nieuws

Op FPGA gebaseerde neurale netwerkversneller presteert beter dan GPU's

Het werd gedemonstreerd als een GoogLeNet Inception-v1 CNN, met een resolutie van acht bits voor gehele getallen. Het behaalde 16,8 terra-operaties per seconde (TOPS) en kan meer dan 5300 beelden per seconde afleiden op een Xilinx Virtex UltraScale + XCVU9P-3 fpga. De modulaire, schaalbare aanpak maakt het geschikt voor objectdetectie en videoverwerkingstoepassingen aan de rand en in de cloud, legt Fawcett uit, evenals voor gevolgtrekking in datacenters en intelligente camera's.

De DPU kan worden geconfigureerd om optimale rekenprestaties te leveren voor neurale netwerktopologieën in machine learning-toepassingen, met behulp van de parallelle DSP-architectuur, gedistribueerd geheugen en herconfigureerbaarheid van logica en connectiviteit voor verschillende algoritmen.

De DPU behaalt meer dan 50% betere prestaties dan alle concurrerende CNN's en presteert beter dan GPU's voor een bepaald stroom- of kostenbudget, beweert het bedrijf. "De FPGA is een platform en architectuur van wereldklasse, die zeer flexibel is voor toekomstbestendigheid en GPU's in AI kan overtreffen, met een lagere latentie," voegde Fawcett toe.

Het bedrijf heeft ook aangekondigd dat het een DPhil (PhD0 aan de universiteit van Oxford promoot om technieken te bestuderen voor het implementeren van deep learning-versnelling op fpga's. Het werk zal in samenwerking zijn met Omniteks eigen onderzoek naar AI-rekenmachines en algoritmen.