Nachrichten

FPGA-basierter neuronaler Netzwerkbeschleuniger übertrifft GPUs

Es wurde als GoogLeNet Inception-v1 CNN mit einer 8-Bit-Ganzzahlauflösung demonstriert. Es erreichte 16,8 Terra-Operationen pro Sekunde (TOPS) und kann auf einem Xilinx Virtex UltraScale + XCVU9P-3 fpga über 5.300 Bilder pro Sekunde ableiten. Der modulare, skalierbare Ansatz macht es für Objekterkennungs- und Videoverarbeitungsanwendungen am Rande und in der Cloud geeignet, erklärte Fawcett, sowie für Inferenzen in Rechenzentren und intelligenten Kameras.

Die DPU kann so konfiguriert werden, dass sie eine optimale Rechenleistung für neuronale Netzwerktopologien in Anwendungen für maschinelles Lernen bietet, wobei die parallele DSP-Architektur, der verteilte Speicher und die Rekonfigurierbarkeit von Logik und Konnektivität für verschiedene Algorithmen verwendet werden.

Die DPU erzielt eine um über 50% höhere Leistung als alle konkurrierenden CNNs und übertrifft GPUs für ein bestimmtes Leistungs- oder Kostenbudget, so das Unternehmen. "Die fpga ist eine weltweit führende Plattform und Architektur, die sehr flexibel für die Zukunftssicherheit ist und GPUs in AI mit geringerer Latenz übertreffen kann", fügte Fawcett hinzu.

Das Unternehmen hat außerdem angekündigt, ein DPhil (PhD0 an der Universität Oxford) zu sponsern, um Techniken zur Implementierung einer Beschleunigung des tiefen Lernens auf fpgas zu untersuchen. Die Arbeit wird in Zusammenarbeit mit Omniteks eigener Forschung zu KI-Rechenmaschinen und -Algorithmen erfolgen.