Aktualności

Akcelerator sieci neuronowych oparty na FPGA przewyższa procesory graficzne

Zostało to zademonstrowane jako GoogLeNet Inception-v1 CNN, przy użyciu ośmiobitowej rozdzielczości całkowitej. Osiąga 16,8 terra operacji na sekundę (TOPS) i może wywnioskować ponad 5300 obrazów na sekundę na Xilinx Virtex UltraScale + XCVU9P-3 fpga. Modułowe, skalowalne podejście sprawia, że nadaje się do wykrywania obiektów i przetwarzania wideo na obrzeżach iw chmurze, wyjaśnił Fawcett, a także do wnioskowania w centrach danych i inteligentnych kamerach.

DPU można skonfigurować w celu zapewnienia optymalnej wydajności obliczeniowej dla topologii sieci neuronowych w aplikacjach uczenia maszynowego, wykorzystując równoległą architekturę DSP, pamięć rozproszoną oraz możliwość rekonfiguracji logiki i łączności dla różnych algorytmów.

DPU osiąga ponad 50% wyższą wydajność niż jakiekolwiek konkurencyjne sieci CNN i przewyższa procesory graficzne dla danego budżetu mocy lub kosztów, twierdzi firma. „FPGA to najlepsza na świecie platforma i architektura, która jest bardzo elastyczna pod kątem zabezpieczenia na przyszłość i może przewyższyć GPU w AI, z mniejszym opóźnieniem”, dodał Fawcett.

Firma ogłosiła również, że sponsoruje program DPhil (PhD0 na Oxford University) w celu zbadania technik wdrażania przyspieszania głębokiego uczenia się na plikach fpgas. Prace będą prowadzone we współpracy z własnymi badaniami Omnitek nad silnikami obliczeniowymi i algorytmami AI.