Nyheter

FPGA-baserte nevrale nettverksakselerator overgår GPU-er

Det ble demonstrert som en GoogLeNet Inception-v1 CNN ved å bruke åtte-bits heltalloppløsning. Den oppnådde 16,8 terra-operasjoner per sekund (TOPS) og kan innlede over 5.300 bilder per sekund på en Xilinx Virtex UltraScale + XCVU9P-3 fpga. Den modulære, skalerbare tilnærmingen gjør den egnet for objektdeteksjon og videoprosesseringsapplikasjoner i kanten og i skyen, forklarte Fawcett, så vel som for slutninger i datasentre og intelligente kameraer.

DPU-en kan konfigureres for å gi optimal beregningsytelse for nevrale nettverkstopologier i maskinlæringsapplikasjoner, ved bruk av den parallelle DSP-arkitekturen, distribuert minne og omkonfigurerbarhet av logikk og tilkobling for forskjellige algoritmer.

DPU oppnår over 50% høyere ytelse enn noen konkurrerende CNN og utfører GPUer for et gitt kraft- eller kostnadsbudsjett, hevder selskapet. "Fpga er en verdensslående plattform og arkitektur, som er veldig fleksibel for fremtidssikring og kan utkonkurrere GPUer i AI, med lavere ventetid," la Fawcett til.

Selskapet har også kunngjort at det sponser en DPhil (PhD0 ved Oxford University for å studere teknikker for implementering av dyp læringsakselerasjon på fpgas. Arbeidet skal være i samarbeid med Omniteks egen forskning på AI-beregningsmotorer og algoritmer.