Notizie

L'acceleratore di rete neurale basato su FPGA supera le GPU

È stato dimostrato come GoogLeNet Inception-v1 CNN, utilizzando una risoluzione intera a otto bit. Ha raggiunto 16,8 operazioni al secondo (TOPS) e può dedurre oltre 5.300 immagini al secondo su un fpga Xilinx Virtex UltraScale + XCVU9P-3. L'approccio modulare e scalabile lo rende adatto per il rilevamento di oggetti e le applicazioni di elaborazione video ai margini e nel cloud, ha spiegato Fawcett, nonché per l'inferenza nei data center e nelle telecamere intelligenti.

La DPU può essere configurata per fornire prestazioni di calcolo ottimali per le topologie di reti neurali nelle applicazioni di machine learning, utilizzando l'architettura DSP parallela, la memoria distribuita e la riconfigurabilità della logica e della connettività per diversi algoritmi.

La DPU raggiunge prestazioni superiori del 50% in più rispetto a tutte le CNN concorrenti e supera le GPU per un determinato budget di potenza o di costo, afferma la società. "La fpga è una piattaforma e un'architettura all'avanguardia nel mondo, che è molto flessibile per il futuro e può superare le GPU nell'IA, con una latenza inferiore", ha aggiunto Fawcett.

La società ha anche annunciato che sta sponsorizzando un DPhil (PhD0 presso l'Università di Oxford per studiare le tecniche per implementare l'accelerazione del deep learning su fpgas. Il lavoro sarà in collaborazione con la ricerca di Omnitek sui motori di calcolo e gli algoritmi di intelligenza artificiale.