Message

L'accélérateur de réseau neuronal basé sur FPGA surpasse les GPU

Il a été démontré comme un CNN GoogLeNet Inception-v1, en utilisant une résolution entière de huit bits. Il a réalisé 16,8 opérations terra par seconde (TOPS) et peut déduire plus de 5 300 images par seconde sur un fpga Xilinx Virtex UltraScale + XCVU9P-3. L'approche modulaire et évolutive le rend approprié pour les applications de détection d'objets et de traitement vidéo en périphérie et dans le cloud, a expliqué Fawcett, ainsi que pour l'inférence dans les centres de données et les caméras intelligentes.

Le DPU peut être configuré pour fournir des performances de calcul optimales pour les topologies de réseau neuronal dans les applications d'apprentissage automatique, en utilisant l'architecture DSP parallèle, la mémoire distribuée et la reconfigurabilité de la logique et de la connectivité pour différents algorithmes.

Le DPU atteint des performances supérieures à 50% par rapport à tous les CNN concurrents et surpasse les GPU pour un budget de puissance ou de coût donné, affirme la société. «Le fpga est une plate-forme et une architecture de classe mondiale, qui est très flexible pour la pérennité et peut surpasser les GPU en IA, avec une latence plus faible», a ajouté Fawcett.

La société a également annoncé qu'elle sponsorisait un DPhil (PhD0 à l'Université d'Oxford pour étudier les techniques de mise en œuvre de l'accélération de l'apprentissage en profondeur sur les fpgas. Les travaux seront menés en collaboration avec les propres recherches d'Omnitek sur les moteurs et algorithmes de calcul de l'IA.