Noticias

El acelerador de red neuronal basado en FPGA supera a las GPU

Se demostró como una GoogLeNet Inception-v1 CNN, utilizando resolución de enteros de ocho bits. Logró 16,8 operaciones de terra por segundo (TOPS) y puede inferir más de 5,300 imágenes por segundo en una fpga Xilinx Virtex UltraScale + XCVU9P-3. El enfoque modular y escalable lo hace adecuado para la detección de objetos y las aplicaciones de procesamiento de video en el borde y en la nube, explicó Fawcett, así como para inferencia en centros de datos y cámaras inteligentes.

La DPU se puede configurar para proporcionar un rendimiento informático óptimo para las topologías de red neuronal en aplicaciones de aprendizaje automático, utilizando la arquitectura DSP paralela, la memoria distribuida y la reconfigurabilidad de la lógica y la conectividad para diferentes algoritmos.

El DPU logra un rendimiento más del 50% más alto que cualquier CNN de la competencia y supera el rendimiento de las GPU para un presupuesto de potencia o costo, afirma la compañía. "El fpga es una plataforma y arquitectura que supera el mundo, que es muy flexible para el futuro y puede superar a las GPU en IA, con menor latencia", agregó Fawcett.

La compañía también ha anunciado que está patrocinando un DPhil (PhD0 en la Universidad de Oxford para estudiar técnicas para implementar la aceleración del aprendizaje profundo en fpgas. El trabajo será en colaboración con la propia investigación de Omnitek en motores y algoritmos de computación de inteligencia artificial.