Noticias

Aceleradores de red neuronal para FPGA Lattice

Ambas están destinadas a implementar redes neuronales en productos de consumo e industriales de última generación. No son adecuados para la capacitación en red, que debe hacerse en otro lugar.

El "acelerador de red neuronal binaria (BNN)" admite pesos de 1 bit, tiene cuantificación de activación de 1 bit y está diseñado para usarse con los FPGA iP40 UltraPlus de la empresa.

La combinación de acelerador y FPGA está destinada a aplicaciones siempre activas, como la detección verbal de frases clave, la detección de rostros y la detección de objetos.

Lattice-BNN-acceleratorLos parámetros predichos de la aplicación BNN + iCE40 UltraPlus son:

  • Red neuronal de 1 bit
  • Consumo activo de 1-10mW
  • Huella de 5,5 mm2
  • ~ $ 1 bom

El segundo producto, "acelerador de red neuronal convolucional (CNN)", admite una selección de datos de 1, 8 y 16 bits para pesos y activación, está dirigido a FPGA ECP5, que generalmente están destinados para uso de video.

Para ahorrar recursos FPGA, se pueden mezclar y combinar diferentes anchos de palabra (1, 8 o 16 bits) en diferentes capas de la red neuronal.

Esta combinación de acelerador y FPGA está destinada a aplicaciones que incluyen el seguimiento facial, el seguimiento de objetos, la detección de signos de velocidad y el recuento de objetos.

Lattice-CNN-accelerator

Los parámetros de aplicación CNN + ECP5 predichos son:

  • Red de 1, 8 o 16 bits
  • <1W active consumption
  • Huella de 100 mm2
  • ~ $ 10 bom

Para el desarrollo de software, la empresa presenta un compilador de redes neuronales compatible con los sistemas de desarrollo de redes Caffe y TensorFlow.

Según el director de marketing de Lattice, Deepak Boppana, el compilador no requiere experiencia previa en RTL, y también analizará y simulará diseños.

El plan es, dijo Boppana, que el compilador se utilizará junto con el entorno de desarrollo Radiant de la empresa para la combinación BNN + iCE40 UltraPlus, o su entorno de desarrollo Diamond para CNN + EC5P.

Para los clientes que no están seguros de cómo desarrollar una aplicación basada en la red neuronal, la firma se ha asociado con empresas de servicios de diseño que incluyen Colorado Engineering, Wipro, Softnautincs y VectorBlox.

Las placas de desarrollo de hardware ya están disponibles para iCE40 UltraPlus y ECP5.

Se esperan aplicaciones de puenteo de interfaz y agregación de datos en aplicaciones de IoT de alto volumen, incluidos altavoces inteligentes, cámaras de vigilancia, robots industriales y drones.

Se proporcionan diseños de referencia para: detección de rostros, detección de frases clave (iCE40 UltraPlus) y para el EC5P: conteo de objetos, seguimiento de rostros y detección de signos de velocidad.

Los aceleradores tienen la marca ‘sensAI‘.