Informações

Aceleradores de rede neural para FPGAs em rede

Ambos têm como objetivo implementar redes neurais em produtos de ponta para redes de consumidores e industriais. Eles não são adequados para treinamento em rede, o que deve ser feito em outro lugar.

O 'acelerador de rede neural binarizada (BNN)' suporta pesos de 1bit, possui quantização de ativação de 1bit e foi projetado para ser usado com os FPGAs iCE40 UltraPlus da empresa.

A combinação de acelerador e FPGA destina-se a aplicativos sempre ativos, como detecção de frase-chave verbal, detecção de rosto e detecção de objetos.

Lattice-BNN-acceleratorOs parâmetros de aplicação previstos do BNN + iCE40 UltraPlus são:

  • Rede neural de 1 bits
  • 1-10mW de consumo ativo
  • Pegada de 5.5mm2
  • ~ $ 1 bom

O segundo produto, 'acelerador de rede neural convolucional (CNN)', suporta uma escolha de dados de 1, 8 e 16 bits para pesos e ativação, destinado aos FPGAs ECP5 - que geralmente são destinados ao uso de vídeo.

Para economizar recursos do FPGA, diferentes larguras de palavras (1, 8 ou 16 bits) podem ser combinadas e combinadas em diferentes camadas da rede neural.

Essa combinação de acelerador e FPGA destina-se a aplicativos como rastreamento de faces, rastreamento de objetos, detecção de sinais de velocidade e contagem de objetos.

Lattice-CNN-accelerator

Os parâmetros de aplicação CNN + ECP5 previstos são:

  • Rede de 1, 8 ou 16 bits
  • <1W active consumption
  • Pegada de 100mm2
  • ~ $ 10 bom

Para o desenvolvimento de software, a empresa está introduzindo um compilador de rede neural compatível com os sistemas de desenvolvimento de rede Caffe e TensorFlow.

De acordo com Deepak Boppana, diretor de marketing da Lattice, o compilador não requer experiência anterior em RTL e também analisará e simulará projetos.

O plano é, disse Boppana, que o compilador seja usado juntamente com o ambiente de desenvolvimento Radiant da empresa para a combinação BNN + iCE40 UltraPlus, ou seu ambiente de desenvolvimento Diamond para CNN + EC5P.

Para os clientes que não sabem como desenvolver um aplicativo baseado em rede neural, a empresa firmou parceria com empresas de serviços de design, incluindo Colorado Engineering, Wipro, Softnautincs e VectorBlox.

As placas de desenvolvimento de hardware já estão disponíveis para o iCE40 UltraPlus e ECP5.

Aplicativos de ponte de interface e agregação de dados são esperados em aplicativos de IoT de alto volume, incluindo alto-falantes inteligentes, câmeras de vigilância, robôs industriais e drones.

Projetos de referência estão sendo fornecidos para: detecção de rosto, detecção de frase-chave (iCE40 UltraPlus) e para o EC5P: contagem de objetos, rastreamento de rosto e detecção de sinal de velocidade.

Os aceleradores são da marca ‘sensAI‘.