Informações

O acelerador de rede neural baseado em FPGA supera as GPUs

Foi demonstrado como uma CNN do GoogLeNet Inception-v1, usando resolução inteira de oito bits. Ele alcançou 16,8 operações terrestres por segundo (TOPS) e pode inferir mais de 5.300 imagens por segundo em um Xilinx Virtex UltraScale + XCVU9P-3 fpga. A abordagem modular e escalável o torna adequado para aplicativos de detecção de objetos e processamento de vídeo na borda e na nuvem, explicou Fawcett, bem como para inferência em data centers e câmeras inteligentes.

A DPU pode ser configurada para fornecer desempenho ideal de computação para topologias de redes neurais em aplicativos de aprendizado de máquina, usando a arquitetura DSP paralela, memória distribuída e reconfigurabilidade da lógica e conectividade para diferentes algoritmos.

A DPU alcança desempenho 50% mais alto do que as CNNs concorrentes e supera as GPUs para um determinado orçamento de energia ou custo, afirma a empresa. “O fpga é uma plataforma e arquitetura de ponta mundial, que é muito flexível para provas futuras e pode superar as GPUs em IA, com menor latência”, acrescentou Fawcett.

A empresa também anunciou que está patrocinando um DPhil (PhD0 na Universidade de Oxford para estudar técnicas para implementar a aceleração do aprendizado profundo em fpgas. O trabalho será realizado em colaboração com a própria pesquisa da Omnitek em mecanismos de computação e algoritmos de IA).