Новости

Нейросетевые ускорители для решетчатых ПЛИС

Оба нацелены на внедрение нейронных сетей в потребительские и промышленные сетевые продукты. Они не подходят для обучения сети, что должно быть сделано в другом месте.

«Ускоритель бинаризованной нейронной сети (BNN)» поддерживает 1-битные веса, имеет 1-битное квантование активации и предназначен для использования с FPGA фирмы iCE40 UltraPlus.

Комбинация ускорителя и FPGA предназначена для постоянно включенных приложений, таких как обнаружение словесных фраз, обнаружение лиц и обнаружение объектов.

Lattice-BNN-acceleratorПредсказанные параметры приложения BNN + iCE40 UltraPlus:

  • 1-битная нейронная сеть
  • 1-10 мВт активного потребления
  • 5,5 мм2
  • ~ 1 доллар США

Второй продукт, «ускоритель сверточной нейронной сети (CNN)», поддерживает выбор 1, 8 и 16-битных данных как для веса, так и для активации, нацелен на FPGA ECP5, которые обычно предназначены для видео.

Чтобы сэкономить ресурсы ПЛИС, разную ширину слова (1, 8 или 16 бит) можно смешивать и сопоставлять в разных слоях нейронной сети.

Эта комбинация ускорителя и ПЛИС предназначена для таких приложений, как отслеживание лиц, отслеживание объектов, определение скоростных знаков и подсчет объектов.

Lattice-CNN-accelerator

Предсказанные параметры приложения CNN + ECP5:

  • 1, 8 или 16-битная сеть
  • <1W active consumption
  • 100 мм2
  • ~ 10 долларов США

Для разработки программного обеспечения фирма представляет нейросетевой компилятор, совместимый с системами разработки сетей Caffe и TensorFlow.

По словам директора по маркетингу Lattice Дипака Боппана, компилятор не требует предварительного опыта работы с RTL, а также будет анализировать и моделировать проекты.

По словам Боппаны, план заключается в том, что компилятор будет использоваться вместе со средой разработки Radiant для комбинации BNN + iCE40 UltraPlus или среды разработки Diamond для CNN + EC5P.

Для клиентов, не знающих, как разработать приложение на основе нейронной сети, фирма заключила партнерские отношения с такими компаниями, как Colorado Engineering, Wipro, Softnautincs и VectorBlox.

Платы для разработки аппаратного обеспечения уже доступны для iCE40 UltraPlus и ECP5.

Ожидается, что межсетевые интерфейсы и приложения для агрегирования данных будут использоваться в приложениях IoT большого объема, включая интеллектуальные колонки, камеры наблюдения, промышленные роботы и беспилотники.

Для эталонных проектов предусмотрены: обнаружение лиц, обнаружение ключевых фраз (iCE40 UltraPlus), а для EC5P: подсчет объектов, отслеживание лиц и обнаружение знаков скорости.

Ускорители являются фирменными «SensAI».