Новости

Ускоритель нейронных сетей на базе FPGA превосходит графические процессоры

Он был продемонстрирован как GoogLeNet Inception-v1 CNN с использованием восьмибитного целочисленного разрешения. Он достиг 16,8 терра операций в секунду (TOPS) и может выводить более 5300 изображений в секунду на FPGA Xilinx Virtex UltraScale + XCVU9P-3. Модульный, масштабируемый подход делает его пригодным для приложений обнаружения объектов и обработки видео на границе и в облаке, пояснил Фосетт, а также для вывода данных в центрах обработки данных и интеллектуальных камерах.

DPU может быть сконфигурирован для обеспечения оптимальной производительности вычислений для топологий нейронных сетей в приложениях машинного обучения, используя параллельную архитектуру DSP, распределенную память и реконфигурируемость логики и возможности подключения для различных алгоритмов.

DPU достигает более чем на 50% более высокой производительности, чем любые конкурирующие CNN, и превосходит GPU при данной мощности или стоимости, утверждает компания. «Fpga - это лучшая в мире платформа и архитектура, которая очень гибкая для будущего и может превзойти графические процессоры в AI с меньшей задержкой», - добавил Фосетт.

Компания также объявила, что спонсирует DPhil (PhD0 в Оксфордском университете) для изучения методов реализации ускорения глубокого обучения на fpgas. Работа будет проводиться в сотрудничестве с собственными исследованиями Omnitek в области вычислительных механизмов и алгоритмов AI.