메시지

FPGA 기반의 신경망 가속기가 GPU보다 성능이 뛰어남

8 비트 정수 분해능을 사용하여 GoogLeNet Inception-v1 CNN으로 시연되었습니다. 이 시스템은 초당 16.8 테라 작업 (TOPS)을 달성했으며 Xilinx Virtex UltraScale + XCVU9P-3 fpga에서 초당 5,300 개가 넘는 이미지를 추론 할 수 있습니다. Fawcett은 모듈 식의 확장 가능한 접근 방식을 통해 엣지 및 클라우드의 객체 감지 및 비디오 처리 애플리케이션에 적합하며 데이터 센터 및 지능형 카메라의 추론에 적합하다고 설명했습니다.

DPU는 병렬 DSP 아키텍처, 분산 메모리, 로직 재구성 및 다양한 알고리즘에 대한 연결성을 사용하여 머신 러닝 애플리케이션의 신경망 토폴로지에 최적의 컴퓨팅 성능을 제공하도록 구성 할 수 있습니다.

DPU는 경쟁 CNN보다 50 % 이상 높은 성능을 달성하고 주어진 전력 또는 비용 예산에서 GPU보다 성능이 뛰어납니다. Fawcett는“fpga는 세계 최고의 플랫폼 및 아키텍처로 미래 보장에 매우 유연하고 지연 시간이 줄어 AI에서 GPU보다 성능이 뛰어납니다.

이 회사는 또한 fpgas에 대한 딥 러닝 가속화를 구현하는 기술을 연구하기 위해 옥스포드 대학에서 DPhil (PhD0)을 후원한다고 발표했으며 AI 컴퓨팅 엔진 및 알고리즘에 대한 Omnitek의 자체 연구와 협력 할 것입니다.