Tin tức

Bộ tăng tốc mạng thần kinh dựa trên nền tảng vượt trội so với GPU

Nó được chứng minh là một CNN GoogLeNet Inception-v1, sử dụng độ phân giải số nguyên tám bit. Nó đạt được 16,8 terra hoạt động mỗi giây (TOPS) và có thể suy ra hơn 5.300 hình ảnh mỗi giây trên Xilinx Virtex UltraScale + XCVU9P-3 fpga. Phương pháp mô đun, có thể mở rộng, làm cho nó phù hợp cho các ứng dụng phát hiện và xử lý video ở rìa và trên đám mây, Fawcett giải thích, cũng như suy luận trong các trung tâm dữ liệu và máy ảnh thông minh.

DPU có thể được cấu hình để cung cấp hiệu suất tính toán tối ưu cho các cấu trúc liên kết mạng thần kinh trong các ứng dụng học máy, sử dụng kiến trúc DSP song song, bộ nhớ phân tán và khả năng cấu hình lại logic và kết nối cho các thuật toán khác nhau.

DPU đạt được hiệu suất cao hơn 50% so với bất kỳ CNN cạnh tranh nào và GPU hoạt động vượt trội cho một nguồn điện hoặc chi phí nhất định, công ty tuyên bố. Fpga là một nền tảng và kiến trúc nổi tiếng thế giới, rất linh hoạt để chứng minh trong tương lai và có thể vượt trội hơn GPU trong AI, với độ trễ thấp hơn, Fawcett bổ sung.

Công ty cũng đã tuyên bố họ đang tài trợ cho DPhil (Tiến sĩ0 tại Đại học Oxford để nghiên cứu các kỹ thuật để thực hiện tăng tốc học tập sâu trên fpgas. Công việc sẽ được phối hợp với nghiên cứu của Omnitek sâu về các công cụ tính toán và thuật toán AI.