Zprávy

Akcelerátory neuronové sítě pro FPGA v mříži

Oba jsou zaměřeny na implementaci neuronových sítí v produktech spotřebitelů a průmyslových sítí. Nejsou vhodné pro síťové školení, které musí být provedeno jinde.

„Akcelerátor binarizované neuronové sítě (BNN)“ podporuje 1bitové váhy, má aktivaci 1bitové aktivace a je navržen pro použití s ​​FPGA firmy iCE40 UltraPlus.

Kombinace akcelerátoru a FPGA je určena pro vždy aplikace, jako je detekce slovních klíčových frází, detekce obličeje a detekce objektů.

Lattice-BNN-acceleratorPředpokládané parametry aplikace BNN + iCE40 UltraPlus jsou:

  • 1bitová neuronová síť
  • 1-10mW aktivní spotřeba
  • 5,5 mm2 stopa
  • ~ 1 $ bom

Druhý produkt, „urychlovač konvoluční neuronové sítě (CNN)“, podporuje výběr 1, 8 a 16bitových dat pro váhy i aktivaci, je zaměřen na FPGA ECP5 - které jsou obecně určeny pro použití videa.

Pro úsporu prostředků FPGA lze různé šířky slov (1, 8 nebo 16 bitů) kombinovat a porovnávat v různých vrstvách neuronové sítě.

Tato kombinace urychlovače a FPGA je určena pro aplikace včetně sledování obličeje, sledování objektů, detekce rychlostních značek a počítání objektů.

Lattice-CNN-accelerator

Předpokládané parametry aplikace CNN + ECP5 jsou:

  • 1, 8 nebo 16bitová síť
  • <1W active consumption
  • 100 mm2 stopa
  • ~ 10 $ bom

Pro vývoj softwaru společnost zavádí kompilátor neuronových sítí kompatibilní s vývojovými systémy Caffe i TensorFlow.

Podle marketingového ředitele společnosti Lattice Deepak Boppana kompilátor nevyžaduje žádné předchozí zkušenosti s RTL a bude také analyzovat a simulovat návrhy.

Podle Boppany je plánováno, že kompilátor bude použit spolu s vývojovým prostředím firmy Radiant pro kombinaci BNN + iCE40 UltraPlus nebo s vývojovým prostředím Diamond pro CNN + EC5P.

Pro zákazníky, kteří si nejsou jisti, jak vyvinout aplikaci založenou na neuronové síti, se firma spojila s společnostmi poskytujícími designové služby, včetně společností Colorado Engineering, Wipro, Softnautincs a VectorBlox.

Desky pro vývoj hardwaru jsou již k dispozici pro modely iCE40 UltraPlus a ECP5.

Ve velkoobjemových aplikacích IoT včetně inteligentních reproduktorů, sledovacích kamer, průmyslových robotů a robotů se očekávají aplikace pro přemostění rozhraní a agregaci dat.

Referenční návrhy jsou poskytovány pro: detekci obličeje, detekci klíčových frází (iCE40 UltraPlus) a pro EC5P: počítání objektů, sledování obličeje a detekci rychlostních značek.

Urychlovače jsou označeny jako „sensAI“.