Balita

FPGA na batay sa neural network accelerator outperforms GPUs

Ipinakita ito bilang isang GoogLeNet inception-v1 CNN, gamit ang walong-bit na resolusyon ng integer. Nakamit nito ang 16.8 na operasyon ng terra bawat segundo (TOPS) at maaaring maglagay ng higit sa 5,300 mga imahe bawat segundo sa isang Xilinx Virtex UltraScale + XCVU9P-3 fpga. Ang modular, nasusukat na diskarte, ay ginagawang angkop para sa pagtuklas ng object at mga aplikasyon sa pagproseso ng video sa gilid at sa ulap, ipinaliwanag ni Fawcett, pati na rin para sa pagkilala sa mga sentro ng data at intelihente na mga camera.

Ang DPU ay maaaring mai-configure upang magbigay ng pinakamainam na pagganap ng compute para sa mga topologies ng network ng neural sa mga aplikasyon ng pag-aaral ng machine, gamit ang kahilera na arkitektura ng DSP, ipinamamahagi ng memorya at muling pagsasaayos ng lohika at pagkakakonekta para sa iba't ibang mga algorithm.

Nakamit ng DPU ang higit sa 50% na mas mataas na pagganap kaysa sa anumang mga nakikipagkumpitensya sa CNN at out-performs GPUs para sa isang naibigay na kapangyarihan o gastos sa gastos, inaangkin ng kumpanya. "Ang fpga ay isang platform ng pagbagsak sa mundo at arkitektura, na kung saan ay napaka-kakayahang umangkop para sa hinaharap-pagpapatunay at maaaring mas malalampasan ang mga GPU sa AI, na may mas mababang latency," idinagdag Fawcett.

Inanunsyo din ng kumpanya na ito ay nag-sponsor ng isang DPhil (PhD0 sa Oxford University upang pag-aralan ang mga pamamaraan para sa pagpapatupad ng malalim na pag-aaral ng pag-aaral sa fpgas. Ang gawain ay makikipagtulungan sa sariling pananaliksik ng Omnitek sa mga compute engine at algorithm ng AI.