انمجن برنامه نویسی Xilinx ادعا کرده است که می تواند بالاترین کارایی شبکه های عصبی کانولوشنی ( CNN ) را بر روی یک تراشه قابل برنامه نویسی FPGA ایجاد کند. مدیر عامل شرکت Roger Fawcett می گوید که واحد پردازنده یادگیری عمیق ( DPU ) به کمک FPGA قابل پیاده سازی می باشد و چشم اندازه آینده است.
کاربرد تراشه قابل برنامه نویسی FPGA
این تراشه با استفاده از وضوح هشت بیتی به عنوان یک GoogLeNet Inception-v1 CNN نشان داده شده است. FPGA ، در هر ثانیه، 16.8 ترا عملیات (TOPS) انجام می دهد و می تواند در یک FPGA Xilinx Virtex UltraScale + XCVU9P-3 بیش از 5،300 تصویر را در ثانیه تشخیص دهد.
ویژگی ماژولار ( modular ) و انعطاف پذیر بودن تراشه FPGA ، سبب شده تا برای پردازش های ویدئو و تشخیص اشیا در فضای ابری و همچنین در پایگاه های داده و دوربین های هوشمند کاربرد دارد.
عملکرد واحد پردازنده یادگیری عمیق DPU
DPU را می توان با استفاده از معماری موازی DSP ، حافظه توزیع شده و تنظیم مجدد منطق و اتصال برای الگوریتم های مختلف پیکربندی کرد تا عملکرد محاسباتی بهینه را برای توپولوژی های شبکه های عصبی در کاربردهای یادگیری ماشین فراهم آورد.
کارایی DPU در یک انرژی و بودجه مشخص، حدود 50% بالاتر از شبکه های CNN می باشد و عملکرد بهتری نسبت به GPU ها نیز دارد. تراشه قابل برنامه نویسی FPGA یک پلتفرم و معماری تجاری در جهان محسوب می شود که بسیار انعطاف پذیر است و در هوش مصنوعی نیز نسبت به GPU ها سریعتر است و تاخیر کمتری دارد.
شرکت Roger Fawcett اعلام کرده است كه با همکاری محققین شرکت Omnitek که در حوزه الگوریتم ها و موتورهای محاسباتی هوش مصنوعی پژوهش می کنند، از دانشجویان دکتری که بر روی تکنیک های پیاده سازی شبکه عصبی عمیق بر روی تراشه قابل برنامه نویسی FPGA در دانشگاه آكسفورد تحقیق و مطالعه می کنند، حمایت مالی خواهد کرد.