چکیده
شبکه های عصبی عمیق (DNN) نتایجی بسیار امیدواربخش در تشخیص دید و گفتار رایانه نشان داده اند و به صورت پایه و اساسی برای AI که در همه جا موجود است در آمده اند. پیچیدگی محاسباتی این الگوریتم ها و نیاز به بازدهی بالای انرژی منجر به افزایش موجی در تحقیقات در ارتباط با شتاب دهنده های سخت افزاری شده است. برای کاهش تأخیر و هزینه های انرژی دستیابی به DRAM، اکثر شتاب دهنده های DNN ماهیت فضایی دارند با صدها عنصر پردازشی (PE) که به صورت موازی کار می کنند و مستقیماً با یکدیگر ارتباط برقرار می کنند.
DNN ها با نرخ بالایی در حال تکامل هستند و در جدیدترین توپولوژی ها داشتن لایه های پیچشی، بازگشتی، ادغام و کاملاً متصل با انداره ورودی و فیلترهای متفاوت متداول است. ممکن است متراکم یا پراکنده باشند. همچنین می توانند به روشهای بی شماری (داخل یا سراسر لایه ها) تقسیم شوند تا از استفاده مجدد از داده ها (خروجی های میانی و وزن ها) بهره برداری کنند. همه موارد فوق می توانند منجر به الگوهای جریان داده متفاوت در زیر لایه شتاب دهنده شوند.
متأسفانه، بیشتر شتاب دهنده های DNN هنگام انجام یک طراحی کد دقیق از PE و تراشه شبکه (NOC)، فقط از الگوهای ثابت جریان گردش داده پشتیبانی می کنند. در حقیقت، اکثر آنها فقط برای ترافیک در یک لایه پیچشی بهینه شده اند. این نقشه برداری از دلخواه دلخواه داده ها روی پارچه را به چالش می کشد و می تواند منجر به کم استفاده شدن منابع محاسبه موجود شود.
شتاب دهنده های DNN برای فعال سازی استقرار گسترده نیاز به برنامه ریزی دارند. برای اینکه قابلیت برنامه ریزی داشته باشند، باید از داخل بتوانند تنظیم شوند تا از الگوهای مختلف جریان داده ای که می توانند روی آنها نگاشت شوند، پشتیبانی کنند. برای رفع این نیاز، ما MAERI را ارائه می دهیم، که یک شتاب دهنده DNN است و با مجموعه ای از بلوک های ساختمانی مدولار و قابل تنظیم ساخته شده است و می تواند با پیکربندی مناسب سوئیچ های کوچک، به راحتی از پارتیشن ها و نگاشت های DNN بی شمار پشتیبانی کند. MAERI، 8 الی 459 درصد بهره برداری بهتر در میان چندین نقشه برداری جریان داده بر روی نقاط شروع محصولات محکم NoC ارائه می نماید.