Abstract
This study presents a computer architecture, where a last-level cache and a SIMD accelerator are replaced by an associative processor. Associative processor combines data storage and data processing, and functions as a massively parallel SIMD processor and a memory at the same time. An analytic performance model of this computer architecture is introduced. Comparative analysis supported by cycle-accurate simulation and emulation shows that this architecture may outperform a conventional computer architecture comprising a SIMD coprocessor and a shared last-level cache while consuming less power
چکیده
این مطالعه یک معماری کامپیوتری را ارائه می کند که در آن کش سطح آخر و شتاب دهنده ی SIMD با پردازنده ی انجمنی جایگزین شده اند. پردازنده ی انجمنی، ذخیره سازی داده و پردازش داده را به عنوان توابعی از پردازنده ی SIMD موازی و حافظه در یک زمان ترکیب می کند. یک مدل عملکرد تحلیلی برای این معماری کامپیوتری معرفی شده است. تحلیل مقایسه ای با پشتیبانی شبیه سازی دقت سیکل و تقلید نشان می دهد که ممکن است این معماری بهتر از معماری کامپیوترهای معمولی عمل کند که از پردازنده ی SIMD و یک کش آخرین سطح مشترک استفاده می کند و قدرت کمتری دارد.
1-مقدمه
یادگیری ماشین، داده کاوی، مسیریابی شبکه، موتورهای جستجو و سایر کاربردهای داده ی بزرگ به طور قابل توجهی با ماشین های SIMD موازی به سرعت بالایی دست یافته اند [42]. بسیاری از معماری های محاسباتی امروزه شامل پردازنده های SIMD یا برداری هستند [1][16][24]. با این حال انتقال داده ی بین واحدهای پردازش (PU) و حافظه به طور قابل توجهی عملکرد معماری SIMD را محدود می کند [32]...