Abstract
One architectural method for increasing processor performance involves increasing the frequency by implementing deeper pipelines. This paper will explore the relationship between performance and pipeline depth using a Pentium® 4 processor like architecture as a baseline and will show that deeper pipelines can continue to increase performance
This paper will show that the branch misprediction latency is the single largest contributor to performance degradation as pipelines are stretched, and therefore branch prediction and fast branch recovery will continue to increase in importance. We will also show that higher performance cores, implemented with longer pipelines for example, will put more pressure on the memory system, and therefore require larger on-chip caches. Finally, we will show that in the same process technology, designing deeper pipelines can increase the processor frequency by 100%, which, when combined with larger on-chip caches can yield performance improvements of 35% to 90% over a Pentium® 4 like processor
چکیده
روش معماری خاصی برای افزایش کارایی پردازنده وجود دارد که میزان فرکانس را با پیاده سازی خط لوله های عمقی تر افزایش می دهد. این مقاله با استفاده از یک پردازنده نسل پنتیوم چهار که به عنوان یک معماری پایه در نظر گرفته شده است به تشریح رابطه بین کارایی و عمق خط لوله می پردازد و نشان می دهد که خط لوله های عمقی تر می تواند سبب افزایش کارایی شوند.
این مقاله نشان خواهد داد که نهفتگی انشعاب غیر قابل پیش بینی، در تنزل کارایی خطوط لوله ایی که بسط داده شده اند، بیشترین نقش را ایفا می کنند و بنابراین پیش بینی انشعاب و بازیابی انشعاب سریع می تواند به افزایش کارایی کمک کنند. همچنین این مقاله نشان خواهد داد که هسته های که با کارایی بالاتر و با استقاده از خطوط لوله ایی طویل تر پیاده سازی شده اند، فشار بیشتری را بر سیستم حافظه ایی وارد می آورند و به همین دلیل به حافظه های نهان بزرگتری نیاز دارند. نهایتا، نشان خواهیم داد که تکنولوژی پروسه ایی یکسان، طراحی خطوط لوله ایی عمقی تر می تواند منجر به افزایش 100 درصدی فرکانس پردازنده شود و در هنگام به کارگیری و ترکیب شدن با حافظه های نهان بزرگتر نیز می توان در پردازنده p4 کارایی را به میزان 35 تا 40 درصد بهبود بخشید.
1- مقدمه
شناسایی و مشخص نمودن فرکانس هدف پردازنده، یکی از مهترین مسائلی است که یک طرح ریز پردازنده با آن سر و کار دارد. هنگام بحث در مورد نحوه اعمال فرکانس یا IPC که به منظور بهبود کارایی و تداوم آن صورت می گرفت، بسیاری بر این عقیده بودند که پردازنده های مدرن دارای خط لوله های تعبیه شده ایی باشند که میزان عمق آنها به خوبی بهینه سازی شده باشند. با رده بندی و دسته بندی چنین مذاکراتی، اکثرا بر این عقیده بودند که پیچیدگی مهندسی و تلاش ، اساسا با خطوط لوله ایی عمقی تر انجام شود. تمرکز بر روی کارایی استریم ساده و استفاده از پردازنده p4 به عنوان معماری پایه، این مقاله به آن نتیجه رسیده است که خطوط لوله ایی می توانند به منظور بهبود کارایی در پردازنده های p4، 20 مرحله ایی، طویل تر در نظر گرفته شوند. در این صورت می توانیم ادعا کنیم که پیشرفت در معماری و معماری پیشرفته می تواند استفاده از خطوط لوله ایی عمقی تر را پیشتیبانی کند، هر چند که تلاش های مهندسی و سایر ملاحضات دیگر نیز به عنوان یک محدود کننده واقعی اعمال شوند…