چکیده
امروزه شبکه های بهم متصل، واحد های پردازشی سیستم های محاسباتی با کارائی بالا را بهم متصل ساخته و با آنها محاوره دارند. در این زمینه، خطاهای شبکه دارای تأثیر قابل ملاحظه ای میباشند زیرا بسیاری از الگوریتم های مسیریابی، برای پایداری در برابر خطاها طراحی نشده اند. از این رو، فقط یک خطای منفرد ممکن است پیام های موجود در شبکه را دچار اشکال سازد و اتمام اپلیکیشن ها را با مشکل روبرو سازد، و یا حتی منجر به پیکربندی های بن بست گردد.
در این مقاله، ما یک متد مسیریابی مستعد در برابر خطا را معرفی کرده ایم تا بتوانیم خطاهای لینک دائم و غیر دائم که پویایی بالایی دارند را از بین ببریم. از آنجایی که این خطاها به صورت تصادفی در طول عملیات سیستم بروز میکند، متد ما مسیرهای گریز را برای پیام ها فراهم کرده و در عین حال، از بروز بن بست جلوگیری میکند.پیشنهاد ما از نواحی خطا دار و به وسیله ی روش های مسیریابی چند مسیره اجتناب میکند و از مزایای افزونگی مسیر ارتباطی بهره میبرد.
ارزیابی کارائی، شامل سناریوهای تست ترکیبی بوده که صحت را اثبات کرده و سناریوهایی را که بر مبنای موجودیت دنباله هایی از سیستم های با کارائی بالاست را تست میکند. آزمایشات نشان داده است که متد ما به اپلیکیشن ها اجازه داده تا اجرای خود را حتی در صورت بروز خطا کامل سازند و افت کارائی را به 30% کاهش دهند.
فهرست مطالب
1-مقدمه
2-متد مسیریابی پایدار در برابر خطا
1-2- پیکربندی مسیرهای جایگزین
2-2- رفتار متد
3- ارزیابی کارائی
1-3- نتایج الگوهای ارتباطی
2-3- نتایج سناریوهای مبتنی بر خطاهای واقعی
4- نتیجه گیری
1-مقدمه
در طی دهه های اخیر، تقاضا برای قدرت محاسباتی بیشتر، یک افزایش بدون توقفی را داشته است. این افزایش، ریشه ای در رشد تعداد کاربرد های محاسباتی پیچیده دارد. در ابتدا، قدرت محاسباتی فقط محدود به فیلد های پژوهشی علمی بود. اگرچه در طول چند سال اخیر، کاربرد های جدیدی نیز ایجاد شده اند که نیاز به قدرت محاسباتی بالایی داشته اند. این برنامه های جدید، شامل ایمن سازی DNA، پیش بینی آب و هوا، مطالعات زیستی و غیره بوده است.
در این لحظه، اهمیت سیستم های HPC غیرقابل انکار میباشد، زیرا آنها گرایش جدیدی را به سمت مدل سازی رفتار روزانه و سبک زندگی جوامع مدرن باز کرده اند. این مورد در صورتی که ساده ترین جستجو در گوگل را که بر مبنای سیستم های HPC نیز میباشد را در نظر بگیریم، بدیهی است[1]. در اصل، با توجه به اهمیت این سیستم ها، ضروری است تا از وقفه های سرویس اجتناب کنیم، که این مورد در سیستم های حساس مانند سیستم های مرتبط با عملیات بحرانی-مأموریتی، بانکداری و اپلیکیشن های محسوس به محاسبات ضرورت پیدا میکند[2].
اصولاٌ اهمیت چنین سیستم هایی مرتبط با قابلیت استفاده و قدرت مکانیسم های پایداری در برابر خطا میباشد. متأسفانه، افزایش یکنواخت در پیچیدگی و تعداد مؤلفه های این سیستم ها، نرخ خطا را نیز به میزان قابل ملاحظه ای افزایش داده است. سؤال هایی از تحلیل این شرایط ایجاد میشود، مانند: این خطاها چطور بر روی سیستم های HPC تأثیر میگذارند؟ چه نوع خطاهایی در سیستم های واقعی روی میدهد؟آیا این سیستم ها میتوانند در صورت بروز خطا پایداری استاندارد خود را حفظ کنند؟ در صورتی که اینطور نباشد، راه حل چیست؟ بهترین گزینه ها برای رسیدن به یک پایداری در برابر خطا و پیوستگی سرویس سیستم چیست؟...
میتوانید از لینک ابتدای صفحه، مقاله انگلیسی را رایگان دانلود فرموده و چکیده انگلیسی و سایر بخش های مقاله را مشاهده فرمایید.