Abstract
Fault tolerance in cloud computing platform is a crucial issue as it guarantees the availability, performance and reliability of the applications. In order to achieve the availability, reliability, performance, robustness and dependability in cloud computing, failure should be accessed and handled effectively. This paper discusses the better understanding of different fault tolerance techniques which are used according to their policies and tools. This paper also describes the comprehensive taxonomy of faults, errors and failures. The usage of taxonomy and survey results are not only used to identify the similarities but also to identify the areas requiring for future research
چکیده
تحمل پذیری در برابر خطا در پلت فرم رایانش ابری را می توان مسئله ای اساسی دانست، چرا که این قابلیت می تواند خصیصه هایی نظیر موجودیت، کارائی و قابلیت اطمینان کاربردها را تضمین نماید. برای حصول مشخصه ی موجودیت، قابلیت اطمینان، کارائی، دقت و قابلیت اعتماد در رایانش ابری، خرابی ها را باید به شکلی کارآمد دسترسی و برطرف نمود. در این مقاله، مباحثی را به منظور درک بهتر تکنیک های مختلف تحمل پذیری در برابر خطا ارائه می دهیم که این تکنیک ها با توجه به سیاست ها و ابزارهایشان مورد استفاده قرار می گیرند. همچنین به تشریح طبقه بندی جامعی از خرابی ها، خطاها و نواقص می پردازیم. از طبقه بندی و نتایج مطالعه تنها برای تشخیص نقاط تشابه استفاده نمی شود، بلکه از آنها برای پژوهش های بیشتر در آینده نیز بهره برداری می شود.
1-مقدمه
رایانش ابری را می توان مفهومی به معنای سرویس ها و کاربردهایی دانست که با کمک منابعی که مجازی سازی شده اند، بر روی شبکه توزیع شده اند. در رایانش ابری، یک دید انتزاعی از سیستم های فیزیکی وجود داشته که اپلیکیشن ها و نرمافزارها بر روی این سیستم ها اجرا می شوند. منابعی که در محیط ابری تدارک دیده می شود، مجازی و نامحدود بوده و مشتری تنها هزینه ی منابعی را پرداخت می کند که به آنها نیاز دارد...