چکیده
مراکز داده ای امروزی صدها هزار عملیات نامتجانس را با یکدیگر هماهنگ کرده و تلاش می کنند تا سرویس های رایانش ابری قابل اعتمادی را ارائه کنند. اگر چه ارائه سرویس ها با قابلیت اعتماد یکسان برای تمام کاربران به سود تمام افراد است، اما این قابلیت اعتماد یکسان ممکن است بسته به نیاز هر فرد برای برخی ناکافی و یا برای برخی دیگر گران باشد. ما در این مقاله یک روش جدید برای بهینه سازی قابلیت اعتماد ارتجاعی در رایانش ابری مطرح می کنیم. طرح پیشنهادی ما از بررسی همتا-به-همتا استفاده می کند و سطوح قابلیت اعتماد کاربر را بر اساس ارزیابی نیازهای هر فرد و منابع موجود در مرکز داده ای به طور مشترک بهینه سازی می کند. در اینجا نشان می دهیم که میتوان با استفاده از تجزیه دوگانه، بهینه سازی مشترک را توسط یک الگوریتم توزیع شده به صورت کارآمد انجام داد. این راه حل بکار گیری منابع را بهبود بخشیده و یک منبع درآمد اضافی برای اپراتورهای مرکز داده فراهم می کند. نتایج اعتبار سنجی نشان می دهد که راه حل پیشنهادی ما از لحاظ قابلیت اطمینان، نسبت به سایر طرح های موجود برتری قابل توجهی دارد.
1-مقدمه
در فضاهای ابری عمومی امروزی، قابلیت اطمینان به عناون یک پارامتر ثابت برای ارائه سرویس های اینترنتی در نظر گرفته می شود. برای مثال شرکت آمازون اظهار کرده است که کاربران EC2 این شرکت می توانند قابلیت اطمینان 99.95% را برای کارکرد سرورهای این شرکت انتظار داشته باشند؛ این درصد بیانگر نسبت شکست یک بار در هفته می باشد [1]. کاربران در صورت نیاز میتوانند عملیات های در حال اجرا بر روی ماشینهای مجازی (VM) را سخت تر کنند تا قابلیت اطمینان بیشتری حاصل شود. بدیهی است که این رویکرد «همه یا هیچ» رضایت بخش نیست و ممکن است بسته به نیاز هر فرد برای برخی ناکافی و یا برای برخی دیگر گران باشد؛ این تفاوت نیازها در افراد مختلف بسیار زیاد است [2]. راه کارهایی که تا کنون برای کسب قابلیت اطمینان در مراکز دادهای مطرح شده اند شامل تکثیر VM [3] و ایجاد نقاط بازرسی [4]–[6] [26], [27]می باشند. در منابع [7-9] چندین الگوریتم زمان بندی برای برقراری توازن میان حجم کار بازرسی و قابلیت اطمینان مطرح شده اند. در مرجع [10] این الگوریتم ها با در نظر گرفتن قیمت متغیر VM بررسی شده اند. با این وجود در پژوهش های پیشین تنها درباره نحوه اتخاذ سیاسیت های بازرسی بهینه جهت کمینه سازی زمان اجرایی برای انجام یک عملیات بحث و بررسی انجام شده است...
Abstract
Modern day data centers coordinate hundreds of thousands of heterogeneous tasks and aim at delivering highly reliable cloud computing services. Although offering equal reliability to all users benefits everyone at the same time, users may find such an approach either inadequate or too expensive to fit their individual requirements, which may vary dramatically. In this paper, we propose a novel method for providing elastic reliability optimization in cloud computing. Our scheme makes use of peer-to-peer checkpointing and allows user reliability levels to be jointly optimized based on an assessment of their individual requirements and total available resources in the data center. We show that the joint optimization can be efficiently solved by a distributed algorithm using dual decomposition. The solution improves resource utilization and presents an additional source of revenue to data center operators. Our validation results suggest a significant improvement of reliability over existing schemes