Abstract
Cloud computing environments facilitate applications by providing virtualized resources that can be provisioned dynamically. However, users are charged on a pay-per-use basis. User applications may incur large data retrieval and execution costs when they are scheduled taking into account only the `execution time'. In addition to optimizing execution time, the cost arising from data transfers between resources as well as execution costs must also be taken into account. In this paper, we present a particle swarm optimization (PSO) based heuristic to schedule applications to cloud resources that takes into account both computation cost and data transmission cost. We experiment with a workflow application by varying its computation and communication costs. We compare the cost savings when using PSO and existing `Best Resource Selection' (BRS) algorithm. Our results show that PSO can achieve: (a) as much as 3 times cost savings as compared to BRS, and (b) good distribution of workload onto resources
چکیده
امروزه محیط های محاسبات ابری، با فراهم کردن منابعی که میتوان آنها را به صورت پویا تخصیص داد، باعث شده اند تا بتوان از اپلیکیشن های مرتبط در این زمینه به آسانی استفاده کرد. اگرچه در چنین محیط هایی، کاربران بر مبنای روش پرداخت به ازای استفاده از منابع موجود استفاده میکنند. اپلیکیشن های کاربر ممکن است هزینه های محاسباتی و بازیابی داده ها را در مقیاس زیادی بر کاربر تحمیل سازند، که البته این مورد فقط زمانی اتفاق میافتد که فقط هزینه ی اجرا در نظر گرفته شود. علاوه بر بهینه سازی زمان اجرا، هزینه ی ناشی از انتقال داده ها در بین منابع و همچنین هزینه های اجرا را نیز باید در نظر گرفت. در این مقاله، قصد داریم هیروستیک مبتنی بر بهینه سازی ازدحام ذرات(PSO) را به منظور زمانبندی اپلیکیشن ها در منابع کاربر ارائه دهیم. چنین هیروستیک که از این به بعد آنرا راه حل مینامیم، هر دو هزینه ی محاسباتی و انتقال داده ها را با هم در نظر میگیرد. همچنین یک اپلیکیشن جریان کاری را به ویسله ی تغییر هزینه های محاسباتی و محاوره ای آن مورد آزمایش قرار داده ایم. در ادامه، کاهش هزینه را در زمان استفاده از PSO و الگوریتم انتخاب بهترین منبع(BRS) مورد مقایسه قرار داده ایم. نتایج حاصله نشان داده اند که:
1- در مقایسه با الگوریتم BRS، روش پیشنهادی ما سه برابر هزینه ها را کاهش داده است.
2- همچنین توزیع خوبی از بار کاری بر روی منابع صورت گرفته است.
1-مقدمه
آزمایشات علمی-مشارکتی مدرن در زمینه هایی اعم از بیولوژی ساختاری، فیزیک انرژی بالا و علوم عصبی، شامل استفاده از منابع داده ای توزیع شده میباشد. در نتیجه ی تحلیل مجموعه های داده ای موجود در این علوم، میتوان چنین تحلیلی را در غالب جریان کاری علمی ارائه داد[7]. این جریان های کاری علمی نیاز به پردازش حجم زیادی از داده ها و محاسبه ی فعالیت های گسترده دارند. یک سیستم مدیریت جریان کاری علمی [14] به وسیله ی مخفی سازی ساختار و جزئیات ذاتی این علوم، مدیریت این آزمایشات علمی را بر عهده دارد، در حالی که اجرای جریان کاری بر روی منابع توزیع شده به وسیله ی سرویس دهندگان ابری صورت میگیرد.محاسبات ابری را میتوان پدیده ای جدید برای محاسبات توزیع شده دانست که میتوانند زیر ساختار، پلت فرم و نرم افزار را به عنوان یک سرویس در اختیار کاربر قرار دهند. این سرویس ها مبتنی بر عضویت هستند…