چکیده
امروزه، تقاضای روبه رشدی برای نظارت، تحلیل و کنترل مقیاس بزرگی از سیستم های توزیع شده وجود دارد. رویداد هایی که در طول نظارت تشخیص داده میشوند، به صورت موقت بهم مربوط هستند ، که این مورد میتواند در تخصیص منبع، زمانبندی شغلی و پیش بینی خطا مفید باشد. به منظور کشف روابط بین رویداد های تشخیص داده شده، روش های زیادی وجود دارد که بر روی رویداد های تشخیص داده شده در داخل پایگاه داده ی رویداد و همچنین کاوش بر روی آن متمرکز هستند.ما مدعی هستیم که با رشد سریع رویداد های نظارت شده ای که نمیتوان تنها با یک کامپیوتر به کشف روابط بین آنها پرداخت، این روش ها برای سیستم های توزیع شده در مقیاس بزرگ، مقیاس پذیر نیستند، در این مقاله، ما یک روش غیر متمرکز را به منظور تشخیص کارآمد رویداد ها، فیلتر سازی رویداد های نا مرتبط و کشف روابط موقتی بین آنها ارائه داده ایم. همچنین یک الگوریتم مبتنی بر کاهش نگاشت با نام MapReduce-Aprirori ارائه داده ایم تا به وسیله ی آن بتوانیم به داده کاوی قوانین انجمنی بپردازیم؛ این الگوریتم از منبع محاسباتی چندین گره از سیستم استفاده میکند. نتایج آزمایشی نیز نشان داده است که الگوریتم کاوش روابط رویداد غیر متمرکز ما، تقریباٌ به یک افزایش سرعت ایده آلی نسبت به روش های کاوش متمرکز رسیده است.
1-مقدمه
با رشد سیستم های توزیع شده ی بزرگ مقیاس (مانند سیستم های کلاستر و سیستم های محاسباتی ابری[24] ، اِلمانی کلیدی برای ایجاد یک محیط توزیع شده ی کارآمد و البته قابل اطمینان این بوده که بتوان به نظارت بر گره ها، سرویس ها و اپلیکیشن ها پرداخت. نظارت یک چنین سیستم بزرگی نیز به جمع آوری مقادیر صفات کارائی(مانند درصد استفاده از پردازنده و حافظه) و با تکرار شونده ی ثابت دارد. با رشد سیستم، سربار نظارت نیز میتواند امری چالش برانگیز باشد[29].
رویداد های تشخیص داده شده در طول پروسه ی نظارت میتواند به مدیران کمک کرده تا به سرعت به تشخیص و رفع عیب گلوگاه ها، خطاها و سایر مشکلات بپردازند. به عنوان مثال، Fisichella[15] یک پروسه ی سه مرحله ای را برای تشخیص رویداد های سلامت عمومی غیر نظارت شده ارائه داد. منظور ما از رویداد، صفت کارائی بوده که مقدار مشاهده شده ی آن از آستانه ی خاصی تجاوز میکند و رویداد های شکست را میتوان به عنوان مورد خاصی در نظر گرفت. اگرچه تا زمانی که پیچیدگی سیستم شروع به رشد میکند، خطا بجای اینکه به عنوان یک قاعده در نظر گرفته شود، به عنوان استثنا مطرح میشود[44]. روش های مرسومی مانند نقاط بررسی، یک تأثیر متقابلی را ایجاد میکنند[16]. بنابراین، پژوهش بر روی مدیریت خطا به یک پیش بینی خطا و تکنولوژی های مدیریت واکنش گرا تغییر موضع داده است[25,30].
مدت زیادی است که تشخیص داده شده است که رویداد ها مستقل نیستند، بلکه بهم مربوط میشوند. مطالعات قبلی[40] در زمینه ی تحلیل خطا، الگوهای مهمی را در توزیع خطا مشخص کرده اند. به طور خاص، رویداد ها در بازه های زمانی بلند مدت به صورت موقتی بهم مرتبط هستند.پژوهش های قبلی نیز تلاش کرده اند تا نشان دهند که رابطه ی رویداد برای تخصیص منبع، زمانبندی شغلی و پیش بینی خطا مفید هستند[43,16,17].
الگوهای رابطه ی رویداد، که بروز های متقابل را در بین رویداد های مختلف نشان میدهد، میتواند با استفاده از روش داده کاوی کشف شود. اگرچه الگوریتم های داده کاوی مرسوم مانند Apriori[33]، متحمل فضای کشف توانی به منظور کاوش الگوهای مکرر میباشد. از آنجایی که داده کاوی از نظر محاسباتی و داده ای بسیار محسوس میباشد، زمانی که مجموعه های داده ای بزرگ باشد، افزایش مقیاس کارائی داده کاوی به یک چالش اساسی مبدل میشود. علاوه بر این، روش های مبتنی بر Aprori قادر به کشف روابط موقتی بین رویداد های تشخیص داده شده نیستند. فعالیت های قبلی[5,36] به تشخیص روابط موقتی رویداد ها در شبکه های سنسوری پرداخته اند. اگرچه در این روش ها، تمامی داده ها در یک پایگاه داده ی متمرکز ذخیره میشود. با افزایش مقیاس سیستم ها، متراکم سازی رویداد ها در یک پایگاه داده ی متمرکز نیز باعث کاهش کارائی خواهد شد....
میتوانید از لینک ابتدای صفحه، مقاله انگلیسی را رایگان دانلود فرموده و چکیده انگلیسی و سایر بخش های مقاله را مشاهده فرمایید