چکیده
شبکه مجموعه آیتم مکرر (FIL) یک ساختار سودمند برای استخراج قوانین وابستگی است. هرچند، ایجاد یک FIL برای یک پایگاه داده تغییر یافته نیازمند زمان و حافظه زیادی است. در حال حاضر، ره یافتی برای بروزرسانی یک FIL با تراکنش های حذف شده وجود ندارد. بنابراین، این مقاله یک ره یافت برای حفظ FILها برای حذف تراکنش بدون بازبینی پایگاه داده اصلی، در صورتیکه تعداد تراکنش های حذف شده از حد آستانه تعیین شده بر اساس مفاهیم دیفست ها و پیش-بزرگ کوچکتر باشد، پیشنهاد می کند. یک رهیافت مبتنی بر دیفست ها ابتدا برای ایجاد سریع یک FIL استفاده می شود. سپس دو روش پیشنهادی (مبتنی بر تیدست ها و دیفست ها) برای بروزرسانی FIL با حذف تراکنش استفاده شده اند. آزمایشات نشان داد که روش مبتنی بر دیفست ها از روش های مبتنی بر تیدست ها و حالت-دسته ای بهتر عمل می کند.
1-مقدمه
استخراج قانون ارتباط (AR) [1,15,24] یک مسئله مهم است، که در داده کاوی و کشف دانش مورد توجه دانشمندان قرار گرفته است. آن ها کاربردهای گسترده ای دارند، از قبیل تجزیه و تحلیل داده سبد، وب کاوی معنایی، متن کاوی و غیره. روش های متداول برای کاوش ARs به دو دسته تقسیم می شوند: (1) کاوش مجموعه آیتمهای مکرر (FIs) از پایگاه داده ها [5,7,8,18] و پایگاه داده های جریان دار [4,19] و (2) کاوش ARs از FIs. بر اساس آزمایشات، فاز (2) به آسانی قابل پیاده سازی است اما نیاز به زمان پردازش بالایی دارد. اخیرأ، شبکه های مجموعه آیتم مکرر (FILs) و شبکه های مجموعه آیتم بسته مکرر (FCILs) برای کاوش موثر ARs پیشنهاد شدند [13,20,21,25]. ایجاد FILs/FCILs زمان بیشتری از بدست آوردن مجموعه های آیتم (بسته) مکرر می طلبد، اما تولید ARs از FILs/FCILs بسیار کارآمدتر از انجام این کار از طریق مجموعه های آیتم (بسته) مکرر است [17,20]. بنابراین، استخراج ARs بر اساس FILs/FCILs از روش سنتی، زمانی که هر دو فاز کاوش مد نظر است، بهتر عمل می کند…
میتوانید از لینک ابتدای صفحه، مقاله انگلیسی را رایگان دانلود فرموده و چکیده انگلیسی و سایر بخش های مقاله را مشاهده فرمایید