Abstract
In real-world applications, transactions usually consist of quantitative values. Many fuzzy data mining approaches have thus been proposed for finding fuzzy association rules with the predefined minimum support from the give quantitative transactions. However, the common problems of those approaches are that an appropriate minimum support is hard to set, and the derived rules usually expose common-sense knowledge which may not be interesting in business point of view. In this paper, an algorithm for mining fuzzy coherent rules is proposed for overcoming those problems with the properties of propositional logic. It first transforms quantitative transactions into fuzzy sets. Then, those generated fuzzy sets are collected to generate candidate fuzzy coherent rules. Finally, contingency tables are calculated and used for checking those candidate fuzzy coherent rules satisfy the four criteria or not. If yes, it is a fuzzy coherent rule. Experiments on the foodmart dataset are also made to show the effectiveness of the proposed algorithm
چکیده
در کاربردهای موجود در جهان واقعی، معمولا تراکنش ها در برگیرنده مقادیر کمی هستند. از این رو به منظور یافتن قوانین فازی منطبق با حداقل تعاریف پیش فرض که قابلیت پشتیبانی از تراکنش های کمی را داشته باشد. روش های داده کاوی فازی زیادی پیشنهاد شده اند. به هر حال مشکل عمومی این روش ها آن است که پشتیبانی حداقلی مناسب دارای تنظیمات سختی است و معمولا قوانین پیشنهادی نیز دارای جنبه های عمومی هستند و مد نظر تجارت نیستند. در این مقاله ، الگوریتمی برای غلبه بر این مشکلات پیشنهاد شده است که بر گرفته از خصوصیات منطفی می باشد. در ابتدا تراکنش های کمی را به مجموعه های فازی تبدیل می کنیم و سپس از این مجموعه ها پی جمع آوری شده برای ایجاد قوانینی منسجم فازی استفاده می کنیم.
نهایتا جداول بدست آمده جمع آوری ، محاسبه و برای قوانین منسجم فازی استفاده می شوند که می تواند چهار معیار اصلی را پوشش دهند. در صورتی که بتواند چنین معیارهایی را پوشش دهند به عنوان قانون منسجم در نظر گرفته می شوند. همچنین از دیتاست هایی نیز برای نشان دادن کارایی روش نیز استفاده شده است.
1-مقدمه
داده کاوی روشی است که به منظور اقتباس و استخراج اطلاعات و الگوهای مفید از دیتاست ها یا پایگاه داده های عظیم استفاده می شود تا بتواند بر مشکلات خاص غلبه کند . یکی از تکنیک هایی که در این روش زیاد استفاده می شود..