Abstract
Data mining is most commonly used in attempts to induce association rules from transaction data. In the past, we used the fuzzy and GA concepts to discover both useful fuzzy association rules and suitable membership functions from quantitative values. The evaluation for fitness values was, however, quite time-consuming. Due to dramatic increases in available computing power and concomitant decreases in computing costs over the last decade, learning or mining by applying parallel processing techniques has become a feasible way to overcome the slow-learning problem. In this paper, we thus propose a parallel genetic-fuzzy mining algorithm based on the master–slave architecture to extract both association rules and membership functions from quantitative transactions. The master processor uses a single population as a simple genetic algorithm does, and distributes the tasks of fitness evaluation to slave processors.The evolutionary processes, such as crossover, mutation and production are performed by the master processor. It is very natural and efficient to run the proposed algorithm on the master–slave architecture. The time complexities for both sequential and parallel genetic-fuzzy mining algorithms have also been analyzed, with results showing the good effect of the proposed one. When the number of generations is large, the speed-up can be nearly linear. The experimental results also show this point. Applying the master–slave parallel architecture to speed up the genetic-fuzzy data mining algorithm is thus a feasible way to overcome the low-speed fitness evaluation problem of the original algorithm
چكيده
دادهكاوي (تحليل دادهها)، به طور معمول در تلاش براي استنتاج قوانين ارتباطي از تراكنش دادهها، مورد استفاده قرار گرفته است. در گذشته، از مفاهيم فازي و الگوريتم ژنتيك جهت كشف هم قوانين ارتباط فازي مفيد و هم توابع عضويت مناسب، از مقادير كمي استفاده ميكرديم. اما، ارزيابي مقادير تناسب كاملاً زمانبر بود. به دليل افزايش چشمگير قدرت محاسباتي در دسترس و كاهش همزمان هزينههاي محاسباتي در دهه گذشته، يادگيري يا كاوش (كشف) از طريق بكارگيري تكنيكهاي پردازش موازي، به شيوهاي امكانپذير جهت چيره شدن بر مسئله يادگيري كُند، تبديل شده است. بنابراين، ما در اين مقاله يك الگوريتم كاوش ژنتيك- فازي موازي بر اساس معماري اصلي- پيرو جهت استنتاج قوانين ارتباطي و توابع عضويت ناشي از تراكنشهاي كمي را پيشنهاد ميكنيم. پردازنده اصلي از يك جمعيت منفرد به عنوان كار الگوريتم ژنتيك ساده استفاده ميكند و كارهاي ارزيابي (تكاملي) تناسب را براي پردازندههاي پيرو تقسيم ميكند. فرايندهاي تكاملي، همچون متقاطع، جهش و توليد، بوسيله پرازنده اصلي انجام ميشوند. اجراي الگوريتم پيشنهادي بر اساس معماري اصلي- پيرو، خيلي عادي و كارآمد است. پيچيدگيهاي زماني براي الگورتيمهاي كاوش ژنتيك- فازي موازي و ترتيبي نيز مورد تجزيه و تحليل قرار گرفتهاند كه نتايج آن تأثير مثبت روش پيشنهاد شده را نشان ميدهد. هنگامي كه تعداد نسلها زياد است، تسريع ميتواند تقريباً خطي باشد. نتايج تجربي نيز اين نكته را نشان ميدهند. بنابراين بكارگيري معماري موازي اصلي- پيرو جهت تسريع الگوريتم دادهكاوي ژنتيك- فازي، شيوهاي عملي، جهت چيره شدن بر مسئله ارزيابي تناسب با سرعت پايين در الگوريتم اصلي است.
1-مقدمه
همانطور كه تكنولوژي اطلاعات (IT) سريعاً در حال افزايش است، ظرفيت آن براي ذخيرهسازي و مديريت داده در پايگاهدادهها اهميت پيدا كرده است. باوجود اينكه پيشرفت IT، پردازش دادهها را تسهيل بخشيده و تقاضا براي رسانههاي ذخيرهسازي را آسان كرده است، استخراج اطلاعات ضمني در دسترس جهت كمك به تصميمگيري، به كاري جديد و چالشبرانگيز تبديل شده است. از اين رو، تلاشهاي زيادي صرف طراحي مكانيسمهايي كارآمد جهت كاوش اطلاعات و دانش از پايگاهدادههاي بزرگ شده است. به همين دليل، دادهكاوي (كاوش داده- تحليل داده) كه اولين بار آگراوال، آيملينكسي و سوامي (1993) مطرح شد، به حوزه اصلي مطالعه پايگاهداده و هوش مصنوعي، تبديل شده است...