Abstract
Clustering is a popular data analysis and data mining technique. A popular technique for clustering is based on k-means such that the data is partitioned into K clusters. However, the k-means algorithm highly depends on the initial state and converges to local optimum solution. This paper presents a new hybrid evolutionary algorithm to solve nonlinear partitional clustering problem. The proposed hybrid evolutionary algorithm is the combination of FAPSO (fuzzy adaptive particle swarm optimization), ACO (ant colony optimization) and k-means algorithms, called FAPSO-ACO–K, which can find better cluster partition. The performance of the proposed algorithm is evaluated through several benchmark data sets. The simulation results show that the performance of the proposed algorithm is better than other algorithms such as PSO, ACO, simulated annealing (SA), combination of PSO and SA (PSO–SA), combination of ACO and SA (ACO–SA), combination of PSO and ACO (PSO–ACO), genetic algorithm (GA), Tabu search (TS), honey bee mating optimization (HBMO) and k-means for partitional clustering problem
چکیده
خوشه بندی، یک روش محبوب برای تحلیل داده ها و داده کاوی است. روش رایج برای خوشه بندی، بر اساس k-means است به طوری که داده ها به k خوشه تقسیم می شوند. با این حال، الگوریتم k-means بسیار وابسته به حالت اولیه است و به راه حل بهینه محلی همگرا می شود. در این مقاله یک الگوریتم تکاملی ترکیبی جدید برای حل مسئله خوشه بندی تقسیمی غیر خطی ارائه می گردد. الگوریتم تکاملی ترکیبی پیشنهادی، ترکیبی از الگوریتم FAPSO(بهینه سازی ازدحام ذرات تطبیقی فازی)، ACO (بهینه سازی کلونی مورچه) و k-means، به نام FAPSO-ACO-K است، که می تواند پارتیشن خوشه ای بهتری پیدا کند. عملکرد الگوریتم پیشنهادی، از طریق چندین مجموعه داده معیار ارزیابی می گردد. نتایج شبیه سازی نشان می دهد که عملکرد الگوریتم پیشنهادی، بهتر از الگوریتم های دیگر مانند PSO، ACO، بازپخت شبیه سازی شده (SA)، ترکیبی از PSO و SA (PSO–SA)، ترکیبی از ACO وSA (ACO–SA)، ترکیبی از PSO و ACO (PSO–ACO)، الگوریتم ژنتیک (GA)، جستجوی تابو (TS)، بهینه سازی جفت گیری زنبور عسل (HBMO) و K-means برای مسئله خوشه بندی تقسیمی است.
1-مقدمه
خوشه بندی داده، فرآیند گروه بندی داده ها را به کلاس ها و یا خوشه ها توصیف می کند که در آن داده ها در هر خوشه، درجه بالایی از شباهت را به اشتراک می گذارند در حالی که به داده های دیگر خوشه ها بسیار بی شباهت هستند. عدم شباهت ها با توجه به مقادیر موجودیت توصیف کننده اشیاء، ارزیابی می گردد. به طور کلی، مقیاس های فاصله استفاده می شود. خوشه بندی داده ها دارای ریشه هایی در تعدادی از حوزه ها است...