Abstract
Decision-tree algorithm provides one of the most popular methodologies for symbolic knowledge acquisition. The resulting knowledge, a symbolic decision tree along with a simple inference mechanism, has been praised for comprehensibility. The most comprehensible decision trees have been designed for perfect symbolic data. Over the years, additional methodologies have been investigated and proposed to deal with continuous or multi-valued data, and with missing or noisy features. Recently, with the growing popularity of fuzzy representation, some researchers have proposed to utilize fuzzy representation in decision trees to deal with similar situations. This paper presents a survey of current methods for Fuzzy Decision Tree (FDT) designment and the various existing issues. After considering potential advantages of FDT classifiers over traditional decision tree classifiers, we discuss the subjects of FDT including attribute selection criteria, inference for decision assignment and stopping criteria. To be best of our knowledge, this is the first overview of fuzzy decision tree classifier
چکیده
الگوریتم درخت تصمیم، یکی از محبوب ترین روش های اکتساب دانش سمبلیک است. دانش به دست آمده، یک درخت تصمیم سمبلیک و یک مکانیسم استنتاج ساده است که قابل فهم است. قابل فهم ترین درخت های تصمیم برای کامل ترین داده های سمبلیک طراحی شده اند. در طول چند سال، روش های زیادی بررسی و پیشنهاد شده اند تا داده های چندمقداری یا پیوسته با ویژگی های نویزدار یا بدون مقدار را پردازش کنند. اخیرا، با محبوبیت روبه رشد بازنمایی فازی، برخی محققین پیشنهاد کرده اند از بازنمایی فازی در درخت های تصمیم استفاده شود تا با موقعیت هایی مشابه سروکار داشته باشد. این مقاله مروری برروش های کنونی درخت تصمیم فازی (FDT) و مشکلات موجود ارائه می کند. پس از در نظر گرفتن مزایای ممکن دسته بندهای FDT نسبت به دسته بندهای درخت تصمیم سنتی، به موضوعات FDT از جمله شرط انتخاب ویژگی، استنتاج انتساب تصمیم و شرط خاتمه می پردازیم. تا آنجا که مطلع هستیم، این تحقیق، اولین مرور دسته بندهای درخت تصمیم فازی می باشد.
1-مقدمه
درخت تصمیم یکی از محبوب ترین روش های یادگیری و استدلال از نمونه های مبتنی برویژگی است. این روش ها چندین بار تغییر یافته اند تا با عدم قطعیت در اندازه گیری و زبان مقابله کنند. درخت تصمیم فازی یکی از چنین بسط هایی است که هدف آن ترکیب درخت تصمیم سمبلیک با منطق تقریبی است که بازنمایی فازی فراهم می سازد. هدف استفاده از مزایای مکمل هردو روش می باشد: محبوبیت در کاربردهای یادگیری از نمونه ها و قابلیت فهم بالای دانش درخت تصمیم، قابلیت مقابله با اطلاعات غیرقطعی و غیردقیق بازنمایی فازی [2].
در گذشته، مقالات زیادی به این شاخه پرداخته اند. Ichihashi و همکاران، قوانین استدلال فازی را استخراج می کنند که پارتیشن های فازی درنظر گرفته می شوند [6]. یک روش جبری نیز برای ساده سازی یادگیری افزایشی به کار گرفته شده است. Xizhao و Hong ویژگی های پیوسته را با استفاده از عضویت های فازی و تئوری احتمال گسسته سازی می کنند [7]. از طرف دیگر، Pedrycz و Sosnowski بدین منظور از خوشه بندی فازی مبتنی برزمینه استفاده می نمایند [8]. Yuan و Shaw از درخت تصمیمی فازی استفاده می کنند تا ابهام دسته بندی را با شواهد فازی کاهش دهند [9].