Abstract
Educational Data Mining field concentrate on Prediction more often as compare to generate exact results for future purpose. In order to keep a check on the changes occurring in curriculum patterns, a regular analysis is must of educational databases. This paper focus on identifying the slow learners among students and displaying it by a predictive data mining model using classification based algorithms. Real World data set from a high school is taken and filtration of desired potential variables is done using WEKA an Open Source Tool. The dataset of student academic records is tested and applied on various classification algorithms such as Multilayer Perception, Naïve Bayes, SMO, J48 and REPTree using WEKA an Open source tool. As a result, statistics are generated based on all classification algorithms and comparison of all five classifiers is also done in order to predict the accuracy and to find the best performing classification algorithm among all. In this paper, a knowledge flow model is also shown among all five classifiers. This paper showcases the importance of Prediction and Classification based data mining algorithms in the field of education and also presents some promising future lines
چکیده
داده کاوی آموزشی بیشتر از تولید نتایج دقیق برای اهداف آتی، بر پیش بینی تمرکز دارد. برای بررسی تغییرات الگوهای برنامه آموزشی، تحلیل منظم پایگاه داده های آموزشی ضروری است. موضوع این مقاله، تشخیص دانش آموزان کند از بین دانش آموزان دیگر و نشان دادن آن از طریق یک مدل داده کاوی پیش گویانه، با استفاده از الگوریتم های مبتنی بر دسته بندی است. داده های واقعی از یک دبیرستان گرفته شده و متغیرهای بالقوه ی مورد نظر با استفاده از WEKA (یک ابزار منبع باز) فیلتر شده اند. مجموعه داده ی سوابق تحصیلی دانش آموزان، با استفاده از WEKA (یک ابزار منبع باز) با الگوریتم های دسته بندی مختلفی مانند ادراک چندلایه، بیزی ساده، SMO، J48 و REPTree مورد آزمایش قرار گرفته و به کار رفته است. در نتیجه، ویژگی های آماری بر اساس تمام الگوریتم های دسته بندی تولید شده است. ما نتایج پنج دسته بندی کننده را نیز مقایسه کردیم تا دقت را پیش بینی کرده، و الگوریتمی که بیشترین کارایی را دارد پیدا کنیم. ما در این مقاله مدل جریان دانش را نیز در بین پنج دستهب ندی کننده نشان می دهیم. این مقاله اهمیت الگوریتم های داده کاوی مبتنی بر پیش بینی و دسته بندی را در زمینه آموزش نشان می دهد و چند مسیر تحقیقاتی امیدوارکننده را در آینده مشخص می کند.
1-مقدمه
در سال های اخیر داده کاوی به علت وجود حجم زیادی از داده ها و نیاز به تبدیل این داده ها به اطلاعات و دانش مفید، در صنعت تحقیقات و به طورکلی در جامعه، بسیار مورد توجه قرار گرفته است. داده کاوی که کشف دانش در پایگاه داده (KDD) نیز نامیده می شود، یعنی کشف اطلاعات جدید و احتمالاً مفید از پایگاه داده های بسیار بزرگ [12]..