چکیده
انتخاب ویژگی از متن، گام مهمی در طبقه بندی متن محسوب می شود و بهطور مستقیم بر عملکرد طبقه بندی تاثیر میگذارد. روش انتخاب ویژگی کلاسیک عمدتا شامل فرکانس سند (DF)، بهرهی اطلاعاتی (IG)، اطلاعات متقابل (MI)، آزمون chi-square (CHI) می باشد. به لحاظ نظری، این روش ها به دلیل کمبود مدل های ریاضی برای آنها، روش های دشواری هستند. به منظور بهبود بیشتر تاثیر انتخاب ویژگی، پژوهش های بسیاری سعی دارند تا الگوریتم های بهینه سازی هوشمند را به روش انتخاب ویژگی اضافه کنند؛ مانند الگوریتم کلونی مورچه، الگوریتم ژنتیک و غیره. الگوریتم بهینه سازی ازدحام ذرات (PSO) در مقایسه با الگوریتم کلونی مورچه و الگوریتم ژنتیک، پیاده سازی ساده تری دارد و میتواند نقطه بهینه را به سرعت پیدا کند. بنابراین، این مقاله تلاش می کند تا تاثیر انتخاب ویژگی از متن با استفاده از PSO را بهبود بخشد. ما در این مقاله با تحلیل دستاوردهای فعلی الگوریتم بهبود یافته ی PSO و ویژگی های روش های کلاسیک انتخاب ویژگی، اکتشاف های زیادی را انجام داده ایم. مهمتر از همه اینکه، ما مدل معمولی PSO و دو مدل بهبود یافته PSO را به ترتیب براساس وزن اینرسی و عملکرد عامل کنتراست ثابت برای بهینه سازی روش انتخاب ویژگی، انتخاب نمودیم. پس از آن، با توجه به فاكتور انقباض ثابت، فاكتور انقباض عملکردی جديدی ساختيم و آن را به مدل PSO سنتي اضافه نموديم. در نهایت، ما دو مدل بهبود یافته PSO را بر اساس هر دوی فاکتورهای انقباض عملکرد و وزن اینرس، پیشنهاد دادیم. این مدلها به ترتیب مدل PSO بهبود یافته همزمان و مدل PSO بهبود یافته غیر همزمان هستند. در آزمایشات ما، CHI به عنوان روش پایه ی انتخاب ویژگی انتخاب شد. ما CHI را با استفاده از شش مدل PSO ذکر شده در بالا بهبود دادیم. نتایج آزمایشات و آزمون های اهمیت نشان می دهد که مدل PSO بهبود یافته به طور ناخودآگاه در میان همه مدل ها بهترین تاثیر را در طبقه بندی متن و ثبات ابعاد مختلف دارد.
1-مقدمه
الگوریتم بهینه سازی ازدحام ذرات (PSO) یک الگوریتم محاسبات تکاملی است که توسط James Kennedy و Russell Eberhart پیشنهاد شده است [1]. در ابتدا PSO برای شبیه سازی گرافیکی فرایند پیدا کردن غذا توسط پرندگان مورد استفاده قرار گرفت. محققان با مشاهده رفتار گله ای پرندگان، دریافتند که به اشتراک گذاری اطلاعات در گروه ها در طول فرایند تکامل، مزایایی به همراه دارد. این نتیجه براساس PSO به دست آمده بود [2].
تحقیقات علمی انجام شده در زمینه اصلاح PSO عمدتا بر بهبود پارامترهای آن توسط تحلیل نظری، استنتاج ریاضی و تحقیقات تجربی تمرکز دارند. به عنوان مثال، Angeline و همکارانش [4] مکانیزم انتخاب استاندارد را برای PSO معرفی کردند، ذرات بهینه پس از هر تکرار انتخاب میشوند و به نسل بعدی کپی میشوند. این روش به ویژه برای بهینه سازی توابع پیچیده بسیار مفید بود. Lovbjerg و همکارانش [5] به هدف دستیابی به همگرایی سریعتر، مفهوم زیرجمعیت و باروری را در PSO مطرح کردند. Higashi و همکارانش [6] از جهش گاوسی استفاده کردند تا قوانین در حال تغییر ذرات را از لحاظ موقعیت و سرعت، مجددا طراحی نمایند و نتایج بهتری را برای توابع یکپارچه و چندبعدی به دست آورند....
میتوانید از لینک ابتدای صفحه، مقاله انگلیسی را رایگان دانلود فرموده و چکیده انگلیسی و سایر بخش های مقاله را مشاهده فرمایید.