چکیده
در مسئله ی انتخاب یا گزینش ویژگی به دنبال آن هستیم تا بتوانیم ویژگیهای موجود و مرتبط بهم در یک دسته بندی را پیدا کرده، با این هدف که بتوان کارائی دستهبندی را بهبود داده و ویژگیهای تکراری در دسته بندی را حذف نموده و در نهایت بتوان هزینههای محاسباتی را کاهش داد. چگونگی ایجاد یک توازن در بین این دو فاکتور را میتوان یک چالش دانست، مخصوصا در شرایطی که به دست آوردن برچسبهای قطعی برای این ویژگی ها هزینه بر باشد. در این مقاله قصد داریم از روش یادگیری نیمه نظارت شده برای حل این مسئله استفاده نماییم و همچنین به ارائهی یک معیار افزونگی-حداقلی و ارتباط-حداکثری که مبتنی بر ضریب همبستگی پوآسن (RRPC) میباشد بپردازیم. در این روش جدید از یک تکنیک جستجوی افزایشی برای گزینش زیر مجموعهای از ویژگیهای بهینه استفاده میشود. ویژگیهای انتخابی جدید از ارتباطی قوی با برچسب ها برخوردار میباشند (البته در مد نظارت شده) و همچنین جلوی افزونگی زیر مجموعه ویژگیهای انتخابیِ تحت محدودیتهای نظارت نشده گرفته میشود. مطالعاتی مقایسه ای را بر روی دادههای باینری و دادههای چند دستهای که از مجموعه دادهای بنچ مارک به دست آمد انجام دادیم. نتایج نشان میدهد که روش پیشنهادی RRPC میتواند به توازن مطلوبی در بین خصیصههای ارتباط و افزونگی در تکنیک گزینش ویژگی نیمه نظارت شده دست پیدا کند. همچنین به مقایسهی تکنیک RRPC با معیارهای کلاسیکی گزینش ویژگی نظارت شده (مانند mRMr و مقیاس فیشر)، معیارهای گزینش ویژگی نیمه نظارت شده (مانند امتیاز لاپلاس) و معیارهای گزینش ویژگی نیمه نظارت شده (مانند حساسیت محلی و sSelect) میپردازیم. نتایجِ حاصل از آزمایش ها نشان از بهرهوری روش پیشنهادی ما دارد.
1-مقدمه
گزینش ویژگی را میتوان یکی از روشهای رایج برای کاهش بعد در بسیاری از اپلیکیشن ها [1,3] دانست. در این تکنیک هدف این است تا بتوان ویژگیهایی معنادار را انتخاب کرده، هزینههای محاسباتی را کاهش داده و همچنین در فضای ذخیرهسازی صرفه جویی نمود. با توجه به مسئلهی معضل بعد، گزینش ویژگی [4] را میتوان یکی از مباحث داغ تحقیقاتی در حیطهی داده کاوی [5,7]، تشخیص الگو [8,9]، و بینایی ماشین [10] دانست. به طور کلی گزینش ویژگی را میتوان به دستهی گزینش ویژگی نظارت شده [12,13]، گزینش ویژگی نظارت نشده [14,16] تقسیم کرد…
میتوانید از لینک ابتدای صفحه، مقاله انگلیسی را رایگان دانلود فرموده و چکیده انگلیسی و سایر بخش های مقاله را مشاهده فرمایید.