چکیده
در مسئلهی گزینش ویژگی به دنبال کاهش تعداد ویژگیهای موجود در اپلیکیشن های متعددی هستیم که دادههای مربوط به این اپلیکیشن ها با صد ها و یا حتی هزاران ویژگی سرو کار دارند. روشهای فعلی که برای گزینش ویژگی ارائه شده است غالباً بر روی پیدا کردن ویژگیهای به هم مرتبط متمرکز شدهاند. در این مقاله نشان خواهیم داد که ارتباط ویژگی ها را نمیتوان یک شرط کافی برای گزینش کارآمد ویژگی ها وآنهم در دادههایی با تعداد ابعاد بالا دانست. در همین راستا، مفهوم "افزونگی ویژگی" را معرفی میکنیم تا بتوان تحلیلهایی را بر روی افزونگی ویژگی ها در مسئلهی گزینش ویژگی انجام داد. چارچوب جدیدی را معرفی خواهیم نمود که میتواند تحلیل افزونگی و تحلیل ارتباط بین ویژگی ها را به صورت مجزا از هم انجام دهد. به توسعهی یک روش مبتنی بر همبستگی برای تحلیل افزونگی و ارتباط خواهیم پرداخت و مطالعاتی تجربی را بر روی بهرهوری و اثر بخشی آن در مقایسه با روشهای دیگر انجام میدهیم.
1-مقدمه
در روشهای کلاسیکی یادگیری نظارت شده، با یک مجموعهی آموزشی از بردارهای ویژگی با طول ثابت و برچسب دار (نمونهها) روبرو هستیم. یک نمونه را میتوان به عنوان تخصیص مقادیر f = ( f1, ..., fN) به یک مجموعه از ویژگی ها F = (F1, ...,FN) و تخصیص یکی از کلاس ممکن lc1, ...,c به برچسب کلاس تعریف نمود. هدف این است که بتوان به دستهبندیای دست پیدا کنیم که بتواند به شکلی صحیح به پیشبینی برچسبهای نمونههای جدید بپردازد. یادگیری یک دسته بند میتواند به وسیلهی مقادیر ویژگیهای آن مشخص شود…
میتوانید از لینک ابتدای صفحه، مقاله انگلیسی را رایگان دانلود فرموده و چکیده انگلیسی و سایر بخش های مقاله را مشاهده فرمایید.