Skip Navigation Linksلیست مقالات ترجمه شده / مقالات ترجمه شده مهندسی كامپيوتر /

عنوان ترجمه شده مقاله: انتخاب ویژگی و داده های نامتوازن: مشکلات پیش بینی نقص نرم افزار

جامعه داده کاوی و یادگیری ماشین معمولاً با دو مشکل اصلی مواجه است: کار کردن با داده های نا متوازن و انتخاب بهترین ویژگی ها برای یادگیری ماشین

Abstract

The data mining and machine learning community is often faced with two key problems: working with imbalanced data and selecting the best features for machine learning. This paper presents a process involving a feature selection technique for selecting the important attributes and a data sampling technique for addressing class imbalance. The application domain of this study is software engineering, more specifically, software quality prediction using classification models. When using feature selection and data sampling together, different scenarios should be considered. The four possible scenarios are: (1) feature selection based on original data, and modeling (defect prediction) based on original data; (2) feature selection based on original data, and modeling based on sampled data; (3) feature selection based on sampled data, and modeling based on original data; and (4) feature selection based on sampled data, and modeling based on sampled data. The research objective is to compare the software defect prediction performances of models based on the four scenarios. The case study consists of nine software measurement data sets obtained from the PROMISE software project repository. Empirical results suggest that feature selection based on sampled data performs significantly better than feature selection based on original data, and that defect prediction models perform similarly regardless of whether the training data was formed using sampled or original data

چکیده

جامعه داده کاوی و یادگیری ماشین معمولاً با دو مشکل اصلی مواجه است: کار کردن با داده­ های نا متوازن و انتخاب بهترین ویژگی ­ها برای یادگیری ماشین. این مقاله فرایندی را ارائه می ­کند که شامل یک روش انتخاب ویژگی برای انتخاب ویژگی­ های مهم و یک روش نمونه برداری از داده برای برطرف کردن عدم توازن کلاس است. دامنه کاربرد این تحقیق، مهندسی نرم افزار به ویژه پیش ­بینی کیفیت نرم افزار با استفاده از مدل­ های دسته ­بندی است. وقتی از انتخاب ویژگی و نمونه ­برداری داده استفاده می ­کنیم باید سناریوهای مختلفی را در نظر بگیریم. چهار سناریوی ممکن عبارتند از 1) انتخاب ویژگی بر اساس داده­ های اصلی و مدل سازی (پیش ­بینی نقص) بر اساس داده ­های اصلی؛ 2) انتخاب ویژگی بر اساس داده­ های اصلی و مدل سازی بر اساس داده ­های نمونه برداری شده؛ 3) انتخاب ویژگی بر اساس داده ­های نمونه برداری شده و مدل سازی بر اساس داده ­های اصلی؛ و 4) انتخاب ویژگی بر اساس داده­ های نمونه برداری شده و مدل سازی بر اساس داده ­های نمونه برداری شده. هدف اصلی این تحقیق مقایسه کارایی پیش­ بینی نقص نرم افزار در مدل­ های مبتنی بر این چهار سناریو است. نمونه مطالعاتی از نه مجموعه داده­ ی سنجش نرم افزاری تشکیل شده که از منبع پروژه­ های نرم افزاری PROMISE به دست آمده ­اند. نتایج تجربی نشان می­ دهند که انتخاب ویژگی بر اساس داده ­های نمونه برداری شده نسبت به انتخاب ویژگی بر اساس داده­ های اصلی کارایی بیشتری دارد و مدل­ های پیش ­بینی نقص صرف نظر از اینکه داده­ های آموزشی با استفاده از داده ­های اصلی یا نمونه ­برداری شده ایجاد شوند، کارایی مشابهی دارند.

1-مقدمه

هدف داده ­کاوی و یادگیری ماشین، استخراج اطلاعات مخفی اما مفید از منابع داده است. در مورد جنبه­ های مختلف داده­ کاوی و یادگیری ماشین از جمله پیش­ پردازش داده، آموزش مدل، ارزیابی مدل و تشخیص و اعتبارسنجی الگو، تحقیقات زیادی انجام شده است. ما در این کار به فعالیت­ های پیش­ پردازش داده، به ویژه انتخاب ویژگی از یک مجموعه داده می ­پردازیم که مشکل عدم توازن کلاس دارد. ..


موسسه ترجمه البرز اقدام به ترجمه مقاله " مهندسی كامپيوتر " با موضوع " انتخاب ویژگی و داده های نامتوازن: مشکلات پیش بینی نقص نرم افزار " نموده است که شما کاربر عزیز می توانید پس از دانلود رایگان مقاله انگلیسی و مطالعه ترجمه چکیده و بخشی از مقدمه مقاله، ترجمه کامل مقاله را خریداری نمایید.
عنوان ترجمه فارسی
انتخاب ویژگی و داده های نامتوازن: مشکلات پیش بینی نقص نرم افزار
نویسنده/ناشر/نام مجله :
22nd IEEE International Conference on Tools with Artificial Intelligence
سال انتشار
2010
کد محصول
1010415
تعداد صفحات انگليسی
8
تعداد صفحات فارسی
18
قیمت بر حسب ریال
880,000
نوع فایل های ضمیمه
Pdf+Word
حجم فایل
500 کیلو بایت
تصویر پیش فرض


این مقاله ترجمه شده را با دوستان خود به اشتراک بگذارید
سایر مقالات ترجمه شده مهندسی كامپيوتر را مشاهده کنید.
کاربر عزیز، بلافاصله پس از خرید مقاله ترجمه شده مقاله ترجمه شده و با یک کلیک می توانید مقاله ترجمه شده خود را دانلود نمایید. مقاله ترجمه شده خوداقدام نمایید.
جهت خرید لینک دانلود ترجمه فارسی کلیک کنید
جستجوی پیشرفته مقالات ترجمه شده
برای کسب اطلاعات بیشتر، راهنمای فرایند خرید و دانلود محتوا را ببینید
هزینه این مقاله ترجمه شده 880000 ریال بوده که در مقایسه با هزینه ترجمه مجدد آن بسیار ناچیز است.
اگر امکان دانلود از لینک دانلود مستقیم به هر دلیل برای شما میسر نبود، کد دانلودی که از طریق ایمیل و پیامک برای شما ارسال می شود را در کادر زیر وارد نمایید


این مقاله ترجمه شده مهندسی كامپيوتر در زمینه کلمات کلیدی زیر است:




feature selection
data sampling
software measurements

تاریخ انتشار در سایت: 2017-05-10
جستجوی پیشرفته مقالات ترجمه شده

خدمات ترجمه تخصصی و ویرایش مقاله مهندسی كامپيوتر در موسسه البرز

نظرتان در مورد این مقاله ترجمه شده چیست؟

ثبت سفارش جدید