Abstract
Breast cancer is the most common malignant tumor for women. In the past twenty years, the incidence of breast cancer continues to rise. Then, the diagnosis and treatment of the breast cancer have become an extremely urgent work to do. In this study, we intend to build a diagnostic model of breast cancer by using data mining techniques. A feature selection method, INTERACT is applied to select relevant features for breast cancer diagnosis, and the support vector machine is used to build the classification model. The results of the experiments show that the accuracy of the diagnostic model improves a lot by using feature selection method, and at the same time, nine relevant and important features for breast cancer diagnosis are chosen out. The diagnostic model for breast cancer built in this study has good generalization
چکیده
سرطان سینه یکی از شایعترین تومورهای بدخیم برای زنان است. در بیست سال گذشته بروز سرطان سینه افزایش یافته است. لذا تشخیص و درمان سرطان سینه به یک کار بینهایت ضروری تبدیل شد. در این مطالعه، قصد داریم مدل تشخیص سرطان سینه را بااستفاده از تکنیکهای دادهکاوی ایجاد کنیم. یک روش انتخاب ویژگی، INTERACT، برای انتخاب ویژگیهای مربوط به تشخیص سرطان سینه به کار گرفته میشود، و ماشین بردار پشتیبان برای ساخت مدل طبقهبندی استفاده میشود. نتایج آزمایشگاهی نشان میدهند که دقت مدل تشخیص در زمان استفاده از روش انتخاب ویژگی بسیار افزایش یافته است، و در همان زمان، نه ویژگی مهم و مربوط برای سرطان سینه انتخاب شدند. مدل تشخیص سرطان سینه این مطالعه از عمومیت خوبی بهرهمند است.
1-مقدمه
سرطان سینه یکی از شایعترین بدخیمیهای اپیتلیال رخ داده در زنان است، و 1 میلیون مورد جدید و بیش از 400000 مرگ و میر سالانه در سراسر جهان تخمین زده شده است. در بیست سال گذشته، بروز سرطان سینه افزایش یافته است. لذا، تشخیص و درمان سرطان سینه به یک کار بینهایت ضروری تبدیل شد. هدف از این مطالعه ساخت مدل تشخیص برای سرطان سینه است. به عبارت دیگر، قصد داریم روابط بین سرطان سینه و علائم آن را کشف کنیم. در این مقاله، تکنیک داده کاوی در مدل پیشبینی بکارگرفته شد...