Abstract
Breast cancer is one of the deadliest disease, is the most common of all cancers and is the leading cause of cancer deaths in women worldwide, accounting for >1.6% of deaths and case fatality rates are highest in low-resource countries. The breast cancer risks are broadly classified into modifiable and non – modifiable factors. The non modifiable risk factors are age, gender, number of first degree relatives suffering from breast cancer, menstrual history, age at menarche and age at menopause. While the modifiable risk factors are BMI, age at first child birth, number of children, duration of breast feeding, alcohol, diet and number of abortions. This paper presents a diagnosis system for detecting breast cancer based on RepTree, RBF Network and Simple Logistic. In test stage, 10-fold cross validation method was applied to the University Medical Centre, Institute of Oncology, Ljubljana, Yugoslavia database to evaluate the proposed system performances. The correct classification rate of proposed system is 74.5%. This research demonstrated that the Simple Logistic can be used for reducing the dimension of feature space and proposed Rep Tree and RBF Network model can be used to obtain fast automatic diagnostic systems for other diseases
چکیده
سرطان سینه (پستان) را میتوان به عنوان یکی از مرگبارترین بیماریها و در عین حال شایعترین سرطان در بین همهی سرطانها در نظر گرفت که به یکی از عوامل مرگهای سرطانی در زنان سرتاسر دنیا مبدل گردیده است، به طوری که بیش از 1. 6% از نرخ مرگومیرهای ناشی از این بیماری در کشورهایی رخ داده که با کمبود منابع روبرو میباشند. ریسک بروز سرطان سینه را میتوان به طور گسترده به دو فاکتور ریسک آفرین قابل اصلاح و غیر قابل اصلاح تقسیم کرد. فاکتورهای ریسک آفرین غیر قابل اصلاح، شامل سن، جنسیت، تعداد بستگان درجه اول که متحمل سرطان سینه گردیدهاند، سوابق وابستگیهای قاعدگی، سن قاعدگی و سن یائسگی میباشند. در حالی که فاکتورهای ریسک آفرین قابل اصلاح، شامل BMI، سن اولین فرزند آوری، تعداد فرزندان، مدت تغذیه با شیر مادر، مصرف نوشیدنیهای الکلی، رژیم غذایی و تعداد سقط جنین اشاره کرد. در این مقاله، بر مبنای شبکهی RepTree، RBF (تابع میانی شعاعی) و لجستیک ساده، یک سیستم تشخیصی برای تشخیص بیماری سرطان سینه ارائه گردیده است. در گام تست از این سیستم، یک اعتبار سنجی ضربدری 10-fold بر روی دادههای مؤسسهی سرطانشناسی در مرکز پزشکی دانشگاه یوگوسلاوی بکار گرفته شد تا کارائی سیستم پیشنهادی مورد ارزیابی قرار گیرد. نرخ دستهبندی صحیح سیستم پیشنهادی برابر با 74. 5% میباشد. در این پژوهش اثبات گردیده است که از لجستیک ساده میتوان برای کاهش بعد فضای ویژگی استفاده کرده و در همین راستا یک مدل شبکهای RBF و Rep Tree ارائه گردیده میتواند برای به دست آوردن سیستمهای تشخیصی خودکار برای تشخیص سایر بیماریها استفاده شود.
1-مقدمه
سرطان را میتوان یک سلول بدخیم در نظر گرفت که به علت عمدهی مرگومیر انسانها مبدل گردیده و به سختی میتوان از آن اجتناب نمود [1,2]. کشور هند با افزایش تعداد زنان جوانی که در معرض این بیماری قرار میگیرند، با رشد گستردهی این سرطان روبرو بوده است. در یک مطالعهی جهانی تخمینها بر آن بوده است که تا سال 2030 میلادی، تعداد موارد ابتلا به سرطان سینه در هند از 115 هزار مورد به حدود 200 هزار مورد در سال افزایش پیدا خواهد کرد...