Abstract
Computer-aided diagnosis of masses in mammograms is important to the prevention of breast cancer. Many approaches tackle this problem through content-based image retrieval techniques. However, most of them fall short of scalability in the retrieval stage, and their diagnostic accuracy is, therefore, restricted. To overcome this drawback, we propose a scalable method for retrieval and diagnosis of mammographic masses. Specifically, for a query mammographic region of interest (ROI), scale-invariant feature transform (SIFT) features are extracted and searched in a vocabulary tree, which stores all the quantized features of previously diagnosed mammographic ROIs. In addition, to fully exert the discriminative power of SIFT features, contextual information in the vocabulary tree is employed to refine the weights of tree nodes. The retrieved ROIs are then used to determine whether the query ROI contains a mass. The presented method has excellent scalability due to the low spatial-temporal cost of vocabulary tree. Extensive experiments are conducted on a large dataset of 11 553 ROIs extracted from the digital database for screening mammography, which demonstrate the accuracy and scalability of our approach
چکیده
جهت پیش گیری از سرطان سینه، تشخیص کامپیوتری توده های پستانی در تصاویر ماموگرام دارای اهمیت زیادی می باشد. بسیاری از راه کارها با استفاده از تکنیک بازیابی تصویر مبتنی بر محتوا با این مسئله روبرو می شوند. با این وجود اکثر آنها در مرحله بازیابی، دارای مشکل پایین بودن مقیاس پذیری هستند و در نتیجه میزان دقت تشخیص آنها محدود است. برای غلبه بر این مشکل، روش مقیاس پذیری را برای بازیابی و تشخیص توده های پستانی در تصاویر ماموگراف مطرح کرده ایم. به خصوص برای ناحیه مورد نظر (ROI) در تصویر ماموگراف، ویژگی های SIFT (تبدیل ویژگی تغییر ناپذیر با مقیاس) استخراج شده و در درخت واژگان جستجو می شود. درخت واژگان، تمام ویژگی های کوانتیز شده از ROIهای ماموگرافی شناسایی شده پیشین را ذخیره می کند. علاوه بر این، جهت اعمال تمام و کمال قدرت افتراق ویژگی های SIFT، اطلاعات محتوایی در درخت واژگان برای تقویت وزن گره های درخت استفاده می شوند. سپس ROI های بازیابی شده برای تعیین اینکه آیا ROI مورد بررسی دارای توده پستانی می باشد یا خیر مورد استفاده قرار می گیرند. روش معرفی شده به خاطر داشتن درخت واژگان هزینه های فضایی-زمانی پایین، دارای مقیاس پذیری عالی می باشد. آزمایشات وسیعی روی مجموعه داده بزرگی صورت گرفته است، که این مجموعه داده حاوی 11553 ROI استخراج شده از پایگاه داده دیجیتالی برای انجام آزمایشات روی تصاویر ماموگراف می باشد. این آزمایشات میزان دقت و مقیاس پذیری راه کار ما را نشان می دهند.
1-مقدمه
سالهاست که سرطان سینه دومین عامل مرگ های سرطانی در بین زنان است. با این اوصاف تشخیص سریع این سرطان میتواند شانس بهبود را به طور چشمگیری افزایش دهد. در صورت تشخیص توده در مرحله موضعی طی پنج سال، نرخ نجات از مرگ بیماران مبتلا به سرطان سینه از 24% به 99% افزایش یافت [2]. در حال حاضر ماموگرافی در بین تمام تکنیک های تصویر برداری برای آزمایشات مربوط به سینه، موثرترین و تنها روش کاملا قابل قبول برای تصویر برداری می باشد و از سوی انجمن سرطان آمریکا (ACS) به عنوان یک استاندارد طلایی جهت شناسایی سرطان شناخته شده است...