Abstract
Epithelial (EP) and stromal (ST) are two types of tissues in histological images. Automated segmentation or classification of EP and ST tissues is important when developing computerized system for analyzing the tumor microenvironment. In this paper, a Deep Convolutional Neural Networks (DCNN) based feature learning is presented to automatically segment or classify EP and ST regions from digitized tumor tissue microarrays (TMAs). Current approaches are based on handcraft feature representation, such as color, texture, and Local Binary Patterns (LBP) in classifying two regions. Compared to handcrafted feature based approaches, which involve task dependent representation, DCNN is an end-to-end feature extractor that may be directly learned from the raw pixel intensity value of EP and ST tissues in a data driven fashion. These high-level features contribute to the construction of a supervised classifier for discriminating the two types of tissues. In this work we compare DCNN based models with three handcraft feature extraction based approaches on two different datasets which consist of 157 Hematoxylin and Eosin (H&E) stained images of breast cancer and 1376 immunohistological (IHC) stained images of colorectal cancer, respectively. The DCNN based feature learning approach was shown to have a F1 classification score of 85%, 89%, and 100%, accuracy (ACC) of 84%, 88%, and 100%, and Matthews Correlation Coefficient (MCC) of 86%, 77%, and 100% on two H&E stained (NKI and VGH) and IHC stained data, respectively. Our DNN based approach was shown to outperform three handcraft feature extraction based approaches in terms of the classification of EP and ST regions
چکیده
اپیتلیال (EP) و استرومال (ST) دو نوع بافت در تصاویر آسیب شناسی می باشند. بخش بندی یا طبقه بندی خودکار بافت های EP وST در هنگام توسعه ی سیستم های کامپیوتری برای تحلیل ریز محیط تومورها مهم می باشد. در این مقاله، یک یادگیری ویژگی مبتنی بر شبکه عصبی کانولوشنی عمیق (DCNN) برای بخش بندی یا طبقه بندی خودکار مناطق EP و ST از ریزآرایه های بافت تومور (TMAs) که دیجیتال شده اند، ارائه می گردد. روش های حال حاضر بر اساس ویژگی های دستی مانند رنگ، ترکیب، و الگوهای باینری محلی (LBP) در طبقه بندی دو ناحیه می باشند. در مقایسه با روش های مبتنی بر ویژگی های دستی، که با بیان مبتنی بر وظیفه مربوط است، DCNN یک استخراج کننده ی ویژگی سراسری می باشد که می تواند مستقیما از میزان شدت پیکسل خام بافت هایEP و ST به صورت داده محور یاد گرفته شود. این ویژگی های سطح بالا در ساخت یک طبقه بندی کننده ی نظارت شده برای تمییز دو نوع از بافت ها سهیم می باشند. در این کار، ما مدل های مبتنی بر DCNN را با 33 روش مبتنی بر استخراج ویژگی دستی، بر روی دو دسته دادگان متفاوت که شامل 157 تصویر رنگ آمیزی شده ی هماتوکسیلین و اوسین (H&E) مربوط به سرطان سینه و 1376 تصویر رنگ آمیزی شده ی سیستم ایمنی بافتی (IHC) مربوط به سرطان روده ی بزرگ می باشند، مقایسه می نماییم. نشان داده می شود که روش یادگیری ویژگی مبتنی بر DCNN، دارای امتیاز طبقه بندی F1 برابر با 85%، 89% و 100%، صحت (ACC) برابر با 84%، 88% و 100% و ضریب هم بستگی متیو (MCC) برابر با 86%، 77% و 100% روی داد های رنگ آمیزی شده ی H&E (NKI و VGH) وIHC می باشد. نشان داده می شود که روش مبتنی بر DNN ارائه شده در این مقاله، نسبت به روش های مبتنی بر استخراج ویژگی های دستی، از عملکرد بهتری از دیدگاه طبقه بندی مناطق EP و ST برخوردار می باشد.
1-مقدمه
بافت استرومال (ST) از بافت های متصل به هم چربی و فیبر تشکیل شده اند که مجراها و لوبول ها، رگ های خونی، و رگ های لنفی را احاطه می کنند و چارچوبی حمایت کننده برای یک ارگان بدن می باشند. بافت اپیتلیال (EP)، یک بافت سلولی پوششی است که در سیستم مجرایی و لوبولی مجاری شیر سینه وجود دارد. منشاء حدود 80% از تومورهای سینه در سلول های EP سینه می باشند...