Abstract
Data mining is an important area of research and is pragmatically used in different domains like finance, clinical research, education, healthcare etc. Further, the scope of data mining have thoroughly been reviewed and surveyed by many researchers pertaining to the domain of healthcare which is an active interdisciplinary area of research. In fact, the task of knowledge extraction from the medical data is a challenging endeavor and it is a complex task. The main motive of this review paper is to give a review of data mining in the purview of healthcare. Moreover, intertwining and interrelation of previous researches have been presented in a novel manner. Furthermore, merits and demerits of frequently used data mining techniques in the domain of health care and medical data have been compared. The use of different data mining tasks in health care is also discussed. An analytical approach regarding the uniqueness of medical data in health care is also presented
چکیده
داده کاوی، یک زمینهی مهم از تحقیق است و به صورت عملی در زمینههای مختلفی مانند امور مالی، تحقیقات بالینی، آموزش، مراقبتهای سلامت و غیره، مورد استفاده قرار میگیرد. علاوه بر این، محدودهی داده کاوی به طور کامل توسط بسیاری از محققان حوزهی مراقبتهای سلامت مورد بررسی قرار گرفته است که یک زمینهی میان رشتهای فعال تحقیقاتی میباشد. در حقیقت، استخراج دانش از دادههای پزشکی یک تلاش چالشبرانگیز و یک کار پیچیده است. انگیزهی اصلی این مقالهی مروری، ارائهی مروری از داده کاوی در زمینهی مراقبتهای سلامت است. علاوه بر این، در هم آمیختن و ربط دادن تحقیقات قبلی به روش جدید ارائه شده است. همچنین، نقاط قوت و نقاط ضعف تکنیکهای داده کاویِ اغلب مورد استفاده در زمینهی مراقبتهای سلامت و دادههای پزشکی مقایسه شدهاند. استفاده از وظایف مختلف داده کاوی در مراقبتهای سلامت نیز مورد بحث قرار گرفته است. رویکرد تحلیلی در مورد منحصر به فرد بودن دادههای پزشکی در مراقبتهای سلامت نیز ارائه شده است.
1- مقدمه
دادههای پزشکی به معنی پایگاه دادههایی است که اطلاعات سلامت را ذخیره میکنند، مانند پروندههای بیمار. با توسعهی فناوری اطلاعات، تعداد زیادی از این دادههای پزشکی در فرمهای الکترونیکی ذخیره میشوند. این پایگاه دادهها حجم زیادی از دادهها را شامل میشوند. دادههای پزشکی از منابع مختلفی قابل دسترسی هستند به عنوان مثال؛ اسکن اشعه ایکس، سی تی اسکن (CT)، تصاویر رزونانس مغناطیسی (MRI)، سونوگرافی و غیره. بنابراین افزایش حجم دادهها و پایگاه دادههای مورد نیاز برای ذخیرهسازی دادههای دیجیتال شده به صورت نمایی افزایش یافته است...