Abstract
Recently many researchers have focused on mining data streams and they proposed many techniquesand algorithms for data streams. It refers to the process of extracting knowledge from nonstop fast growing data records. They are data stream classification, data stream clustering, and data stream frequentpattern items and so on. Data stream clustering techniques are highly helpful to cluster the similar data items in datastreams and also to detect the outliers, so they are called cluster based outlier detection. Outlier Detection is a fundamental issue in Data Mining. It has been used to detect and remove unwanted data objects from large dataset. The clustering techniques are highly helpful to detect the outliers called cluster based outlier detection.The data stream is a new emerging research area in Data Mining. It refers to the process of extracting knowledge from nonstop fast growing data records
چکیده
اخیراً محققان بسیاری روی کاوش جریانهای داده تحقیقاتی انجام داده اند و تکنیک ها و الگوریتم های بسیاری برای بررسی جریان داده ها ارائه نموده اند. این مسئله، هملن فرایند استخراج دانش از رکوردهای داده است که همواره رو به افزایش می باشند. تکنیک های خوشه بندی جریان داده به منظور خوشه بندی داده های مشابه در جریان داده و کشف داده های پرت، بسیار مفید می باشند. بنابراین این روش ها، کشف داده پرت بر اساس خوشه نامیده می شوند. کشف داده پرت، مبحثی اساسی در داده کاوی به شمار می رود. این روش به منظور کشف و حذف داده های ناخواسته از پایگاه داده های بزرگ مورد استفاده قرار می گیرد. تکنیک های خوشه بندی مورد استفاده در زمینه ی کشف داده ی پرت، تکنیک های مبتنی بر خوشه نام دارند. جریان داده یک حوزه تحقیقاتی نوظهور در داده کاوی به شمار می رود و به فرایندی اطلاق می شود که اطلاعات را از رکوردهای داده ای که به سرعت رو به رشد هستند، استخراج می کند.
1-مقدمه
داده کاوی حوزه ای است که به طور گسترده در زمینه های تحقیقاتی مورد استفاده قرار گرفته است. اکثر کارهای انجام شده در زمینه شامل استخراج دانش می باشند. به دلیل این که جریان داده، بزرگ، نامحدود، سریعاً در حال تغییر و پیوسته میباشد، یکی از حوزه های تحقیقاتی در داده کاوی محسوب می شود. کاربردهای جریان های داده می تواند علمی، نجومی یا کاربردهای تجاری و مالی باشد...