Abstract
In this paper we presents study about how to extract the useful information on the web and also give the superficial knowledge and comparison about data mining. This paper describes the current, past and future of web mining. Here we introduce online resources for retrieval Information on the web i.e. web content mining, and the discovery of user access patterns from web servers, i.e. web usage mining that improve the data mining drawback. Furthermore, we also described web mining through cloud computing i.e. cloud mining. That can be seen as future of Web Mining
چکیده
در این مقاله تحقیقی در مورد چگونگی استخراج اطلاعات مفید در وب و همچنین دادن دانشی سطحی و مقایسه بر روی داده کاوی را ارائه می دهیم. این مقاله حال، گذشته و آینده وب کاوی را شرح می دهد. در اینجا منابع آنلاین برای بازیابی اطلاعات در وب یعنی محتوای وب کاوی، و کشف الگوهای دسترسی کاربر از وب سرورها، به عنوان مثال کاربرد وب کاوی را شرح می دهیم که نقطه ضعف داده کاوی را بهبود می بخشد. علاوه بر این، همچنین وب کاوی را از طریق محاسبات ابری یعنی ابر کاوی شرح دادیم. که می تواند به عنوان آینده ای از وب کاوی دیده شود.
1-مقدمه
پذیرش گسترده ای از اینترنت اساساً تغییر راه هایی است که برقراری ارتباط، جمع آوری اطلاعات، انجام تجارت و خرید می باشد. همانطور که استفاده از شبکه جهانی وب و ایمیل سر به فلک کشید، دانشمندان کامپیوتر و فیزیکدانان به سرعت این پدیده جدید را توصیف می کنند. در حالی که در ابتدا آنها با تنوع فوق العاده اینترنت نشان داده شده در اندازه ویژگی هایش شگفت زده شدند، خیلی زود الگوی گسترده ای در اندازه گیری های خود کشف کردند: عناصر کوچک بسیاری در وب موجود می باشند، اما تعداد کمی از آنها بزرگ هستند. چند سایت متشکل از میلیون ها صفحه می باشند، اما میلیون ها سایت تنها شامل تعداد انگشت شماری صفحه هستند. تعداد کمی از سایت ها حاوی میلیون ها لینک، اما بسیاری از سایت ها حاوی یک یا دو لینک می باشند. میلیونها کاربر برای انتخاب چند سایت گرد هم جمع می شوند، به میلیون ها نفر دیگر توجه می کنند…