چکیده
در این مقاله ، خوشه بندی وب بر اساس جستجوی لغات کلیدی جهت بهبود نتایج جستجوی صفحات وب و تسهیل عملکرد مرورگری وب ، پیشنهاد می شود که درجه ی یکسان سازی بین صفحات وب و جستجوی لغات کلیدی را جهت تصمیم گیری در مورد ترتیب صفحات نشان داده شده ی حاصل از نتایج جستجو ، بکار می برد.سپس الگوریتم خوشه بندی برای صفحات گروهی حاصل از نتایج جستجو و با توجه به درجه ی همسان سازی انتخاب می شود. در مرحله ی بعد ، از حذف صفحات تکراری استفاده کردیم تا این صفحات دو نسخه ای با عناوین و چکیده های یکسان را از بین ببریم.در پایان ، الگوریتم پیشنهادی به صورت عملی و در نتایج به کار گرفته می شود و نشان می دهد که جهت رفع مشکل انفجار اطلاعات بر روی وب ، موثر می باشد.
1-مقدمه
خوشه بندی جهت تبدیل داده های گروهی به چندین خوشه می باشد.تمامی انواع الگوریتم های خوشه بندی به چند دسته تقسیم می شوند که شامل خوشه بندی جدایی(خوشه ها ، خود بایستی به اندازه ی کافی از یکدیگر جدا باشند) که k-means کلاسیک ترین روش در آن می باشد ، خوشه بندی سلسله مراتبی (به خوشه های نهایی بر اساس میزان عمومیت آن ها ، ساختاری سلسله مراتبی نسبت داده می شود) ، خوشه بندی بر اساس طیف گراف ، بر مبنای چگالی ، بر مبنای مدل و غیره.
با انفجار اطلاعات در شبکه ی گسترده ی جهانی وب ، افزایش تقاضا برای خدمات وب مثل بازرگانی الکترونیکی ، بانکداری الکترونیکی و CMM (مدیریت ارتباط با مشتری به صورت الکترونیکی) ، روش استفاده از وب را تغییر داده است.با توجه به محیط تجاری رقابتی ، خدمات وب به امری کاملاً ضروری تبدیل شده است.بسیاری از شرکت ها اکنون یافته اند که محصولات و خدمات شخصی واقعاً مهم هستند.این نوع شخصی سازی می تواند از طریق روش های شناسایی نیاز های افراد بدست آید.وب کاوی قادر است چنین دانش و آگاهی را جهت شخصی سازی و بهبود خدمان وب استخراج کند...
میتوانید از لینک ابتدای صفحه، مقاله انگلیسی را رایگان دانلود فرموده و چکیده انگلیسی و سایر بخش های مقاله را مشاهده فرمایید.