چکیده
رتبه بندی صفحه بخش مهمی در سیستم بازیابی اطلاعات به حساب می آید. این تکنیک برای سنجش اهمیت و رفتار صفحات وب مورد استفاده قرار می گیرد. ما دو روش را برای رتبه بندی بررسی می کنیم: ایده HITS و تکنیک PageRank. هر دو این روش ها بر ساختار پیوند وب متمرکز می شوند تا اهمیت صفحات وب را بدست آورند.الگوریتم PageRank، رتبه هر یک از صفحات وب سایت را نشان می دهد و جستجوی موضوعی استنتاجی فرا متن (HITS) بر الگوی هاب ها و صفحات معتبر متکی است.بدست آوردن یک مؤلفه سریع و کارآمد برای رتبه بندی صفحه هنوز به عنوان یک تست باقی مانده است. این مقاله یک الگوریتم دیگر را معرفی می کند که از تکنیک نرمال سازی بر اساس مقدار میانگین رتبه صفحات بهره می برد. طرح پیشنهاد شده با کاهش تعداد تکرارها برای رسیدن به نقطه همگرایی، سبب کاهش پیچیدگی زمانی الگوریتم PageRank می شود.
1- مقدمه
به طور کلی می دانیم که وب بزرگترین منبع اطلاعاتی است. در طول چند سال گذشته، شبکه جهانی وب به مهمترین و محبوب ترین روش ارتباطی و انتشار اطلاعات تبدیل شده است ]1[. این تکنولوژی به عنوان گامی در تجارت انواع مختلف داده ها، از مقالات پژوهشی و محتوای آموزشی گرفته تا محتوای چند رسانه ای، برنامه نویسی و لاگ ها را شامل می شود. وب به طور پیوسته حدود یک میلیون صفحات الکترونیکی را ایجاد کرده و آن را به چندین میلیون نسخه ای که در حال حاضر وجود دارد اضافه می کند. در نتیجه با گسترش سریع منابع داده ای که از طریق وب جهانی قابل دسترسی هستند، به نظر می رسد که مشتریان به طور پیوسته از ابزارهای رباتیک استفاده می کنند تا به مالکیت داده ها و همچنین ردیابی و تشریح طرح های مورد استفاده خود دست یابند. این متغیرها ساخت چارچوب های هوشمندانه در سمت سرور و مشتری را به دنبال دارد که می تواند برای اطلاعات مفید باشد. وب کاوی را می توان به عنوان تکنیکی برای استخراج و کاوش داده های مهم از وب جهانی در نظر گرفت…
میتوانید از لینک ابتدای صفحه، مقاله انگلیسی را رایگان دانلود فرموده و چکیده انگلیسی و سایر بخش های مقاله را مشاهده فرمایید.