Abstract
Indexes are the kernels of search engines. This paper presents a Combination Inverted Index(CII), which is a new inverted index. CII contains three components: prime inverted index, appendix inverted index and deleted file list. The addition of appendix inverted index and deleted file list construct a new methodology of creating and updating the index. Compared to traditional inverted index, CII updates indexes promptly and is appropriate for subject-oriented search engines. The performance of the search engine is proved by experiments
چکیده
ایندکس های هستۀ موتورهای جستجو هستند. این مقاله یک ایندکس وارونه مرکب (CII) را ارائه می دهد که یک ایندکس وارونه جدید است. CII شامل سه جز است: ایندکس وارونۀ اصلی، ایندکس وارونۀ اضافی و فهرست فایل حذف شده. مجموع ایندکس وارونۀ اضافی و فهرست فایل حذف شده، روشی جدید برای ایجاد و بروزرسانیِ ایندکس تشکیل می دهد. در مقایسه با ایندکس وارونۀ متداول، CII بطور سریع ایندکس ها را به روز می کند و برای موتور جستجوهای شی گرا مناسب است. عملکردِ موتور جستجو با استفاده از آزمایش اثبات شده است.
1-مقدمه
با رشد فزاینده، سریع و مداومِ اطلاعات در اینترنت، موتور جستجوهای عمومی با مشکل کاهش دقت و فراخوانی مواجه هستند. و موتورجستجوهای شیء گرا که برروی بازیابی اطلاعات خاصِ وب تمرکزدارند، توجه بسیاری از محققان را به خود جلب می کنند. موضوعات، عوارضی هستند که الزامات کاربر را توصیف می کنند. موتور جستجو، براساس موضوعات، اقدام به گردآوری و پردازش وب می کند. درمقایسه با موتور جستجوهای جهانی، موتورجستجوهای شیء گرا، وب هایی با دامنه کوچکتری را دربرمی گیرند. متعاقباً موتورجستجوهای شیء گرا، بازدهی، دقت بالاتر و هزینه پایین تری دارند...