Abstract
An interpolation theorem for the p-norm model, 1≤p≤∞, of Salton, Fox, and Wu for extended Boolean document retrieval is stated and proven. This result asserts roughly that whenever two or more documents are similarly ranked at any two points along the p-continuum with respect to this model for either an AND or an OR query containing exactly two terms, then they are similarly ranked at all points in between. An analogous result can fail for queries with more than two terms and an example is given to show this
چکیده
در این مقاله، یک قاعده درون یابی برای مدل نرم p، که سالتون، فوکس و وو آنرا مطرح کردند،1≤p≤∞ ، برای بازیابی سند تعمیم یافتۀ بولین، بیان و اثبات شده است. این نتایج تقریباً اثبات می کنند که هر زمان دو یا چند سند بطور مشابه در هر دو نقطه درطول زنجیرۀ p با توجه به این مدل برای یک جستارِ AND یا OR که محتوی دقیقاً دو جمله هستند، ترتیب بندی شوند، آنگاه در تمامی نقاطِ بین آن هم هم بطور مشابه ترتیب بندی خواهند شد. نتایج مشابه برای جستارهایی با بیش از دو جمله ممکن است با شکست مواجه شود و نمونه ای از آن نشان داده شده است.
1-مقدمه
مدل تعمیم یافته بازیابی اطلاعات بولین که توسط ساتون، فوکس و وو (1993) بیان شده، بطورمکرر نتایج بازیابیِ بسیار موثری را در آزمایش های متعدد تجربی نشان داده است. این مدل معروف برای بازیابی متن، درحقیقت یک خانواده پیوسته و یکپارچه از مدلهای پارامتریِ تعمیم یافتۀ بولین است که براساس فرمول های عددی همچون بردار p-norms، 1<p< ∞، می باشد. این مدل روابط، انترپولاسیونِ عملگرهای استاندارد بولین یعنی AND و OR را جهت تطبیق ترتیب بندی رابطه ایِ اسناد با توجه به جستارهای کاربر، آسان ساخته اند. مقادیر بالا برای پارامتر، با انترپولاسیونِ نسبتاً اکیدِ عملگرهای بولین، و مقادیر پایین با انترپولاسیون نسبتاً ملایم تر تناظر دارند. در این مقاله، هدف اصلیِ ما بکارگیری تئوریِ ریاضیاتی انترپولاسیونِ عملگرهای خطی برای اثبات آن است که، اگر دو یا چند سند بطور مشابه در هر زوج نقطه درطول طیف p با عنایت به مدل تعمیم یافتۀ بولین برای جستار AND یا OR که دقیقاً شامل دو جمله هستند، ترتیب بندی شوند، آنگاه در تمامی نقاط میان آن نیز بطور مشابه ترتیب بندی خواهند شد...