Abstract
On the Semantic Web, the types of resources and the semantic relationships between resources are defined in an ontology. By using that information, the accuracy of information retrieval can be improved
In this paper, we present effective ranking and search techniques considering the semantic relationships in an ontology. Our technique retrieves top-k resources which are the most relevant to query keywords through the semantic relationships. To do this, we propose a weighting measure for the semantic relationship. Based on this measure, we propose a novel ranking method which considers the number of meaningful semantic relationships between a resource and keywords as well as the coverage and discriminating power of keywords. In order to improve the efficiency of the search, we prune the unnecessary search space using the length and weight thresholds of the semantic relationship path. In addition, we exploit Threshold Algorithm based on an extended inverted index to answer top-k results efficiently. The experimental results using real data sets demonstrate that our retrieval method using the semantic information generates accurate results efficiently compared to the traditional methods
چکیده
در حوزهی وب معنایی، انواع مختلفی از منابع و روابط معنایی در بین منابع موجود در علم اطلاعات (هستیشناسی) تعریف میگردد. با استفاده از اطلاعات به دست آمده از این روابط، میزان صحت بازیابی اطلاعات را میتوان بهبود داد.
در این مقاله، تکنیکهای جستجو و رتبهبندی کارآمدی را با در نظر گرفتن روابط معنایی در حوزهی هستیشناسی یا علم اطلاعات ارائه دهیم. تکنیک پیشنهادی ما با بهرهبرداری از روابط معنایی، اقدام به بازیابی k منبع اولی که بیشترین ارتباط را با کلیدواژههای یک پرسوجو دارند مینماید. برای این کار، یک مقیاس وزن دهی را برای رابطهی معنایی ارائه دادهایم. بر مبنای این مقیاس، یک روش رتبهبندی جدیدی را ارائه میدهیم که تعداد روابط معنایی معنادار در بین یک منبع و یک کلیدواژه را به همراه قدرت تشریحی آن کلیدواژهها در نظر میگیرد. به منظور بهبود بهرهوری این فرایند جستجو، فضای جستجوی غیرضروری را با استفاده از آستانههای طول و وزن روابط معنایی بهبود میدهیم. علاوه بر این، از یک الگوریتم آستانهی مبتنی بر شاخص معکوس بسط یافته به منظور پاسخ کارآمد به k نتیجهی اول استفاده میکنیم. نتایج آزمایشی که از مجموعههای دادهای واقعی به دست آمده است نشان میدهد که روش بازیابی ما که از اطلاعات معنایی استفاده میکند میتواند نتایج صحیحی را به شکلی کارآمد در مقایسه را روشهای معمول ایجاد نماید.
1-مقدمه
با توجه به رشد قابل ملاحظهی وب، شاهد ظهور طوفانی از اطلاعات بودهایم و از این رو موتورهای جستجو نیز به یکی از مفیدترین ابزارها به منظور به دست آوردن اطلاعات مطلوب از وب مبدل گردیدهاند. روشهای جستجوی مبتنی بر کلیدواژه به عنوان رایجترین روشها در موتورهای جستجو مورد استفاده قرار میگیرند چرا که یک چنین روشی میتواند واسط کاربری ساده و کاربر پسندی را پیش روی کاربر قرار دهد. روش جستجوی مبتنی بر کلیدواژه میتواند سطح ارتباط منابع را بر مبنای رخداد آن کلیدواژه در متون آن منبع (مانند عنوان، بدنه، متن لنگر گاه و غیره) مشخص نماید نمیتوان این اطمینان را داد که نتایجی که بازگردانده میشود میتواند دارای روابط معنایی در بین کلیدواژههایی باشد که کاربر مشخص کرده است...