Abstract
Sharing the Semantic Web data in proprietary datasets in which data is encoded in RDF triples in a decentralized environment calls for efficient support from distributed computing technologies. The highly dynamic ad-hoc settings that would be pervasive for Semantic Web data sharing among personal users in the future, however, pose even more demanding challenges for the enabling technologies. We extend previous work on a hybrid P2P architecture for an ad-hoc Semantic Web data sharing system which better models the data sharing scenario by allowing data to be maintained by its own providers and exhibits satisfactory scalability owing to the adoption of a two-level distributed index and hashing techniques. Additionally, we propose efficient distributed processing of SPARQL queries in such a context and explore optimization techniques that build upon distributed query processing for database systems and relational algebra optimization. We anticipate that our work will become an indispensable, complementary approach to making the Semantic Web a reality by delivering efficient data sharing and reusing in an ad-hoc environment
چکیده
به اشتراک گذاری دادههای وب در پایگاهدادههای اختصاصی که در آن داده در سه تاییهای RDF در محیط مرکزی کد شده، پشتیبانی مناسب از تکنولوژیهای محاسباتی توزیعشده را فراخوانی میکند. تنظیمات بسیار پویای اقتضایی که برای به اشتراک گذاری دادهی وب معنایی بین کاربران شخصی در آینده فراگیر است، در حالی که، چالشهای بیشتری را برای فعال کردن تکنولوژیها ایجاد مینماید. ما کار قبلی روی معماری P2P برای یک سیستم به اشتراکگذاری دادهی وب اقتضایی که طرح به اشتراک گذاری داده را بهتر مدل میکند را با مجاز کردن حفظ داده توسط ارائه کنندگان آن و نمایش مقیاسپذیری رضایتبخش برای پذیرش یک اندیس توزیع شدهی دو سطحی و تکنیکهای درهمسازی، توسعه بخشیدهایم. همچنین، ما یک پردازش SPARQL توزیع شدهی کارا از کوئریها در چنین مفهومی را ارائه نموده و تکنیکهای بهینهسازی که برفراز پردازش کوئری توزیع شده برای سیستمهای پایگاهداده و بهینهسازی جبر رابطهای ساخته شدهاند را بررسی کردهایم. ما پیشبینی میکنیم که کارمان یک روش حتمی و تکمیلی برای ایجاد وب معنایی به وسیلهی ارسال به اشتراک گذاری دادهی کارا و استفادهی مجدد در یک محیط اقتضایی شود.
1-مقدمه
چون تبدیلهای RDF(چهارچوب توصیف منابع)[1] برای بسیاری از انواع دادههای کاربردی موجودند، بسیار محتمل است که مقادیر زیادی از دادهی RDF، دادهی وب معنایی، در کامپیوترهای شخصی تولید شود. ممکن است کسی قادر به انتقال و به اشتراک گذاری داده با دیگران مانند چیزی که ما میتوانیم در حال حاضر با فایلهای سند، آهنگ یا ویدئو در کامپیوتر خود انجام دهیم، باشد. در اکثر موارد، به اشتراک گذاری دادهی وب معنایی بین کامپیوترهای شخصی در یک محیط اقتضایی اتفاق میافتد که پشتیبانی قویای برای فعالسازی چنین فعالیتهایی یک روش حتمی و تکمیلی برای ایجاد وب معنایی در واقعیت باشد...