Abstract
While OLAP has a key role in supporting effective exploration of multidimensional cubes, the huge number of aggregations and selections that can be operated on data may make the user experience disorientating. To address this issue, in the paper we propose a recommendation approach stemming from collaborative filtering. We claim that the whole sequence of queries belonging to an OLAP session is valuable because it gives the user a compound and synergic view of data; for this reason, our goal is not to recommend single OLAP queries but OLAP sessions. Like other collaborative approaches, ours features three phases: (i) search the log for sessions that bear some similarity with the one currently being issued by the user; (ii) extract the most relevant subsessions; and (iii) adapt the top-ranked subsession to the current user's session. However, it is the first that treats sessions as first-class citizens, using new techniques for comparing sessions, finding meaningful recommendation candidates, and adapting them to the current session. After describing our approach, we discuss the results of a large set of effectiveness and efficiency tests based on different measures of recommendation quality
چکیده
در حالیکه OLAP دارای نقشی کلیدی در پشتیبانی از اکتشاف مؤثر مکعب های چند بُعدی است، ممکن است تعداد زیادی از انبوهش ها و انتخاب هایی که می توانند بر اساس داده ها عمل کنند، موجب تجربه کردن فقدان جهتگیری مناسب از سوی کاربران شوند. به منظور پرداختن به این موضوع، ما در این مقاله یک روش توصیه نشأت گرفته از فیلتر مشارکتی را پیشنهاد نمودیم. ما ادعا می کنیم که دنباله کامل جستارهای متعلق به یک نشست OLAP ارزشمند است، چرا که به کاربر دیدگاهی ترکیبی و توأمان از داده ها می دهد؛ به این خاطر هدف ما توصیه نمودن نشست های OLAP و نه جستارهای OLAP تنهاست. همانند دیگر روش های مشارکتی، روش ما نیز سه مرحله دارد: (1) جستجوی فهرست نشست هایی که دارای برخی شباهت ها با موردی هستند که به تازگی دلخواه کاربر بوده است؛ (2) استخراج مرتبط ترین نشست های فرعی؛ و (3) تطبیق برترین نشست های فرعی با نشست های جاری کاربر. با اینحال، برای اولین بار است که با نشست ها به عنوان شهروندان درجه اول برخورد شده، و با استفاده از تکنیک های جدید برای مقایسه نشست ها کاندیدهای توصیه شده معناداری را تعیین نموده، و با نشست های کنونی تطبیق داده می شوند. پس از توصیف روش، در رابطه با نتایج مجموعه بزرگی از تست های اثربخشی و بهره وری مبتنی بر معیارهای مختلف کیفیت توصیه های ارائه شده بحث می کنیم.
1-مقدمه
OLAP الگوی اصلی برای ارزیابی داده های چندبعدی در پایگاه های اطلاعاتی است. به منظور دستیابی به معانی دارای جستار زیاد با وجود تلاشی اندکی برای تدوین جستار، OLAP مجموعه ای از عملیات (همانند slice-and-dice و drill-down) را که یک جستار چندبعدی را به جستاری دیگر تبدیل می کند، فراهم می آورد، بطوریکه جستارهای OLAP بطور طبیعی در دنباله ای تحت عنوان نشست های OLAP شکل می گیرند [1،2]. طی یک نشست OLAP، کاربر نتایج یک جستار را تحلیل کرده و بسته به داده های خاصی که مشاهده می نماید، عملیاتی را جهت تعیین جستاری جدید که به او درک بهتری از پدیده مورد نظر می بخشد، انجام می دهد...