Abstract
Recommender systems attempt to guide users in decisions related to choosing items based on inferences about their personal opinions. Most existing systems implicitly assume the underlying classification is binary, that is, a candidate item is either recommended or not. Here we propose an alternate framework that integrates three-way decision and random forests to build recommender systems. First, we consider both misclassification cost and teacher cost. The former is paid for wrong recommender behaviors, while the latter is paid to actively consult the user for his or her preferences. With these costs, a three-way decision model is built, and rational settings for positive and negative threshold values α* and β* are computed. We next construct a random forest to compute the probability P that a user will like an item. Finally, , and P are used to determine the recommender’s behavior. The performance of the recommender is evaluated on the basis of an average cost. Experimental results on the well-known MovieLens data set show that the (α*, β*)-pair determined by three-way decision is optimal not only on the training set, but also on the testing set
چکیده
سیستم های توصیه گر تلاش می کنند کاربران را در تصمیمات مرتبط با انتخاب آیتم های مبتنی بر رابط ها پیرامون نظرات شخصی خود آنها، هدایت کنند. اکثر سیستم های موجود تلویحاً فرض را بر این می گذارند که دسته بندی اساسی به صورت دو دویی است، یعنی یک ایتم کاندید یا تصویه شده، و یا توصیه نشده است. ما در اینجا چارچوبی جایگزین را پیشنهاد می کنیم که تصمیمات سه راهی و جنگل های تصادفی را در هم ادغام کرده تا سیستم های توصیه گر را ایجاد نماید. نخست ما هم هزینه های دسته بندی نادرست و هم هزینه ی آموزش را در نظر می گیریم. مورد اول برای رفتارهای نادرست توصیه¬گر پرداخت می شود، در حالیکه مورد دوم برای مشاورده دادن فعالانه به کاربر برای اولویت هایش هزینه می شود. با این هزینه ها، یک مدل تصمیم گیری سه راهی ساخته شده و تنظیمات منطقی برای مقادیر آستانه های مثبت و منفی، a* و b* محاسبه می شود. سپس با ساختن جنگل تصادفی یک احتمال را برای P که مطلوب بنظر می رسد را محاسبه می کنیم. در نهایت b* a*, و P برای پیشنهاد یک رفتار تعیین می شوند. گزینه پیشنهاد شده براساس یک هزینه متوسط ارزیابی می شود. نتایج آزمایش شده روی مجموعه داده های MovieLens (که به خوبی شناخته شده است) نشان می دهد که جفت (a*,b*) که از طریق مدل سه راهی تعیین شده بودند، نه تنها در مرحله آموزش بلکه در مرحله تست نیز بسیار مطلوب و مورد پسند بودند.
1-مقدمه
سیستم های توصیه گر (Rs)، برای ارائه ی آیتم هایی همچون؛ فیلم ها (41_22_21)، موسیقی (16) ، به مشتریان، به طور وسیعی مطالعه شده است. برای اجرای RS، دو هدف اصلی وجود دارد: هدف حافظه محور و هدف مدل محور (8). مدل های حافظه محور (52_14) تمام پایگاه داده های کاربر _ آیتم را برای تولید یک محاسبه بکار می گیرند، روش های مدل محور (73_72_42_23) از، اطلاعات محتوا و جمعیتی برای ایجاد یک مدلی که توصیه هایی را تولید می کند استفاده می کند...