Abstract
Sales forecasting uses historical sales figures, in association with products characteristics and peculiarities, to predict short-term or long-term future performance in a business, and it can be used to derive sound financial and business plans. By using publicly available data, we build an accurate regression model for online sales forecasting obtained via a novel feature selection methodology composed by the application of the multi-objective evolutionary algorithm ENORA (Evolutionary NOn-dominated Radial slots based Algorithm) as search strategy in a wrapper method driven by the well-known regression model learner Random Forest. Our proposal integrates feature selection for regression, model evaluation, and decision making, in order to choose the most satisfactory model according to an a posteriori process in a multi-objective context. We test and compare the performances of ENORA as multi-objective evolutionary search strategy against a standard multi-objective evolutionary search strategy such as NSGA-II (Non-dominated Sorted Genetic Algorithm), against a classical backward search strategy such as RFE (Recursive Feature Elimination), and against the original data set
چکیده
پیشبینی فروش از آمار گذشتهی فروش به همراه خصوصیات و صفات محصولات، برای پیشبینی کارایی کوتاهمدت یا بلندمدت آتی در یک کسبوکار استفاده میکند و میتوان از آن برای استنتاج طرحهای قابلاعتماد مالی و کاری استفاده کرد. ما با استفاده از دادههایی که به طور عمومی در دسترس هستند، یک مدل رگرسیون دقیق برای پیشبینی فروش آنلاین ایجاد میکنیم که از طریق یک روششناسی جدید انتخاب ویژگی حاصل میشود. این روششناسی از کاربرد الگوریتم ENORAی تکاملی چندهدفه (الگوریتم مبتنی بر شکافهای شعاعی تکاملی غیرتحتسلطه) به عنوان استراتژی جستوجو به یک شیوهی wrapper تشکیل میشود که ناشی از یادگیرندهی مدل مشهور رگرسیون جنگل تصادفی است. پیشنهاد ما انتخاب ویژگی برای رگرسیون، ارزیابی مدل و تصمیمگیری را یکپارچه میسازد تا برطبق یک فرایند پسین در یک زمینهی چندهدفه، مناسبترین مدل را انتخاب نماید. کارایی ENORA را به عنوان یک استراتژی جستوجوی تکاملی چندهدفه در برابر یک استراتژی جستوجوی تکاملی چندهدفهی استاندارد مانند NSGA-II (الگوریتم ژنتیک مرتب غیرتحتسلطه)، یک استراتژی جستوجوی رو به عقب کلاسیک مانند RFE (حذف برگشتی ویژگی) و مجموعه دادهی اصلی مقایسه میکنیم.
1-مقدمه
پیشبینی فروش نقش مهمی در هوش تجاری دارد که میتوان هوش تجاری را به صورت مجموعهی روششناسیها و تکنیکهای استفاده شده در حصول و انتقال دادههای خام به اطلاعات ساختیافته برای اهداف تحلیلی تعریف کرد. پیشبینی، فرایند انجام پیشبینیها دربارهی آینده بر اساس دادههای گذشته و حال است [1]. تکنیکهای تحلیلی برای پیشبینی را میتوان به طور گسترده به تکنیکهای رگرسیون و تکنیکهای یادگیری ماشین گروهبندی کرد. پیشبینی فروش از آمار گذشتهی فروش به همراه خصوصیات و صفات محصولات، برای پیشبینی کارایی کوتاهمدت یا بلندمدت آتی استفاده میکند و میتوان از آن برای استنتاج طرحهای قابلاعتماد مالی و کاری استفاده کرد...