Abstract
Two alternative partial least squares (PLS) methods, averaged PLS and weighted average PLS, are proposed and compared with the classical PLS in terms of root mean square error of prediction (RMSEP) for three real data sets. These methods compute the (weighted) average of PLS models with different complexity. The prediction abilities of the alternative methods are comparable to that of the classical PLS but they do not require to determine how many components should be included in the model. They are also more robust in the sense that the quality of prediction depends less on a good choice of the number of components to be included. In addition, weighted average PLS is also compared with the weighted average part of LOCAL, a published method that also applies weighted average PLS, with however an entirely different weighting scheme
چکیده
دو روش جایگزین حداقل مربعات جزئی (PLS)، میانگین PLS و میانگین وزنی PLS، ارائه شد و با PLS کلاسیک از نظر مربع ریشه میانگین خطا برای پیش بینی (RMSEP) سه مجموعه داده واقعی مورد مقایسه قرار گرفت. این روش (وزن) میانگین مدل PLS با پیچیدگی های مختلف را محاسبه میکند. توانایی پیش بینی روش های جایگزین با PLS کلاسیک قابل مقایسه هستند، اما آنها نیاز به تعیین چگونگی گنجاندن اجزا در مدل ندارند. آنها همچنین نسبت به وابستگی کیفیت پیش بینی به انتخاب صحیح تعداد اجزایی مدل ، مقاومتر هستند. علاوه بر این، میانگین وزنی PLS نیز با میانگین وزنی بخشی از LOCAL، یک روش چاپ شده که برای میانگین وزنی PLS اعمال میشود اما یک برنامه وزن دهی کاملا متفاوت دارد، مقایسه شده است.
1.مقدمه
رگرسیون حداقل مربعات جزئی (PLS) به طور گسترده ای برای کالیبراسیون چند متغیره در بسیاری از زمینه های کاربردی استفاده میشود [1]. با استفاده از PLS نیاز به مهارت و نسخه های PLS کاربر پسند تر وجود دارد. به عنوان مثال، در PLS کلاسیک، مدل ها با تعداد مختلف از اجزای PLS ساخته شده و باید تصمیم گرفته شود کدام یک از آنها مؤثر است. اگر تعداد قطعات انتخاب شده در یک مدل خیلی کم باشد، توانایی پیش بینی ممکن بد باشد چرا که شامل برخی از اطلاعات مرتبط نمیشود. اگر تعداد بیش از حد زیاد باشد، فوق اتصال (over fitting) ممکن است رخ دهد، یعنی توانایی پیش بینی مدل ضعیف شود چرا که آخرین قطعات شامل اختلالات زیادی هستند. به منظور انتخاب تعداد کافی قطعات، توانایی پیش بینی تعیین می شود، یعنی اعتبار سنجی انجام می گیرد...