حداقل مربعات جزئی (PLS) دسته وسیعی از روشها برای مدلسازی روابط بین مجموعهای از متغیرهای مشاهدهشده با استفاده از متغیرهای پنهان است.
این تکنیک شامل وظایف رگرسیون و طبقه بندی و همچنین تکنیک های کاهش ابعاد و ابزارهای مدل سازی است.
فرض اساسی همه روشهای PLS این است که دادههای مشاهدهشده توسط یک سیستم یا فرآیند تولید میشوند که توسط تعداد کمی از متغیرهای پنهان (مستقیماً مشاهده یا اندازهگیری نشده) هدایت میشود.
پیش بینی داده های مشاهده شده به ساختار نهفته آن با استفاده از PLS توسط هرمان ولد و همکارانش توسعه داده شد.
اسمارت PLS حتی در زمینه شیمی سنجی بسیار مورد توجه قرار گرفته است.
این الگوریتم به یک ابزار استاندارد برای پردازش طیف گسترده ای از مشکلات داده های شیمیایی تبدیل شده است.
موفقیت PLS در شیمی سنجی منجر به کاربردهای زیادی در زمینه های علمی دیگر از جمله بیوانفورماتیک، تحقیقات مواد غذایی، پزشکی، فارماکولوژی، علوم اجتماعی، فیزیولوژی شد.
اسمارت PLS که با دو بلوک از متغیرها سر و کار دارد در این فصل در نظر گرفته میشود، اگرچه افزونههای PLS برای مدلسازی روابط بین تعداد بیشتری از مجموعهها وجود دارد.
اسمارت PLS شبیه به تجزیه و تحلیل همبستگی متعارف (CCA) است که در آن بردارهای نهفته با حداکثر همبستگی استخراج می شوند.
تکنیکهای PLS مختلفی برای استخراج بردارهای نهفته وجود دارد و هر یک از آنها نوعی از PLS را ایجاد میکنند.
اسمارت PLS را می توان به طور طبیعی به مشکلات رگرسیون تعمیم داد.
متغیرهای پیش بینی و پیش بینی شده (پاسخ) هر کدام به عنوان یک بلوک از متغیرها در نظر گرفته می شوند.
سپس PLS بردارهای امتیاز را استخراج می کند که به عنوان یک نمایش پیش بینی کننده جدید عمل می کنند و متغیرهای پاسخ را روی این پیش بینی کننده های جدید رگرسیون می کند.
عدم تقارن طبیعی بین متغیرهای پیش بینی کننده و پاسخ در روشی که بردارهای امتیاز محاسبه می شوند منعکس می شود. این نوع با نام های PLS1 (یک متغیر پاسخ) و PLS2 (حداقل دو متغیر پاسخ) شناخته می شود.
رگرسیون PLS قبلاً توسط آماردانان نادیده گرفته می شد و هنوز هم به جای یک مدل آماری دقیق به عنوان یک الگوریتم در نظر گرفته می شود [14]. با این حال در سال های گذشته، علاقه به ویژگی های آماری PLS افزایش یافته است.
اسمارت PLS با روشهای رگرسیون دیگری مانند رگرسیون مؤلفه اصلی (PCR) و رگرسیون ریج (RR) مرتبط بوده است و همه این روشها را میتوان تحت یک رویکرد واحد به نام رگرسیون پیوسته قرار داد.