حداقل مربعات جزئی (PLS) دسته وسیعی از روش‌ها برای مدل‌سازی روابط بین مجموعه‌ای از متغیرهای مشاهده‌شده با استفاده از متغیرهای پنهان است.

این تکنیک شامل وظایف رگرسیون و طبقه بندی و همچنین تکنیک های کاهش ابعاد و ابزارهای مدل سازی است.

فرض اساسی همه روش‌های PLS این است که داده‌های مشاهده‌شده توسط یک سیستم یا فرآیند تولید می‌شوند که توسط تعداد کمی از متغیرهای پنهان (مستقیماً مشاهده یا اندازه‌گیری نشده) هدایت می‌شود.

پیش بینی داده های مشاهده شده به ساختار نهفته آن با استفاده از PLS توسط هرمان ولد و همکارانش توسعه داده شد.

اسمارت PLS حتی در زمینه شیمی سنجی بسیار مورد توجه قرار گرفته است.

این الگوریتم به یک ابزار استاندارد برای پردازش طیف گسترده ای از مشکلات داده های شیمیایی تبدیل شده است.

موفقیت PLS در شیمی سنجی منجر به کاربردهای زیادی در زمینه های علمی دیگر از جمله بیوانفورماتیک، تحقیقات مواد غذایی، پزشکی، فارماکولوژی، علوم اجتماعی، فیزیولوژی شد.

اسمارت PLS که با دو بلوک از متغیرها سر و کار دارد در این فصل در نظر گرفته می‌شود، اگرچه افزونه‌های PLS برای مدل‌سازی روابط بین تعداد بیشتری از مجموعه‌ها وجود دارد.

اسمارت PLS شبیه به تجزیه و تحلیل همبستگی متعارف (CCA) است که در آن بردارهای نهفته با حداکثر همبستگی استخراج می شوند.

تکنیک‌های PLS مختلفی برای استخراج بردارهای نهفته وجود دارد و هر یک از آن‌ها نوعی از PLS را ایجاد می‌کنند.

اسمارت PLS را می توان به طور طبیعی به مشکلات رگرسیون تعمیم داد.

متغیرهای پیش بینی و پیش بینی شده (پاسخ) هر کدام به عنوان یک بلوک از متغیرها در نظر گرفته می شوند.

سپس PLS بردارهای امتیاز را استخراج می کند که به عنوان یک نمایش پیش بینی کننده جدید عمل می کنند و متغیرهای پاسخ را روی این پیش بینی کننده های جدید رگرسیون می کند.

عدم تقارن طبیعی بین متغیرهای پیش بینی کننده و پاسخ در روشی که بردارهای امتیاز محاسبه می شوند منعکس می شود. این نوع با نام های PLS1 (یک متغیر پاسخ) و PLS2 (حداقل دو متغیر پاسخ) شناخته می شود.

رگرسیون PLS قبلاً توسط آماردانان نادیده گرفته می شد و هنوز هم به جای یک مدل آماری دقیق به عنوان یک الگوریتم در نظر گرفته می شود [14]. با این حال در سال های گذشته، علاقه به ویژگی های آماری PLS افزایش یافته است.

اسمارت PLS با روش‌های رگرسیون دیگری مانند رگرسیون مؤلفه اصلی (PCR) و رگرسیون ریج (RR) مرتبط بوده است و همه این روش‌ها را می‌توان تحت یک رویکرد واحد به نام رگرسیون پیوسته قرار داد.