چکیدهدرمدلهای رگرسیون خطی، روشهای انقباضی یکی از راهحلها برای بهبود برآورد کمترین مربعات میباشد. در این پایاننامه، پس از معرفی مدل رگرسیون خطی چندگانه و مسئله چندهمخطی، ابتدا به معرفی روشهای انقباضی پرداخته و سپس به برآوردیابی در مدلهای رگرسیونی خطی با خطاهای خودبازگشتی به وسیله روش انقباضی لاسو میپردازیم. دو نوع برآوردگر لاسو سنتی و اصلاح شده را معرفی و خواص مجانبی آنها را مطالعه کردهایم. الگوریتمی را جهت محاسبه این برآوردگرها ارایه داده و در پایان با ارایه دو مثال به مقایسه این برآوردگرها پرداختهایم.کلید واژه: برآوردگرپیشگو، انقباض،مدل رگرسیونی با خطای خود بازگشتی، لاسوفصل اول: مقدمات و تعاریف مقدمه :21-1-رگرسیون خطی چندگانه و مسئله چند همخطی... 21-2-رگرسیون ریج.. 41-3-بریج.. 51-4-لاسو. 61-4-1-رفتار مجانبی ....... 81-5-تعاریف.... 101-5-1- تُنُکی... 101-5-2-برآوردگر پیشگو. 101-5-3-نماد لاندا111-5-4-بهینه سازی محدب... 121-5-5-1-همگرایی در توزیع.. 121-5-5-2-همگرایی در احتمال.. 131-5-5-3-سازگاری با نرخ ریشه ام. 131-5-5-4-همگرایی با احتمال یک..... 141-5-6-فرایند ایستا141-5-7-فرایند خودبازگشتی-میانگین متحرک.... 141-5-8-معیارهای انتخاب مدل.. 151-5-8-1-معیار اطلاع بیزی... 151-5-8-2-اعتبارسنجی متقابل... 16اعتبارسنجی متقابل لایه. 17 فصل دوم: برآوردگرهای لاسو برای پارامترهای مدل رگرسیون خطی با خطاهای خودبازگشتی2-1-مدل رگرسیون خطی با خطای سری زمانی... 212-2-برآوردکمترین مربعات درمدل رگرسیونی باخطاهای خودبازگشتی میانگین متحرک.... 222-3-برآورد کمترین مربعات پارامترها242-4-توزیع برآوردها262-5-برآوردیابی به روش لاسو برای پارامترهای مدل رگرسیون خطی با خطاهای خودبازگشتی... 282-6-خواص نظری برآوردگرهای لاسو. 302-6-1-خواص برآوردگر لاسو سنتی... 312-6-2-خواص برآوردگر لاسو اصلاح شده. 35 فصل سوم: الگوریتم دستیابی به برآوردگرهای لاسو در مدل رگرسیون خطی با خطای خود بازگشتی 3-1-فرایند تکراری... 423-2-تحدب موضعی 443-3-برآوردگر شروع.. 453-4-پارامترهای تنظیم کننده. 45 فصل چهارم: مثالهای کاربردی و شبیه سازی4-1-مثال شبیه سازی... 494-2-مثال واقعی... 52پیوست.... 55مارتینگل و قضیه حد مرکزی مارتینگلها56قضیه ارگودیک..... 57فهرست منابع و مآخذ.. 58واژه نامه فارسی به انگلیسی... 61واژه نامه انگلیسی به فارسی... 66 فهرست جدول هاعنوان صفحه جدول4-1: نتایج شبیه سازی برای .................................................................................... 51جدول4-2: نتایج مثال واقعی..................................................................................................................... 53 فهرست علائم اختصاریi.i.d: independent and identical distributionMSE: Mean Square ErrorCV: Cross ValidationGCV: Generalized Cross ValidationOLS: Ordinary Least Squareدر این فصل به تعاریف و مقدمات لازم از جمله مدل رگرسیون خطی چندگانه استاندارد، مفهوم چند همخطی، رگرسیون ریج، بریج، روش لاسو و ... که در فصلهای بعد به آنها نیاز داریم، خواهیم پرداخت. 1-1-رگرسیون خطی چندگانه و مسئله چند همخطییک مدل رگرسیون که شامل بیش از یک متغیر مستقل باشد و نسبت به پارامترها خطی باشد را مدل رگرسیون خطی چندگانه می نامند. فرم کلی یک مدل رگرسیون خطی چندگانه استاندارد به صورت زیر میباشد:که درآن متغیرهای تصادفی مستقل و هم توزیع با میانگین صفر و واریانس میباشد . بردار پارامترها، برای بردار متغیرهای مستقل و متغیر پاسخ میباشد. ماتریس را ماتریس طرح مینامیم.هنگامی که بین متغیر های مستقل همبستگی وجود داشته باشد، می گوییم بین آنها چند همخطی وجود دارد. از آثار چند همخطی می توان به موارد زیر اشاره کرد:الف : از آنجاییکه در این حالت اطلاعات مستقل در مورد هریک از متغیرهای مستقل وجود ندارد، لذا نمی توان اثرات جزئی متغیرهای مذکور روی متغیر وابسته را برآورد کرد .ب : هنگامی که همبستگی شدید بین متغیرهای مستقل وجود داشته باشد، کوواریانس و واریانس ضرایب، بزرگتر برآورد خواهند شد .ج : در حالتی که با چند همخطی شدید در مدل مواجه هستیم، پیش بینی های صورت گرفته از آن غیر قابل اعتماد خواهد بود. در این حالت پیش بینی ها براساس مدلی که دارای زیر مجموعه ای از متغیرهای مستقل مدل اصلی است، بهتر صورت می گیرد .د : رابطه قوی بین دو یا چند متغیر مستقل سبب می شود که نتوان ماتریس را معکوس کرد. زیرا در این صورت ستون های ماتریس به هم وابسته هستند و در نتیجه ستون های نیز با هم وابسته هستند و پررتبه نیست.همان طور که در قسمت ج گفتیم یکی از روش ها برای بهبود برآورد کمترین مربعات، زیر مجموعه منتخب می باشد که نتیجه گزینش بهترین زیر مجموعه رگرسیون می باشد . از روشهای زیر مجموعه منتخب میتوان به رگرسیون گام به گام، حذف پیشرو و انتخاب پسرو اشاره کرد. البته قابل ذکر است که زیر مجموعه منتخب خود دارای مشکل عدم استواری می باشد . به عنوان مثال با تغییر کوچک در داده ها مدل های خیلی متفاوتی را بوجود می آورد، که این امر درستی پیشبینی را کاهش می دهد.معمولا می توان درستی پیش بینی را با انقباض تعدادی از ضرایب و یا با صفر قرار دادن آنها بهبود بخشید. روش پیشنهادی برای بهبود روش برآورد کمترین مربعات، رگرسیونهای انقباضی است. از جمله رگرسیون ریج[1]، لاسو[2]و بریج[3]که به اختصار این روشها را توضیح میدهیم. برای توضیح بیشتر در مورد این روشها به سلیمانی(1392) مراجعه شود.
استنباط آماري مدل رگرسيوني با خطاهاي خودبازگشتي به روش لاسو word
چکیدهدرمدلهای رگرسیون خطی، روشهای انقباضی یکی از راهحلها برای بهبود برآورد کمترین مربعات میباشد. در این پایاننامه، پس از معرفی مدل رگرسیون خطی چندگانه و مسئله چندهمخطی، ابتدا به معرفی روشهای انقباضی پرداخته و سپس به برآوردیابی در مدلهای رگرسیونی خطی با خطاهای خودبازگشتی به وسیله روش انقباضی لاسو میپردازیم. دو نوع برآوردگر لاسو سنتی و اصلاح شده را معرفی و خواص مجانبی آنها را مطالعه کردهایم. الگوریتمی را جهت محاسبه این برآوردگرها ارایه داده و در پایان با ارایه دو مثال به مقایسه این برآوردگرها پرداختهایم.کلید واژه: برآوردگرپیشگو، انقباض،مدل رگرسیونی با خطای خود بازگشتی، لاسوفصل اول: مقدمات و تعاریف مقدمه :21-1-رگرسیون خطی چندگانه و مسئله چند همخطی... 21-2-رگرسیون ریج.. 41-3-بریج.. 51-4-لاسو. 61-4-1-رفتار مجانبی ....... 81-5-تعاریف.... 101-5-1- تُنُکی... 101-5-2-برآوردگر پیشگو. 101-5-3-نماد لاندا111-5-4-بهینه سازی محدب... 121-5-5-1-همگرایی در توزیع.. 121-5-5-2-همگرایی در احتمال.. 131-5-5-3-سازگاری با نرخ ریشه ام. 131-5-5-4-همگرایی با احتمال یک..... 141-5-6-فرایند ایستا141-5-7-فرایند خودبازگشتی-میانگین متحرک.... 141-5-8-معیارهای انتخاب مدل.. 151-5-8-1-معیار اطلاع بیزی... 151-5-8-2-اعتبارسنجی متقابل... 16اعتبارسنجی متقابل لایه. 17 فصل دوم: برآوردگرهای لاسو برای پارامترهای مدل رگرسیون خطی با خطاهای خودبازگشتی2-1-مدل رگرسیون خطی با خطای سری زمانی... 212-2-برآوردکمترین مربعات درمدل رگرسیونی باخطاهای خودبازگشتی میانگین متحرک.... 222-3-برآورد کمترین مربعات پارامترها242-4-توزیع برآوردها262-5-برآوردیابی به روش لاسو برای پارامترهای مدل رگرسیون خطی با خطاهای خودبازگشتی... 282-6-خواص نظری برآوردگرهای لاسو. 302-6-1-خواص برآوردگر لاسو سنتی... 312-6-2-خواص برآوردگر لاسو اصلاح شده. 35 فصل سوم: الگوریتم دستیابی به برآوردگرهای لاسو در مدل رگرسیون خطی با خطای خود بازگشتی 3-1-فرایند تکراری... 423-2-تحدب موضعی 443-3-برآوردگر شروع.. 453-4-پارامترهای تنظیم کننده. 45 فصل چهارم: مثالهای کاربردی و شبیه سازی4-1-مثال شبیه سازی... 494-2-مثال واقعی... 52پیوست.... 55مارتینگل و قضیه حد مرکزی مارتینگلها56قضیه ارگودیک..... 57فهرست منابع و مآخذ.. 58واژه نامه فارسی به انگلیسی... 61واژه نامه انگلیسی به فارسی... 66 فهرست جدول هاعنوان صفحه جدول4-1: نتایج شبیه سازی برای .................................................................................... 51جدول4-2: نتایج مثال واقعی..................................................................................................................... 53 فهرست علائم اختصاریi.i.d: independent and identical distributionMSE: Mean Square ErrorCV: Cross ValidationGCV: Generalized Cross ValidationOLS: Ordinary Least Squareدر این فصل به تعاریف و مقدمات لازم از جمله مدل رگرسیون خطی چندگانه استاندارد، مفهوم چند همخطی، رگرسیون ریج، بریج، روش لاسو و ... که در فصلهای بعد به آنها نیاز داریم، خواهیم پرداخت. 1-1-رگرسیون خطی چندگانه و مسئله چند همخطییک مدل رگرسیون که شامل بیش از یک متغیر مستقل باشد و نسبت به پارامترها خطی باشد را مدل رگرسیون خطی چندگانه می نامند. فرم کلی یک مدل رگرسیون خطی چندگانه استاندارد به صورت زیر میباشد:که درآن متغیرهای تصادفی مستقل و هم توزیع با میانگین صفر و واریانس میباشد . بردار پارامترها، برای بردار متغیرهای مستقل و متغیر پاسخ میباشد. ماتریس را ماتریس طرح مینامیم.هنگامی که بین متغیر های مستقل همبستگی وجود داشته باشد، می گوییم بین آنها چند همخطی وجود دارد. از آثار چند همخطی می توان به موارد زیر اشاره کرد:الف : از آنجاییکه در این حالت اطلاعات مستقل در مورد هریک از متغیرهای مستقل وجود ندارد، لذا نمی توان اثرات جزئی متغیرهای مذکور روی متغیر وابسته را برآورد کرد .ب : هنگامی که همبستگی شدید بین متغیرهای مستقل وجود داشته باشد، کوواریانس و واریانس ضرایب، بزرگتر برآورد خواهند شد .ج : در حالتی که با چند همخطی شدید در مدل مواجه هستیم، پیش بینی های صورت گرفته از آن غیر قابل اعتماد خواهد بود. در این حالت پیش بینی ها براساس مدلی که دارای زیر مجموعه ای از متغیرهای مستقل مدل اصلی است، بهتر صورت می گیرد .د : رابطه قوی بین دو یا چند متغیر مستقل سبب می شود که نتوان ماتریس را معکوس کرد. زیرا در این صورت ستون های ماتریس به هم وابسته هستند و در نتیجه ستون های نیز با هم وابسته هستند و پررتبه نیست.همان طور که در قسمت ج گفتیم یکی از روش ها برای بهبود برآورد کمترین مربعات، زیر مجموعه منتخب می باشد که نتیجه گزینش بهترین زیر مجموعه رگرسیون می باشد . از روشهای زیر مجموعه منتخب میتوان به رگرسیون گام به گام، حذف پیشرو و انتخاب پسرو اشاره کرد. البته قابل ذکر است که زیر مجموعه منتخب خود دارای مشکل عدم استواری می باشد . به عنوان مثال با تغییر کوچک در داده ها مدل های خیلی متفاوتی را بوجود می آورد، که این امر درستی پیشبینی را کاهش می دهد.معمولا می توان درستی پیش بینی را با انقباض تعدادی از ضرایب و یا با صفر قرار دادن آنها بهبود بخشید. روش پیشنهادی برای بهبود روش برآورد کمترین مربعات، رگرسیونهای انقباضی است. از جمله رگرسیون ریج[1]، لاسو[2]و بریج[3]که به اختصار این روشها را توضیح میدهیم. برای توضیح بیشتر در مورد این روشها به سلیمانی(1392) مراجعه شود.