👈فول فایل فور یو ff4u.ir 👉

انتخاب متغیر در رگرسیون چندکی word

ارتباط با ما

دانلود


انتخاب متغیر در رگرسیون چندکی word
 چکیده
رگرسیون چندکی توسط Koenker و Bassett در سال 1978 معرفی شد. پس از آن، این روش به یک روش مهم و پرکاربرد برای مطالعه توزیع شرطی کامل متغیر پاسخ و هم­چنین ابزاری مهم در آمار کاربردی، تبدیل شده است.
انتخاب متغیر در مدل­بندی آماری مدل­هایی که دارای بعد بالا هستند، مسئله­ی اساسی است. پرکاربردترین روش­ها، روش­های انتخاب گام­به­گام است. این روش­ها از نظر محاسباتی پرهزینه هستند و هم­چنین خطای تصادفی در فرآیند انتخاب متغیر را در نظر نمی­گیرند.
در این پایان­نامه روی جنبه­ی انتخاب متغیر رگرسیون چندکی تاوانیده، متمرکز می­شویم. تحت شرایطی، خواص پیش­گویی رگرسیون چندکی SCAD تاوانیده و adaptive-LASSOتاوانیده را نشان می­دهیم.
 کلید واژه : انتخاب متغیر، خواص پیشگویی، رگرسیون چندکی، adaptive-LASSO، SCAD  
 فهرست مطالب
عنوان صفحه
فصل اول: مقدمه
1-1- تاریخچه.......... 3
 فصل دوم: رگرسیون چندکی
2-1- چندک­ها و چندک­های شرطی ............................................................................................... 7
2-2- از رگرسیون میانگین تا رگرسیون چندکی .......................................................................... 8
2-3- از برآورد کمترین مربعات تا check function .................................................................. 12
2-4- از توزیع­های شرطی چوله تا رگرسیون چندکی ............................................................... 13
2-5- روش برآوردیابی ......................................................................................................................... 15
فصل سوم: رگرسیون چندکی خطی تاوانیده
3-1- رگرسیون چندکی خطی تاوانیده .......................................................................................... 18
3-2- رگرسیون چندکی خطی تاوانیده با تاوانLASSO........................................................... 20
3-3- رگرسیون چندکی خطی تاوانیده با تاوان LASSO انطباقی ........................................ 20
3-4- رگرسیون چندکی خطی تاوانیده با تاوان SCAD ........................................................... 21
عنوان صفحه
فصل چهارم: خواص مجانبی
4-1- خواص مجانبی ............................................................................................................................ 24
4-2- خواص مجانبی تاوان SCAD ................................................................................................. 25
4-3- خواص مجانبی تاوان LASSO انطباقی .............................................................................. 26
4-4- خطاهای تصادفی مستقل و ناهم­توزیع ................................................................................. 27
 
فصل پنجم: مثال کاربردی
مثال ........................................................................................................................................................... 30
 
فهرست منابع ومآخذ .............................................................................................................................. 35
 
پیوست
پیوست 1 ................................................................................................................................................. 40
پیوست 2 ................................................................................................................................................. 49
پیوست 3 ................................................................................................................................................. 54
پیوست 4 ................................................................................................................................................. 55
فهرست جدول ها
عنوان صفحه
جدول-1: نتایج شبیه­سازی برای سه روش مورد نظر با 1=λ و 1=و 10000=n................... 31
جدول-2: نتایج شبیه­سازی برای سه روش مورد نظر با 1=λ و 3=و 10000=n................... 32
جدول-3: نتایج شبیه­سازی برای سه روش موردنظر با 8=λو1=و 10000=n.................... 32
جدول-4: نتایج شبیه­سازی برای سه روش موردنظر با 8=λو3=و 10000=n.................... 33
جدول-5: نتایج شبیه­سازی برای سه روش موردنظر با 20=λو1=و 10000=n................. 33
جدول-6: نتایج شبیه­سازی برای سه روش موردنظر با 20=λو3=و 10000=n.................. 34
فهرست نمودارها
عنوان صفحه
 
نمودار1: 459 داده مربوط به حقوق استادان آمار آمریکا به عنوان تابعی از
سال­های استادی، به همراه نمودار رگرسیونی درجه دوم برازش داده شده................................. 10
نمودار 2: 459 داده مربوط به حقوق استادان آمار آمریکا به عنوان تابعی از
سال­های استادی، به همراه سه نمودار رگرسیونی چندکی................................................................ 11
نمودار 3: وزن در برابر سن 4011 دختر آمریکایی.............................................................................. 13
نمودار4: وزن در برابر سن 4011 دختر آمریکایی به همراه هفت نمودار
رگرسیونی چندکی........................................................................................................................................ 14
نمودار 5: نمونه­ای از نمودار تابع SCAD برای7/3= و 2= ....................................................... 22
نمودار 6: نمودار تابع LASSO.................................................................................................................. 22
فصل اول
مقدمه
رگرسیون (regression) در قلب آمار جای دارد.رگرسیون کمترین مربعات عادی (ordinary least square regression) (OLSR)میانگین متغیر پاسخ (response) را به عنوان تابعی از متغیرهای پیش­بینی­کننده (predictors)، برآورد می­کند. رگرسیون کمترین انحراف قدرمطلق (least absolute deviation regression) (LADR)، تابع میانه­ی شرطی (به شرط متغیرهای پیش­بینی­کننده) را به عنوان تابعی از متغیرهای پیش­بینی­کننده، برآورد می­کند. رگرسیون کمترین انحراف قدرمطلق، نسبت به مشاهدات پرت، پایاتر از رگرسیون کمترین مربعات است. Koenker و Bassett در سال 1978 ایده­ی مربوط به رگرسیون کمترین انحراف قدر مطلق را تعمیم دادند و رگرسیون چندکی (quantile regression) را مطرح کردند. رگرسیون چندکی، توابع چندکی شرطی (به شرط متغیرهای پیش­بینی­کننده) را به عنوان توابعی از متغیرهای پیش­بینی­کننده، برآورد می­کند. رگرسیون چندکی اطلاعات بیشتری از توزیع شرطی متغیر پاسخ ارائه می­دهد و رگرسیون کمترین انحراف قدر مطلق را به عنوان یک حالت خاص در بر می­گیرد. رگرسیون چندکی پس از معرفی توجه زیادی را به خود جلب کرده است و در زمینه­های گوناگون به کار برده شده است از جمله: اقتصاد (Koenker و Hendricks (1992)، Koenker و Hallock (2001))، آنالیز بقاء (Yang (1999)، Koenker و Geling (2001)) مطالعات ریزآرایه (microarray)(Wang و He (2007))، نمودار رشد (Wei و همکاران (2006)، Wei و He (2006)).
1-1- تاریخچه
انتخاب متغیر (variable selection) نقش اساسی در فرآیند ساختمان مدل ایفا می­کند. در عمل، به طور معمول تعداد زیادی متغیر پیش­بینی­کننده­ی کاندید وجود دارد. این متغیرها در مرحله­ی ابتدائی مدل­بندی، به حساب آورده می­شوند. همان طور که Fanو Liدر سال 2001 مورد بررسی قرار دادند این کار به سبب جلوگیری از انحراف از مدل اصلی صورت می­گیرد (اگر تعداد متغیرهای پیش­بینی­کننده­ی کمتری از آنچه در واقعیت وجود دارد، در مدل­بندی در نظر بگیریم، برآوردهای اریب حاصل می­شوند). اما نگه داشتن متغیرهای بی­ربط در مدل نهایی، نامطلوب است. چون این کار تفسیر مدل نهایی را مشکل می­نماید و ممکن است قدرت پیش­بینی آن را کاهش دهد. به این دلیل آماردانان معمولأ از روش انتخاب بهترین زیرمجموعه (best-subset selection) برای انتخاب متغیر استفاده می­کنند. با این حال به روش انتخاب بهترین زیر­مجموعه چند اشکال وارد است. شدیدترین آن­ها همان­طور که Breimanدر سال 1996 مورد بررسی قرار داد، عدم پایایی(stability) است. منظور از پایایی در این زمینه، این است که با تغییر اندک در متغیرهای پیش­بینی­کننده، در انتخاب بهترین زیرمجموعه تغییر زیادی صورت نگیرد. دیگر این­که زمانی که تعداد متغیرها زیاد است از نظر محاسباتی غیر عملی است. انتخاب گام به گام (stepwise-selection)جانشین محاسباتی برای انتخاب بهترین زیر مجموعه است. معذلک، انتخاب گام به گام بسیار متغیر است و اغلب اوقات به جواب بهینه­ی موضعی می­انجامد. به علاوه همان­طور که Fan و Liدرسال2001 و هم­چنین Shen و Ye در سال 2002 مورد بررسی قراردادند، این دستورالعمل­های انتخاب، خطای تصادفی را در مرحله­ی انتخاب متغیر در نظر نمی­گیرند.
برای انجام انتخاب متغیر، تاوان­های (penalties) گوناگونی معرفی شده­اند. تاوان که در LASSOمورد استفاده قرار می­گیرد، توسط Tibshirani در سال 1990 برای رسیدن به انتخاب متغیر معرفی شد. Fan و Li در سال 2001 یک روش متحد از طریق رگرسیون کمترین مربعات غیر مقعر، پیشنهاد کردند که به­طور همزمان عمل انتخاب متغیر و برآورد پارامترها را انجام می­دهد. این روش، جواب تنک (sparse) تولید می­کند، پایایی انتخاب متغیر را تضمین می­کند، و برآوردهای نااریب برای ضرائب بزرگ ارائه می­دهد. منظور از جواب تنک، ارائه برآورد صفر برای ضرائبی است که در واقعیت، تأثیر­گذار نیستند. این سه خاصیت پسندیده یک تاوان خوب است که توسط Fan و Li در سال 2001 مورد بررسی قرار گرفت. یک نمونه از تاوان غیر محدب، تابع انحراف قدرمطلق به طور هموار بریده شده (smoothly clipped absolute deviation) (SCAD) است که اولین بار توسط Fan در سال 1997 معرفی شد، و سپس توسط Fan و Li در سال 2001 مورد مطالعه بیشتر قرار گرفت تا خواص پیش­گویی (oracle properties) آن در زمینه درستنمایی تاوانیده (penalized likelihood) نشان داده شود. پس از آن، یک سری مقالات توسط Fan و Li در سال 2002 و 2004، Fan و Peng در سال 2004، Hunter و Li در سال 2005 نوشته شده و خواص دیگر آن مورد مطالعه قرار گرفته و الگوریتم­های جدیدی ارائه شده است.
Zou در سال 2006 با به کار بردن وزن­های انطباقی برای تاوانیدن ضرائب مختلف، در تاوان LASSO، تاوان LASSO انطباقی (adaptive-LASSO) را معرفی کرد و خواص پیش­گویی آن را نشان داد. نتایج مشابه در مقاله­هایی که توسط Yuan و Lin در سال 2007، Zhao و Yu در سال 2006 نوشته شده است، ساخته شد. Zhang و Lu در سال 2007 LASSO انطباقی را در مدل­های خطر متناسب (proportional hazard models) مورد مطالعه قرار دادند. Candes و Tao در سال 2007 هم­چنین Fan و Lv در سال 2006 انتخاب متغیر را در زمینه­هایی که از نظر بعدی بزرگتر از اندازه نمونه هستند، مورد مطالعه قرار دادند. Koenker در سال 2004 تاوان LASSO را برای مدل رگرسیون چندکی با اثرات آمیخته (mixed-effect quantile regression model) برای داده­های طولی به کار برد. Li و Zhu در سال 2005 راه حلی برای رگرسیون چندکی تاوانیده شده ( penalized quantile regression) ارائه کردند. Wang، Li و Jiang در سال 2007 رگرسیون کمترین انحراف قدر مطلق را با تاوان LASSO انطباقی در نظر گرفتند.
در این پایان­­نامه به انتخاب متغیر در رگرسیون چندکی تاوانیده می­پردازیم. توجه داشته باشید تابع زیانی که در رگرسیون چندکی مورد استفاده قرار می­گیرد در مبدأ مشتق­ پذیر نیست، در نتیجه خواص پیش­گویی کلی برای درستنمایی تاوانیده غیر مقعر که توسط Fan و Li در سال 2001 مورد مطالعه قرار گرفت، به طور مستقیم قابل اجرا نیست. در این پایان­نامه خواص پیش­گویی تاوان­های SCAD و LASSO انطباقی در زمینه­ی رگرسیون چندکی تاوانیده، که شامل رگرسیون کمترین انحراف قدرمطلق به عنوان یک حالت خاص می­باشد، تعمیم داده می­شود.

👇 تصادفی👇

نمونه سوالات تخصصی رشته کارشناسی حقوق- کیفر شناسی کد درس: 1223038مثنوی پیر و جواندانلود لایه shapefile مرز شهرستان قصرشیرینتعیین و بررسی عوامل اثرگذار بر مدیریت بهینه آب کشاورزی در سیستانپرسشنامه زمینه‌یابی سلامت ویر و شربورن – ۳۶ SF- (فرم کوتاه)دانلود نقشه کامل سینما موزه همراه با فایل 3dmaxپروژه تحلیل سینماتیک ربات های SCARA به کمک نرم افزار ADAMS/viewدانلود پروژه بازی پازل با زبان سی شارپعکسهای زیبای برفی شمال شرقی استان خوزستان ✅فایل های دیگر✅

#️⃣ برچسب های فایل انتخاب متغیر در رگرسیون چندکی word

انتخاب متغیر در رگرسیون چندکی word

دانلود انتخاب متغیر در رگرسیون چندکی word

خرید اینترنتی انتخاب متغیر در رگرسیون چندکی word

👇🏞 تصاویر 🏞