چکیدهتوزیع لاگ نرمال به طور عمده برای تجزیه و تحلیل داده های مثبت و چوله به راست مورد استفاده قرار می گیرد. این داده ها معمولا در مطالعات و تحقیقات زیست شناسی، پزشکی و اقتصادی بدست می آیند. ما در این رساله ابتدا به بررسی آزمون برابری میانگین های لاگ نرمال با استفاده از مفهوم p-مقدار تعمیم یافته (GP) که توسط لی (Li)(2009) معرفی شده است، می پردازیم. نتایج شبیه سازی ها نشان می دهد که این روش بهتر از روش های مجانبی دیگر چون آزمون ولچ عمل می کند. همچنین به مقایسه همزمان نسبت و اختلاف میانگین های لاگ نرمال با ساختن فواصل اطمینان همزمان که توسط شاراشمیت(Schaarschmidt) (2013) معرفی شده است، خواهیم پرداخت. او با بکارگیری تقریب نرمال، تصحیح بانفرونی و کمیت محوری تعمیم یافته(GPQ)، فواصل اطمینان همزمان را معرفی می کند. طبق نتایج بدست آمده از شبیه سازی ها، روش ارائه شده برپایه کمیت محوری تعمیم یافته بهتر از روش های دیگر عمل می کند. همچنین به معرفی فاصله اطمینان تعمیم یافته فیدوشیال که توسط هنیگ(Hannig et.al) (2006) برای مقایسه نسبت میانگین های لاگ نرمال استفاده شده است، می پردازیم. این فواصل اطمینان دارای پوشش مجانبی صحیح می باشد.کلید واژه:p -مقدار تعمیم یافته،کمیت محوری تعمیم یافته، کمیت محوری تعمیم یافته فیدوشیالفهرست مطالبعنوان صفحه فصل اول: مقدمه.................................................................................................................................................... 1-1- کاربردهای توزیع لاگ نرمال............................................................................................................................................................................. 21-2- ویژگی ها و خواص توزیع لاگ نرمال........................................................................................................................................................... 31-2-1- تابع چگالی احتمال.................................................................................................................................................................................. 31-2-2- رابطه توزیع لاگ نرمال با توزیع نرمال.......................................................................................................................................... 31-2-3- کمیت های توزیع لاگ نرمال............................................................................................................................................................. 41-2-4- برآوردگرهای ماکزیمم درستنمایی و نااریب پارامترها...................................................................................................... 61-3- بررسی میانگین توزیع لاگ نرمال................................................................................................................................................................. 61-3-1- پیشینه............................................................................................................................................................................................................... 71-3-2- آزمون برای میانگین توزیع لاگ نرمال......................................................................................................................................... 81-3-2-1-p -مقدار تعمیم یافته.................................................................................................................................................................. 81-3-3- فاصله اطمینان برای میانگین توزیع لاگ نرمال.................................................................................................................. 11فصل دوم: آزمون برابری میانگین های جوامع لاگ نرمال.................................................................................. 2-1- مقدمه.......................................................................................................................................................................................... 152-2- آزمون ها........................................................................................................................................................................................... 162-2-1- آزمون ولچ (Welchs test)....................................................................................................................................................... 171-2-2-1- روش ولچ (Welch Method)................................................................................................................................... 182-2-2- روش p-مقدار تعمیم یافته............................................................................................................................................................... 202-3- شبیه سازی............................................................................................................................................................................................................... 272-4- نتیجه گیری.............................................................................................................................................................................................................. 29فصل سوم : فواصل اطمینان همزمان برای مقایسه نسبت و اختلاف میانگین های جوامع لاگ نرمال.............. 3-1- مقدمه.......................................................................................................................................................................313-2- نمادها و پارامترها.................................................................................................................................................................................................. 313-3- روش های ساختن فواصل اطمینان همزمان....................................................................................................................................... 333-3-1- روش تقریب نرمال با تصحیح بانفرونی....................................................................................................................................... 333-3-2- روش کمیت محوری تعمیم یافته با تصحیح بانفرونی..................................................................................................... 363-3-3- روش تقریب نرمال و تصحیح آن بوسیله چندک های نرمال چند متغیره........................................................ 363-3-4- روش کمیت محوری تعمیم یافته................................................................................................................................................ 383-3-5- روش کمیت محوری تعمیم یافته فیدوشیال....................................................................................................................... 423-3-5-1- پیشینه........................................................................................................................................................................................... 443-3-5-2- معرفی روش ساختن فاصله اطمینان تعمیم یافته فیدوشیال................................................................... 453-3-5-3- فاصله اطمینان همزمان تعمیم یافته فیدوشیال................................................................................................ 463-3-5-4- خصوصیت مجانبی فواصل اطمینان همزمان تعمیم یافته فیدوشیال.................................................. 483-4- شبیه سازی مونت کارلو............................................................................................................................................................. 52فصل چهارم: مثال عددی و نتیجه گیری.............................................................................................................. 4-1- مثال عددی................................................................................................................................................................................................................ 634-2- نتیجه گیری.............................................................................................................................................................................................................. 66پیوست................................................................................................................................................................... پیوست 1 : برنامه نویسی.................................................................................................................................................................................................. 69پیوست 2 : لغت نامه فارسی- انگلیسی................................................................................................................................................ 97پیوست3 : لغت نامه انگلیسی-فارسی................................................................................................................................................... 101فهرست منابع و مراجع.................................................................................................................................... 105فهرست جدول هاعنوان و شماره صفحه جدول 2-3-1- برآورد مونت کارلو برای خطای نوع اول آزمون ها 28جدول 2-3-2- برآورد مونت کارلو برای توان آزمون ها 28جدول 3-1- مجموعه پارامترهای و انجام شده در شبیه سازی ها 54جدول 4-1- برآورد پارامترها در مثال 4-1 63جدول 4-2- فواصل اطمینان همزمان 95 درصدی عددی دو طرفه برای نسبت و اختلاف گروه ها با گروه کنترل در مثال 4-1 64جدول 4-3- فواصل اطمینان همزمان 95 درصدی دو طرفه برای نسبت گروه ها با گروه کنترل با روش دانت در مثال 4-1 65فهرست نمودارهاعنوان و شماره صفحهنمودار 1-2-1- تابع چگالی لاگ نرمال با و برای پنچ مقدار از 5نمودار 3-1- نمودار جعبه ای احتمال پوشش ها برای مجموعه پارامترهای تعریف شده در جدول 3-1 57نمودار 3-2- نمودار پراکندگی احتمال پوشش های روش GPQ و روش های ANB،ANMو GPQB برای مقایسه گروه ها با گروه کنترل 58نمودار 3-3- نمودار پراکندگی برآورد اریبی نسبی روش های GPQ و ANM برای 23 مجموعه پارامترهای تعریف شده در جدول 3-1 60نمودار 4-1(a)- نمودار جعبه ای برای مشاهدات مثال 4-1 63نمودار 4-2(b)- نمودار Q-Q مقادیر باقیمانده مدل یک طرفهANOVA برای داده های اصلی مثال 4-1 63نمودار 4-2(c)- نمودار Q-Q مقادیر باقیمانده مدل یک طرفه ANOVA برای داده های تبدیل یافته با تبدیل لگاریتم داده های اصلی مثال 4-1 63فهرست نشانه های اختصاری ANB : Asymptotic normality with the Bonferroni adjustmentANM : Asymptotic normality and multiplicity adjustmentANOVA : Analysis of varianceFGPQ : Fiducial generalized pivotal quantityGP : Generalized p-valueGPQ : Generalized pivotal quantityGPQB : Generalized pivotal quantity with Bonferroni adjustmentLN : log normalفصل اول: مقدمه1- مقدمه در این فصل توزیع لاگ نرمال و زمینه های کاربرد این توزیع را معرفی خواهیم کرد. همچنین برای آشنایی با مفاهیمی که در این پایان نامه استفاده می شود، به آزمون کردن و ساختن فاصله اطمینان برای میانگین این توزیع می پردازیم. 1-1- کاربردهای توزیع لاگ نرمال در تحقیقات و مطالعات پزشکی و زیست شناسی، داده های بدست آمده معمولا مثبت بوده و دارای توزیع راست چوله با واریانس هایی هستند که با افزایش میانگین افزایش می یابند. به ویژه زمانی که داده ها از فرآیندهای تکثیری بدست می آیند، می توان انتظار چنین ویژگی- هایی را داشت. به عنوان مثال آزمایشات ژنتیک و فرآیند متابولیسمی در سیستم زیستی دارای چنین شرایطی هستند. یک راه برای توجیه این ویژگی ها در نظر گرفتن توزیع لاگ نرمال برای داده ها می باشد. البته با توجه به رابطه توزیع لاگ نرمال با توزیع نرمال، این فرض را می توان با استفاده از نمودار چندکها یا آزمون شپیرو-ویلک(Shapiro-wilk test) برای داده- های نرمال بررسی کرد. برای انجام آزمون شپیرو-ویلک ابتدا لازم است از یک تبدیل لگاریتمی روی داده ها استفاده شود. زیرا اگر داده های اصلی لاگ نرمال باشند با این تبدیل داده ها دارای توزیع نرمالمی شوند.1-2- ویژگی ها و خواص توزیع لاگ نرمال 1-2-1- تابع چگالی احتمال توزیع لاگ نرمال دو پارامتری (LN) که با نماد نمایش داده می شود، دارای تابع چگالی احتمال به صورت زیر است:که در آن، پارامتر مکان و پارامتر مقیاس می باشد.با توجه به فرم تابع چگالی لاگ نرمال، این توزیع متعلق به خانواده توزیع های نمایی طبیعی است.1-2-2- رابطه توزیع لاگ نرمال با توزیع نرمال اگر فرض کنیم که دارای توزیع باشد، آنگاه دارای توزیع نرمال با میانگین و واریانس خواهد بود که با نماد نمایش می دهند و دارای تابع چگالی احتمال به صورت زیر است: 1-2-3- کمیت های توزیع لاگ نرمال اگر فرض کنیم که دارای توزیع باشد،آنگاه تابع مولد گشتاور که دارای توزیع است، به صورت زیر خواهد بود:از آن جایی که است، میانگین و واریانس متغیر را می توان به صورت زیر محاسبه کرد.که با تعریف داریمضریب تغییرات ، ضریب چولگی و ضریب برجستگی توزیع لاگ نرمال، به ترتیب به صورت زیر هستند:همچنین با توجه به اینکه میانه توزیع متغیر تصادفی است یعنیو اینکه تابع نمایی یک تابع صعودی و یک به یک می باشد پسبنابراین میانه توزیع متغیر تصادفی برابر با خواهد بود.همان طور که مشاهده می شود، توزیع لاگ نرمال یک توزیع با مقادیر مثبت است. در این توزیع کمیتی چون میانه فقط به پارامترو کمیت های همچون ضریب تغییرات، ضریب چولگی و ضریب برجستگی به پارامتر بستگی دارند، اما کمیت های بسیار مهم و کاربردی در تحلیل و استنباط آماری یعنی میانگین و واریانس آن تابعی از پارامترهای توزیع یعنی و می باشند. قابل ذکر است که این توزیع بشدت چوله می باشد و میزان چولگی آن به پارامتر بستگی دارد. برای روشن تر شدن این موضوع نمودار تابع چگالی احتمال چند توزیع لاگ نرمال با پارامتر و های مختلف در زیر آورده شده است. نمودار (1-2-1): تابع چگالی لاگ نرمال با برای پنچ مقدار از0.2 ―0.5 ―1 ―2 ―3 ― 1-2-4- برآوردگرهای درستنمایی ماکزیمم و نااریب پارامترها اگر فرض کنیم یک نمونه تصادفی از توزیع باشند، آنگاه، ، دارای توزیع خواهند بود، بنابراین برآوردگرهای درستنمایی ماکزیمم برای و به صورت زیر هستند:
فواصل اطمینان همزمان برای مقایسه میانگین های جوامع لاگ نرمال WORD
چکیدهتوزیع لاگ نرمال به طور عمده برای تجزیه و تحلیل داده های مثبت و چوله به راست مورد استفاده قرار می گیرد. این داده ها معمولا در مطالعات و تحقیقات زیست شناسی، پزشکی و اقتصادی بدست می آیند. ما در این رساله ابتدا به بررسی آزمون برابری میانگین های لاگ نرمال با استفاده از مفهوم p-مقدار تعمیم یافته (GP) که توسط لی (Li)(2009) معرفی شده است، می پردازیم. نتایج شبیه سازی ها نشان می دهد که این روش بهتر از روش های مجانبی دیگر چون آزمون ولچ عمل می کند. همچنین به مقایسه همزمان نسبت و اختلاف میانگین های لاگ نرمال با ساختن فواصل اطمینان همزمان که توسط شاراشمیت(Schaarschmidt) (2013) معرفی شده است، خواهیم پرداخت. او با بکارگیری تقریب نرمال، تصحیح بانفرونی و کمیت محوری تعمیم یافته(GPQ)، فواصل اطمینان همزمان را معرفی می کند. طبق نتایج بدست آمده از شبیه سازی ها، روش ارائه شده برپایه کمیت محوری تعمیم یافته بهتر از روش های دیگر عمل می کند. همچنین به معرفی فاصله اطمینان تعمیم یافته فیدوشیال که توسط هنیگ(Hannig et.al) (2006) برای مقایسه نسبت میانگین های لاگ نرمال استفاده شده است، می پردازیم. این فواصل اطمینان دارای پوشش مجانبی صحیح می باشد.کلید واژه:p -مقدار تعمیم یافته،کمیت محوری تعمیم یافته، کمیت محوری تعمیم یافته فیدوشیالفهرست مطالبعنوان صفحه فصل اول: مقدمه.................................................................................................................................................... 1-1- کاربردهای توزیع لاگ نرمال............................................................................................................................................................................. 21-2- ویژگی ها و خواص توزیع لاگ نرمال........................................................................................................................................................... 31-2-1- تابع چگالی احتمال.................................................................................................................................................................................. 31-2-2- رابطه توزیع لاگ نرمال با توزیع نرمال.......................................................................................................................................... 31-2-3- کمیت های توزیع لاگ نرمال............................................................................................................................................................. 41-2-4- برآوردگرهای ماکزیمم درستنمایی و نااریب پارامترها...................................................................................................... 61-3- بررسی میانگین توزیع لاگ نرمال................................................................................................................................................................. 61-3-1- پیشینه............................................................................................................................................................................................................... 71-3-2- آزمون برای میانگین توزیع لاگ نرمال......................................................................................................................................... 81-3-2-1-p -مقدار تعمیم یافته.................................................................................................................................................................. 81-3-3- فاصله اطمینان برای میانگین توزیع لاگ نرمال.................................................................................................................. 11فصل دوم: آزمون برابری میانگین های جوامع لاگ نرمال.................................................................................. 2-1- مقدمه.......................................................................................................................................................................................... 152-2- آزمون ها........................................................................................................................................................................................... 162-2-1- آزمون ولچ (Welchs test)....................................................................................................................................................... 171-2-2-1- روش ولچ (Welch Method)................................................................................................................................... 182-2-2- روش p-مقدار تعمیم یافته............................................................................................................................................................... 202-3- شبیه سازی............................................................................................................................................................................................................... 272-4- نتیجه گیری.............................................................................................................................................................................................................. 29فصل سوم : فواصل اطمینان همزمان برای مقایسه نسبت و اختلاف میانگین های جوامع لاگ نرمال.............. 3-1- مقدمه.......................................................................................................................................................................313-2- نمادها و پارامترها.................................................................................................................................................................................................. 313-3- روش های ساختن فواصل اطمینان همزمان....................................................................................................................................... 333-3-1- روش تقریب نرمال با تصحیح بانفرونی....................................................................................................................................... 333-3-2- روش کمیت محوری تعمیم یافته با تصحیح بانفرونی..................................................................................................... 363-3-3- روش تقریب نرمال و تصحیح آن بوسیله چندک های نرمال چند متغیره........................................................ 363-3-4- روش کمیت محوری تعمیم یافته................................................................................................................................................ 383-3-5- روش کمیت محوری تعمیم یافته فیدوشیال....................................................................................................................... 423-3-5-1- پیشینه........................................................................................................................................................................................... 443-3-5-2- معرفی روش ساختن فاصله اطمینان تعمیم یافته فیدوشیال................................................................... 453-3-5-3- فاصله اطمینان همزمان تعمیم یافته فیدوشیال................................................................................................ 463-3-5-4- خصوصیت مجانبی فواصل اطمینان همزمان تعمیم یافته فیدوشیال.................................................. 483-4- شبیه سازی مونت کارلو............................................................................................................................................................. 52فصل چهارم: مثال عددی و نتیجه گیری.............................................................................................................. 4-1- مثال عددی................................................................................................................................................................................................................ 634-2- نتیجه گیری.............................................................................................................................................................................................................. 66پیوست................................................................................................................................................................... پیوست 1 : برنامه نویسی.................................................................................................................................................................................................. 69پیوست 2 : لغت نامه فارسی- انگلیسی................................................................................................................................................ 97پیوست3 : لغت نامه انگلیسی-فارسی................................................................................................................................................... 101فهرست منابع و مراجع.................................................................................................................................... 105فهرست جدول هاعنوان و شماره صفحه جدول 2-3-1- برآورد مونت کارلو برای خطای نوع اول آزمون ها 28جدول 2-3-2- برآورد مونت کارلو برای توان آزمون ها 28جدول 3-1- مجموعه پارامترهای و انجام شده در شبیه سازی ها 54جدول 4-1- برآورد پارامترها در مثال 4-1 63جدول 4-2- فواصل اطمینان همزمان 95 درصدی عددی دو طرفه برای نسبت و اختلاف گروه ها با گروه کنترل در مثال 4-1 64جدول 4-3- فواصل اطمینان همزمان 95 درصدی دو طرفه برای نسبت گروه ها با گروه کنترل با روش دانت در مثال 4-1 65فهرست نمودارهاعنوان و شماره صفحهنمودار 1-2-1- تابع چگالی لاگ نرمال با و برای پنچ مقدار از 5نمودار 3-1- نمودار جعبه ای احتمال پوشش ها برای مجموعه پارامترهای تعریف شده در جدول 3-1 57نمودار 3-2- نمودار پراکندگی احتمال پوشش های روش GPQ و روش های ANB،ANMو GPQB برای مقایسه گروه ها با گروه کنترل 58نمودار 3-3- نمودار پراکندگی برآورد اریبی نسبی روش های GPQ و ANM برای 23 مجموعه پارامترهای تعریف شده در جدول 3-1 60نمودار 4-1(a)- نمودار جعبه ای برای مشاهدات مثال 4-1 63نمودار 4-2(b)- نمودار Q-Q مقادیر باقیمانده مدل یک طرفهANOVA برای داده های اصلی مثال 4-1 63نمودار 4-2(c)- نمودار Q-Q مقادیر باقیمانده مدل یک طرفه ANOVA برای داده های تبدیل یافته با تبدیل لگاریتم داده های اصلی مثال 4-1 63فهرست نشانه های اختصاری ANB : Asymptotic normality with the Bonferroni adjustmentANM : Asymptotic normality and multiplicity adjustmentANOVA : Analysis of varianceFGPQ : Fiducial generalized pivotal quantityGP : Generalized p-valueGPQ : Generalized pivotal quantityGPQB : Generalized pivotal quantity with Bonferroni adjustmentLN : log normalفصل اول: مقدمه1- مقدمه در این فصل توزیع لاگ نرمال و زمینه های کاربرد این توزیع را معرفی خواهیم کرد. همچنین برای آشنایی با مفاهیمی که در این پایان نامه استفاده می شود، به آزمون کردن و ساختن فاصله اطمینان برای میانگین این توزیع می پردازیم. 1-1- کاربردهای توزیع لاگ نرمال در تحقیقات و مطالعات پزشکی و زیست شناسی، داده های بدست آمده معمولا مثبت بوده و دارای توزیع راست چوله با واریانس هایی هستند که با افزایش میانگین افزایش می یابند. به ویژه زمانی که داده ها از فرآیندهای تکثیری بدست می آیند، می توان انتظار چنین ویژگی- هایی را داشت. به عنوان مثال آزمایشات ژنتیک و فرآیند متابولیسمی در سیستم زیستی دارای چنین شرایطی هستند. یک راه برای توجیه این ویژگی ها در نظر گرفتن توزیع لاگ نرمال برای داده ها می باشد. البته با توجه به رابطه توزیع لاگ نرمال با توزیع نرمال، این فرض را می توان با استفاده از نمودار چندکها یا آزمون شپیرو-ویلک(Shapiro-wilk test) برای داده- های نرمال بررسی کرد. برای انجام آزمون شپیرو-ویلک ابتدا لازم است از یک تبدیل لگاریتمی روی داده ها استفاده شود. زیرا اگر داده های اصلی لاگ نرمال باشند با این تبدیل داده ها دارای توزیع نرمالمی شوند.1-2- ویژگی ها و خواص توزیع لاگ نرمال 1-2-1- تابع چگالی احتمال توزیع لاگ نرمال دو پارامتری (LN) که با نماد نمایش داده می شود، دارای تابع چگالی احتمال به صورت زیر است:که در آن، پارامتر مکان و پارامتر مقیاس می باشد.با توجه به فرم تابع چگالی لاگ نرمال، این توزیع متعلق به خانواده توزیع های نمایی طبیعی است.1-2-2- رابطه توزیع لاگ نرمال با توزیع نرمال اگر فرض کنیم که دارای توزیع باشد، آنگاه دارای توزیع نرمال با میانگین و واریانس خواهد بود که با نماد نمایش می دهند و دارای تابع چگالی احتمال به صورت زیر است: 1-2-3- کمیت های توزیع لاگ نرمال اگر فرض کنیم که دارای توزیع باشد،آنگاه تابع مولد گشتاور که دارای توزیع است، به صورت زیر خواهد بود:از آن جایی که است، میانگین و واریانس متغیر را می توان به صورت زیر محاسبه کرد.که با تعریف داریمضریب تغییرات ، ضریب چولگی و ضریب برجستگی توزیع لاگ نرمال، به ترتیب به صورت زیر هستند:همچنین با توجه به اینکه میانه توزیع متغیر تصادفی است یعنیو اینکه تابع نمایی یک تابع صعودی و یک به یک می باشد پسبنابراین میانه توزیع متغیر تصادفی برابر با خواهد بود.همان طور که مشاهده می شود، توزیع لاگ نرمال یک توزیع با مقادیر مثبت است. در این توزیع کمیتی چون میانه فقط به پارامترو کمیت های همچون ضریب تغییرات، ضریب چولگی و ضریب برجستگی به پارامتر بستگی دارند، اما کمیت های بسیار مهم و کاربردی در تحلیل و استنباط آماری یعنی میانگین و واریانس آن تابعی از پارامترهای توزیع یعنی و می باشند. قابل ذکر است که این توزیع بشدت چوله می باشد و میزان چولگی آن به پارامتر بستگی دارد. برای روشن تر شدن این موضوع نمودار تابع چگالی احتمال چند توزیع لاگ نرمال با پارامتر و های مختلف در زیر آورده شده است. نمودار (1-2-1): تابع چگالی لاگ نرمال با برای پنچ مقدار از0.2 ―0.5 ―1 ―2 ―3 ― 1-2-4- برآوردگرهای درستنمایی ماکزیمم و نااریب پارامترها اگر فرض کنیم یک نمونه تصادفی از توزیع باشند، آنگاه، ، دارای توزیع خواهند بود، بنابراین برآوردگرهای درستنمایی ماکزیمم برای و به صورت زیر هستند: