فهرست مطالبچکیده.......1فصل اول : مقدمه21 - 1 اهداف تحقیق و تبیین صورت مسئله3فصل دوم : آزمون انطباقي کامپيوتري52 - 1 مقدمه52 - 2 انواع سنجش انطباقی52 - 3 انتخاب سوال92 - 4 پايان دادن به آزمون انطباقي122 - 5 کاربردهاي آزمون انطباقي کامپيوتري132 - 6 ساختار آزمون انطباقي کامپيوتري13فصل سوم : بحثهای مرتبط183 - 1 نظریه سوال پاسخ183 - 1 - 1 مقدمه183 - 1 - 2 مدلهاي نظريه سوال پاسخ213 - 1 - 3 مدلهاي دو ارزشي نظريه سوال پاسخ223 - 1 - 4 مدلهاي سوال پاسخ تک بعدي براي دادههاي دو ارزشي223 - 1 - 5 مدلهاي سوال پاسخ چند ارزشي273 - 1 - 6 نمرهگذاري آزمودنيها بر اساس مدلهاي نظريه سوال پاسخ273 - 1 -7 بيشنه پسين353 - 1 - 8 نمره گذاري به روش پسينمورد انتظار373 - 1 - 9 مدرج کردن سوالها (برآورد کردن)393 - 1 - 10 برآورد به روش بيشينه درستنمايي403 - 1 - 11 برآورد بيشينه درستنمايي با پارامترهاي معلوم شخص413 - 1 - 12 معادلههاي برآورد443 - 1 - 13 روش جستجوي نيوتن – رافسون443 - 1 - 14 بيشينه درستنمايي همزمان (JML)463 - 1 - 15 بيشينه درستنمايي حاشيهاي (MML)47چهار3 - 1 - 1 6 بيشينه درستنمايي شرطي (CML)513 - 2 شبکههای بیزین553 - 2 - 1 مقدمه553 - 2 - 2 استنتاج با استفاده از توزيع توام كامل563- 2 - 3 رابطههاي استقلال شرطي در شبكههاي بيزي593 - 2 - 4 نمايش كارآمد توزيعهاي شرطي603 - 2 - 5 يادگيري شبكههاي بيزين613 - 2 - 6 شبکه های باوری بیزین613 - 2 - 7 استفاده از شبکه های بیزین در آزمون انطباقی کامپیوتری633 - 3 شبکه های عصبی663 - 3 - 1 مقدمه663 - 3 - 2 کاربردهای شبکه های عصبی693 - 3 - 3 مزیتهای شبکههای عصبی693 - 3 - 4 محدودیتهای شبکههای عصبی703 - 3 - 5 تعمیم شبکه713 - 3 - 6 استراتژیهای یادگیری713 - 3 - 7 پیشبینی با استفاده از شبکههای عصبی72فصل چهارم : پیشنهاد روش بهبود یافته734 - 1 مقدمه734 - 2 مشکلات روشهای قبل744 - 3 روش پیشنهادی754 - 4 مدلسازی ساختار سوالات بر اساس شبکه بیزین774 - 5 مدلسازی آزمون با استفاده از شبکههای عصبی794 - 5 - 1 شبكه عصبي پرسپترون ساده804 - 5 - 2 شبكه عصبي پرسپترون چند لايه )MLP(814 - 5 - 3 شبكه با تابع پايه شعاعي(RBF)824 - 5 - 4 شبكه عصبی هرس جامع834 - 6 نتیجه گیری84فصل پنجم : پیادهسازی855 - 1 مقدمه855 - 2 مجموعه داده855 - 3 آزمایشات و نتایج85پنج5 - 3 - 1 آزمایش اول865 - 3 - 2 آزمایش دوم895 - 3 - 3 آزمایش سوم955 - 3 - 4 نتیجه گیری100فصل ششم : مقایسه و نتیجهگیری1026 - 1 مقدمه1026 - 2 نتیجه گیری1036 - 3 کارهای آتی105مراجع..106 شش فهرست شکلهاشکل 2‑1: فلوچارت الگوريتم آزمون کامپيوتر تطبيقي [6]9شکل 2‑2: توابع اطلاعات براي 10 سوال11شکل 2‑3: توابع اطلاعات براي 9 سوال12شکل 2‑4: توابع اطلاعات براي 8 سوال12شکل 2‑5 : انتخاب سوال انطباقي [10]14شکل 3‑1: منحني هاي ويژگي سوال از مدل لوجستيک يک پارامتري24شکل 3‑2: منحني هاي ويژگي سوال از مدل لوجستيک دو پارامتري25شکل 3‑3: منحني هاي ويژگي سوال از مدل لوجستيک سه پارامتري26شکل 3‑4: منحنيهاي سوال پاسخ براي سه سوال نمونه29شکل 3‑5: تابع درستنمايي براي آزمون 3 سوالي30شکل 3‑6: تابع لگاريتم درستنمايي براي آزمون 3 سوالي31شکل 3‑7: تابع احتمال لگاريتمي و مشتق اول و دوم آن32شکل 3‑8 : تابع توزيع طبيعي37شکل 3‑9: درستنمايي دادهها تحت اندازههاي مخنلف پارامتر يک سوال44شکل 3‑10 : انتگرالگيري گاووسي با پنج نقطه50شکل 3‑11: شبکه بيزی قلمرو دستگاه آژير جديد59شکل 3‑12: ارائه مفاهيم ساختاری به دو صورت معمول60شکل 3‑13: شبکه بیزین برای آزمون انطباقی64شکل 3‑14: شبکه بیزین برای موضوع و مباحث آن65شکل 3‑15: ساختار يك نورون مصنوعي67شکل 3‑16: ساختار يک شبکه عصبي مصنوعي68شکل 4‑1: گامهای روال الگوریتم پیشنهادی برای آزمون انطباقی کامپیوتری76شکل 4‑2: ساختار سوالات پیشنهادی در آزمون انطباقی پیشنهادی77شکل 4‑3: بلوک دیاگرام آزمون انطباقی مبتنی بر شبکه عصبی80شکل 4‑4: ساختار پرسپترون چندلايه با نرونهاي پنهان tansig و نرونهاي خروجي با تابع خطي [28].81شکل 4‑5: ساختار شبکه هاي تابع با پايه شعاعي [28]83شکل 5‑1: دقت شبکه عصبی آزمایش اول87شکل 5‑2: نسبت اهمیت ورودیها در ساخت مدل برای مجموعه A در آزمایش اول88شکل 5‑3 : نسبت اهمیت ورودیها در ساخت مدل برای مجموعه B در آزمایش اول89شکل 5‑4 : شمای کلی شبکه عصبی چند لایه پرسپترون (MLP)91شکل 5‑5 : دقت شبکه عصبی آزمایش دوم برای مجموعه A92شکل 5‑6 : نسبت اهمیت ورودیها در ساخت مدلبرای مجموعه A92شکل 5‑7 : پیشبینی توسط شکل برای مجموعه A در آزمایش دوم ( هدف : سطح آزمون دهنده )92شکل 5‑8 : دقت شبکه عصبی آزمایش دوم برای مجموعه B94هفتشکل 5‑9 : نسبت اهمیت ورودیها در آزمایش دوم برای ساخت مدل مجموعه B94شکل 5‑10 : پیشبینی توسط شکل در آزمایش دوم برای مجموعه B( هدف : سطح آزمون دهنده )95شکل 5‑11 : دقت شبکه عصبی آزمایش سوم برای مجموعه A97شکل 5‑12 : نسبت اهمیت ورودیها در آزمایش سوم برای ساخت مدل مجموعه A97شکل 5‑13:پیشبینی توسط شکل در آزمایش سوم برای مجموعه A(هدف : سطح آزمون دهنده)98شکل 5‑14: دقت شبکه عصبی آزمایش سوم برای مجموعه B99شکل 5‑15:نسبت اهمیت ورودیها در آزمایش سوم برای ساخت مدل مجموعه B99شکل 5‑16: پیشبینی توسط شکل در آزمایش سوم برای مجموعه B ( هدف : سطح آزمون دهنده )100شکل 6‑1: مجذور خطای استاندارد در سه مدل104 فهرست جداولجدول 2‑1 : مشاهده عملکرد توابع و بازخورد آنها بعد از پاسخ به سوال15جدول 3‑1: نمادهای متداول در مدلهای نظریه سوال پاسخ22جدول 3‑2: مجموعههاي تکرارشونده نيوتن– رافسون به دريافتن بيشينه احتمال برآورد سطح صفت33جدول 3‑3 : توزيع يک قلمرو ساده56جدول 5‑1 : مشخصات شبکه عصبی آزمایش اول بر روی مجموعه A87جدول 5‑2: نتایج اعمال مدل روی دادههای تست مجموعه A87جدول 5‑3 : مشخصات شبکه عصبی آزمایش اول بر روی مجموعه B88جدول 5‑4 : نتایج اعمال مدل روی دادههای تست مجموعه B89جدول 5‑5 : مشخصات شبکه عصبی آزمایش دوم بر روی مجموعه A90جدول 5‑6 : نتایج اعمال مدل روی دادههای تست مجموعه A90جدول 5‑7 : مشخصات شبکه عصبی آزمایش دوم بر روی مجموعه B93جدول 5‑8 : نتایج اعمال مدل آزمایش دوم روی دادههای تست مجموعه B93جدول 5‑9 : مشخصات شبکه عصبی آزمایش سوم بر روی مجموعه A96جدول 5‑10: نتایج اعمال مدل روی دادههای تست مجموعه A96جدول 5‑11 : مشخصات شبکه عصبی آزمایش سوم بر روی مجموعه B98جدول 5‑12: نتایج اعمال مدل آزمایش سوم روی دادههای تست مجموعه B99جدول 6‑1: مقایسه دقت تخمین زده شده در سه آزمایش مختلف بر روی مجموعه دادهها104جدول 6‑2: مقایسه زمان آموزش مدل در سه آزمایش مختلف بر روی مجموعه دادهها (دقیقه)104فهرست معادلاتمعادله 2‑1 تابع محاسبه اطلاعات فیشر9معادله 2‑210معادله 2‑3 : اطلاعات KL برای دو توزیع P و Q10معادله 2‑410معادله 3‑1: مدل راش23معادله 3‑2:مدل دو پارامتري24معادله 3‑3: مدل سه پارامتري25معادله 3‑4: تابع درستنمايي28معادله 3‑530معادله3‑630معادله3‑7: مشتق اول32معادله3‑8: مشتق دوم32معادله 3‑932معادله 3‑10: چگالي گرههاي انتگرال38معادله 3‑11: محاسبه اندازه صفت38معادله 3‑1238معادله3‑1341معادله3‑14: احتمال پاسخ مشاهده شده42معادله3‑15: لگاريتم احتمال پاسخ به سوال42معادله3‑16: درست نمايي الگوي پاسخدهي فرد s42معادله3‑17: درستنمايي دادهها42معادله3‑18: لگاريتم درستنمايي دادهها43معادله3‑19: اندازه بهبود يافته برآورد دشواري سوال45معادله3‑20: خطاي استاندارد مدل راش46معادله3‑21 : احتمال کناري الگوي پاسخدهي48معادله3‑22: احتمال به دست آوردن يک بردار پاسخ خاص Xp49معادله 3‑23: لگاريتم درستنمايي دادهها در MML50معادله 3‑24: احتمال يک الگوي خاص پاسخدهي52معادله 3‑2552معادله 3‑26: احتمال الگوي پاسخدهي52معادله 3‑2753معادله 3‑28: درستنمايي الگوي پاسخدهي53معادله 3‑29: درستنمايي دادهها در روش CML53نهمعادله 3‑30: لگاريتم درستنمايي53معادله 3‑31: معادلههاي برآورد CML54معادله 3‑3257معادله 3‑33 مدل احتمال سراسری مسئله به عنوان شبکه باوری بیزین62معادله 3‑34: توزیع احتمال شرطی برای هر مبحث Tj65معادله 3‑35: توزیع احتمال شرطی برای هر موضوع Aj65معادله 3‑3667معادله 4‑175معادله 4‑278معادله 4‑379معادله 4‑482 چکیدهآزمون انطباقی کامپیوتری یک روش رو به رشد ارزیابی در بسیاری از موسسات آموزشی و همچنین غیر آموزشی در سراسر جهان است. ویژگی متمایزکننده آزمون انطباقی کامپیوتری اجرای آزمون متناسب با توانایی آزموندهنده بر اساس پاسخ سوالات قبلی میباشد. از این رو، میتوان آزمون کوتاهتر را اجرا و در عین حال تخمین دقیقتری از توانایی آزموندهنده به دست آورد. روشهای مختلفی برای ایجاد آزمون انطباقی کامپیوتری بر اساس نظریه سوال پاسخ ارائه شده است. هدف این پایان نامه بهبود روش انتخاب سوال در آزمون انطباقی کامپیوتری بر اساس نظریه سوال پاسخ با توجه به سطح دانش آزموندهنده میباشد. در این پایان نامه علاوه بر پارامترهای سوال که در نظریه سوال پاسخ مطرح شده است، ساختاری برای سوالات پیشنهاد شده است که بر اساس آن میتوان روش انتخاب سوال را بهبود بخشید، علاوه بر این طول آزمون کوتاهتر خواهد شد. همچنین میتوان مبحثی که آزموندهنده در آن ضعیف میباشد را شناسایی و بر اساس آن رویکردی مناسب آزموندهنده پیشنهاد داد. یعنی اگر آزموندهندهای در مبحثی ضعیف بود، معلم میتواند تصمیمی متناسب با سطح آزموندهنده اتخاذ کند.در انتخاب سوال، موضوع دیگری که مطرح است محاسبه سطح توانایی آزموندهنده است، چون بر اساس سطح او، سوال مناسب برای او انتخاب میشود. روشهای مختلفی برای محاسبه و تخمین سطح آزموندهنده وجود دارد، در این پایان نامه از شبکههای عصبی برای تحمین سطح دانش استفاده شده است. سه مدل شبکه عصبی در اینجا مطرح شده است، مدل اول شبکه عصبی هرس جامع است که شبکهای دقیق ولی با طول زمان آموزش بالاست، مدلهای دیگر، شبکه عصبی پرسپترون چند لایه و مدل شبکه عصبی تابع پایه شعاعی است. واژگان کلیدی: سنجش کامپیوتری ، آزمون های مبتنی بر کامپیوتر ، آزمون انطباقی کامپیوتری، نظریه سوال پاسخ، شبکه بیزین، شبکه عصبی.آزمون يکي از رايجترين راههای آزمايش دانش است. هدف اصلي از آزمايش به منظور تعيين سطح دانش آزموندهندهاز يک يا چند موضوع که در آن زمينهي دانش انتخاب شده باشد، است. امروزه از روشهاي مختلفی نظير ارائه مطلب در کلاس ، نوشتن مقالات، پروژهها، و غيره برای ارزيابي دانش استفاده ميشود. با اين حال، رايجترين ابزار براي سنجش دانش، آزمون و امتحان شفاهي است. از آنجا که در دهههاي اخير کامپيوتر به عنوان بيشترين ابزار آموزش مورد استفاده بوده است، و از آنجايي که استفاده از آن در همه سطوح آموزش و پرورش رايج شده است، آزمون مبتني بر کامپيوتر بسيار مورد پسند است.امروزه از انواع روشهاي آزموني که در دسترس ميباشد، «آزمون انطباقي کامپيوتري» تعادلی حداکثری از دقت و کارايي را فراهم مي کند. در طول چند دهه گذشته، «آزمون انطباقي کامپيوتري» در زمينههاي آموزش، صدور گواهينامه و پروانه، بطورگسترده استفاده شده است. «آزمون انطباقي کامپيوتري» براساس پاسخ آزمودنی به سوالات پیشین، به صورت پیشروندهای، سوالاتی را انتخاب میکند که دقت آزمون را افزایش دهد. از نظر آزمودنی به نظر میرسد که دشواری سوال با سطح توانایی او انطباق پیدا میکند. به عنوان مثال، اگر آزمودنی در پاسخ به سوالی با دشواری متوسط خوب عمل کند به او سوالی ارائه میشود که دشواری بیشتری دارد و یا اگر در پاسخ به سوال با دشواری متوسط عمل کند سوال سادهتری ارائه میشود. در آزمونهای انطباقي کامپيوتري، در مقایسه با آزمونهای چند گزینهای ثابت که مجموعه ثابتی از سوالات به آزمودنی ارائه میشود، به تعداد سوالات کمتری نیاز دارد تا بتواند به همان نتایج دقیق دست پیدا کند. البته هیچ محدودیتی وجود ندارد که در روش شناسی «آزمون انطباقي کامپيوتري» الزاماً از سوالات چند گزینهای استفاده شود اما از آنجایی که اکثر سوالات چندگزینهای هستند، در بیشتر آزمونهای انطباقي کامپيوتري نیز از این نوع سوالات استفاده میشود.«آزمون انطباقي کامپيوتري» از اجرای سوالات نامربوط اجتناب میکند. مانند سوالهایی که برای آزمودنی خیلی آسان و یا خیلی سخت هستند و رفتارهایی نامناسب مثل حدس زدن، بی توجهی، و الگوهایی که پاسخ دادن را تحریک میکنند. این سوالات تا حد خیلی زیادی حذف می شوند. زمانی که سوالات به گونه ای ارائه شوند که با سطح توانایی آزمودنی منطبق نباشد و سطح چالش سوال (درجه دشواری) بالا باشد آزموندهنده مضطرب خواهد شد و اگر پایین باشد دچار بی علاقگی خواهد شد. تنها در صورتی فرد تجربه آزمون مناسب را تجربه خواهد کرد که دشواری سوال با سطح تواناییاش منطبق باشد که آزمونهای انطباقی این ویژگی را دارند.در این پایاننامه نحوه انتخاب سوال بعدی برای آزموندهندهرا با توجه به اینکه بیشترین نزدیکی به سطح دانش او داشته باشد را بهبود داده شده است. برای انتخاب سوال سه تابع برای آن تعریف شده است :در تابع اول سوالاتی که به موضوع مورد نظر مربوط است انتخاب میشوند. سپس در تابع با استفاده از نظریه سوال پاسخ و بهبود روشهای محاسبه احتمال پاسخگویی آزموندهنده به سوال، سوالاتی که بیشترین احتمال را دارند که آزمون دهندهآنها را پاسخ دهد انتخاب میشوند. بعد از آنکه سوالات در تابع دوم انتخاب شدند، بر اساس سابقه سوالات، از بین آنها یک سوال انتخاب و از آزموندهنده پرسیده میشود. بهبود فرآیند انتخاب سوال در تابع اول و دوم در این پایاننامه مورد نظر است. در واقع سوالاتی انتخاب خواهد شد که برای آزموندهنده از نظر سنجش دانش او، بهترین هستند.در این پایاننامه، ساختار آزمون انطباقی کامپیوتری شرح داده خواهد شد که با ترکیب روشهای استفاده شده توسط دیگران و تغییری در پیادهسازی آنها ساخته میشود، پارامترهای مطرح شده در نظریه سوال پاسخ برای انتخاب سوال کافی نمیباشد و نیاز به ویژگیهای دیگری در این تابع است، به همین منظور ساختار سوال را با استفاده از موضوع، مبحث و مفهوم ایجاد کرده و سوالات با این دستهبندی از بانک سوالات انتخاب میشوند و در صورتی که آزموندهنده در مفهومی قوی بود، میتوان آن مفهوم را کنار گذاشته و به مفهوم دیگری مراجعه کرد.مسئله مهم دیگری که در انتخاب سوالات آزمون انطباقی کامپیوتری باید به آن توجه کرد، برآورد و تخمین سطح دانش آزموندهنده است. روشهای مختلفی برای این برآورد وجود دارد که میتوان به اطلاعات فیشر، روش نیوتن-رافستر ، شبکههای بیزین و شبکه عصبی اشاره نمود. در این پایان نامه این برآورد با استفاده از سه مدل شبکه عصبی که عبارتند از شبکه عصبی هرس جامع، شبکه عصبی پرسپترون چند لایه و شبکه عصبی تابع پایه شعاعی. در این پایان نامه، این سه مدل شبکه عصبی را پیادهسازی و با استفاده از نتایج بدست آمده مقایسه خواهند شد.این پایان نامه بدین صورت سازماندهی شده است. در فصل دوم در مورد آزمون انطباقی کامپیوتری بحث خواهد شد و در فصل سوم مباحث مرتبط با آزمون انطباقی کامپیوتری که شامل نظریه سوال پاسخ، شبکههای بیزین و کاربرد آن در آزمون انطباقی کامپیوتری و در آخر شبکههای عصبی، بحث خواهد شد. در فصل چهارم روش پیشنهاد شده شرح داده خواهد شد و در فصل پنجم در مورد پیادهسازی روش پیشنهادی صحبت میشود. در فصل ششم، مقایسات و نتیجهگیریها و کارهای آینده صحبت خواهد شد.«آزمون انطباقي کامپيوتري» توسط لرد (1971) ، اوون (1975)، و وایس (1976)، در میان دیگران، برای اندازهگیری سطح توانایی آزموندهندهها با دقت بیشتر از آزمونهای معمولی و با ساخت یک آزمون فردی برای هر آزموندهنده، پیشنهاد شد [1].«آزمون انطباقي کامپيوتري» از نوع آزمون توسعه يافته براي افزايش بهرهوري برآورد دانش آزموندهنده است. هدف اصلی «آزمون انطباقي کامپيوتري»، بهینه کردن فرآیند یادگیری آزموندهنده است [2]. که برآورد را با انتخاب سوالها براي آزموندهنده بر اساس پاسخهاي خود (بنابراين اغلب به آن، آزمون مناسب[1] گفته ميشود) در طول مدت آزمون قبلي به دست آورد. درجه دشواري سوال بعدي به طوري انتخاب مي شود که براي آزموندهنده نه خيلي سخت باشد و نه خيلي آسان. بطور دقيقتر، سوال طوري انتخاب مي شود که آزموندهنده با احتمال 50 درصد سوال را به درستي پاسخ دهد. البته، سوال اول نميتواند از اين راه تعيين شود چرا که در اين نقطه هيچ چيز شناخته شدهاي در مورد قابليتهاي امتحان بدست نيامده است (سوال با دشواري متوسط انتخاب ميشود)، اما انتخاب از سوال دوم به بعد را ميتوان براي هر آزموندهنده با سازگاري بهتر انتخاب نمود. با هر پاسخ به سوال ، کامپيوتر به طور بهتري ميتواند ارزيابي دانش آزمونگر را انجام دهد. [1] Tailored
بهبود هوشمندانه انتخاب سوال بر پایه سطح دانش آزمون دهنده در آزمون انطباقی کامپیوتری WORD
فهرست مطالبچکیده.......1فصل اول : مقدمه21 - 1 اهداف تحقیق و تبیین صورت مسئله3فصل دوم : آزمون انطباقي کامپيوتري52 - 1 مقدمه52 - 2 انواع سنجش انطباقی52 - 3 انتخاب سوال92 - 4 پايان دادن به آزمون انطباقي122 - 5 کاربردهاي آزمون انطباقي کامپيوتري132 - 6 ساختار آزمون انطباقي کامپيوتري13فصل سوم : بحثهای مرتبط183 - 1 نظریه سوال پاسخ183 - 1 - 1 مقدمه183 - 1 - 2 مدلهاي نظريه سوال پاسخ213 - 1 - 3 مدلهاي دو ارزشي نظريه سوال پاسخ223 - 1 - 4 مدلهاي سوال پاسخ تک بعدي براي دادههاي دو ارزشي223 - 1 - 5 مدلهاي سوال پاسخ چند ارزشي273 - 1 - 6 نمرهگذاري آزمودنيها بر اساس مدلهاي نظريه سوال پاسخ273 - 1 -7 بيشنه پسين353 - 1 - 8 نمره گذاري به روش پسينمورد انتظار373 - 1 - 9 مدرج کردن سوالها (برآورد کردن)393 - 1 - 10 برآورد به روش بيشينه درستنمايي403 - 1 - 11 برآورد بيشينه درستنمايي با پارامترهاي معلوم شخص413 - 1 - 12 معادلههاي برآورد443 - 1 - 13 روش جستجوي نيوتن – رافسون443 - 1 - 14 بيشينه درستنمايي همزمان (JML)463 - 1 - 15 بيشينه درستنمايي حاشيهاي (MML)47چهار3 - 1 - 1 6 بيشينه درستنمايي شرطي (CML)513 - 2 شبکههای بیزین553 - 2 - 1 مقدمه553 - 2 - 2 استنتاج با استفاده از توزيع توام كامل563- 2 - 3 رابطههاي استقلال شرطي در شبكههاي بيزي593 - 2 - 4 نمايش كارآمد توزيعهاي شرطي603 - 2 - 5 يادگيري شبكههاي بيزين613 - 2 - 6 شبکه های باوری بیزین613 - 2 - 7 استفاده از شبکه های بیزین در آزمون انطباقی کامپیوتری633 - 3 شبکه های عصبی663 - 3 - 1 مقدمه663 - 3 - 2 کاربردهای شبکه های عصبی693 - 3 - 3 مزیتهای شبکههای عصبی693 - 3 - 4 محدودیتهای شبکههای عصبی703 - 3 - 5 تعمیم شبکه713 - 3 - 6 استراتژیهای یادگیری713 - 3 - 7 پیشبینی با استفاده از شبکههای عصبی72فصل چهارم : پیشنهاد روش بهبود یافته734 - 1 مقدمه734 - 2 مشکلات روشهای قبل744 - 3 روش پیشنهادی754 - 4 مدلسازی ساختار سوالات بر اساس شبکه بیزین774 - 5 مدلسازی آزمون با استفاده از شبکههای عصبی794 - 5 - 1 شبكه عصبي پرسپترون ساده804 - 5 - 2 شبكه عصبي پرسپترون چند لايه )MLP(814 - 5 - 3 شبكه با تابع پايه شعاعي(RBF)824 - 5 - 4 شبكه عصبی هرس جامع834 - 6 نتیجه گیری84فصل پنجم : پیادهسازی855 - 1 مقدمه855 - 2 مجموعه داده855 - 3 آزمایشات و نتایج85پنج5 - 3 - 1 آزمایش اول865 - 3 - 2 آزمایش دوم895 - 3 - 3 آزمایش سوم955 - 3 - 4 نتیجه گیری100فصل ششم : مقایسه و نتیجهگیری1026 - 1 مقدمه1026 - 2 نتیجه گیری1036 - 3 کارهای آتی105مراجع..106 شش فهرست شکلهاشکل 2‑1: فلوچارت الگوريتم آزمون کامپيوتر تطبيقي [6]9شکل 2‑2: توابع اطلاعات براي 10 سوال11شکل 2‑3: توابع اطلاعات براي 9 سوال12شکل 2‑4: توابع اطلاعات براي 8 سوال12شکل 2‑5 : انتخاب سوال انطباقي [10]14شکل 3‑1: منحني هاي ويژگي سوال از مدل لوجستيک يک پارامتري24شکل 3‑2: منحني هاي ويژگي سوال از مدل لوجستيک دو پارامتري25شکل 3‑3: منحني هاي ويژگي سوال از مدل لوجستيک سه پارامتري26شکل 3‑4: منحنيهاي سوال پاسخ براي سه سوال نمونه29شکل 3‑5: تابع درستنمايي براي آزمون 3 سوالي30شکل 3‑6: تابع لگاريتم درستنمايي براي آزمون 3 سوالي31شکل 3‑7: تابع احتمال لگاريتمي و مشتق اول و دوم آن32شکل 3‑8 : تابع توزيع طبيعي37شکل 3‑9: درستنمايي دادهها تحت اندازههاي مخنلف پارامتر يک سوال44شکل 3‑10 : انتگرالگيري گاووسي با پنج نقطه50شکل 3‑11: شبکه بيزی قلمرو دستگاه آژير جديد59شکل 3‑12: ارائه مفاهيم ساختاری به دو صورت معمول60شکل 3‑13: شبکه بیزین برای آزمون انطباقی64شکل 3‑14: شبکه بیزین برای موضوع و مباحث آن65شکل 3‑15: ساختار يك نورون مصنوعي67شکل 3‑16: ساختار يک شبکه عصبي مصنوعي68شکل 4‑1: گامهای روال الگوریتم پیشنهادی برای آزمون انطباقی کامپیوتری76شکل 4‑2: ساختار سوالات پیشنهادی در آزمون انطباقی پیشنهادی77شکل 4‑3: بلوک دیاگرام آزمون انطباقی مبتنی بر شبکه عصبی80شکل 4‑4: ساختار پرسپترون چندلايه با نرونهاي پنهان tansig و نرونهاي خروجي با تابع خطي [28].81شکل 4‑5: ساختار شبکه هاي تابع با پايه شعاعي [28]83شکل 5‑1: دقت شبکه عصبی آزمایش اول87شکل 5‑2: نسبت اهمیت ورودیها در ساخت مدل برای مجموعه A در آزمایش اول88شکل 5‑3 : نسبت اهمیت ورودیها در ساخت مدل برای مجموعه B در آزمایش اول89شکل 5‑4 : شمای کلی شبکه عصبی چند لایه پرسپترون (MLP)91شکل 5‑5 : دقت شبکه عصبی آزمایش دوم برای مجموعه A92شکل 5‑6 : نسبت اهمیت ورودیها در ساخت مدلبرای مجموعه A92شکل 5‑7 : پیشبینی توسط شکل برای مجموعه A در آزمایش دوم ( هدف : سطح آزمون دهنده )92شکل 5‑8 : دقت شبکه عصبی آزمایش دوم برای مجموعه B94هفتشکل 5‑9 : نسبت اهمیت ورودیها در آزمایش دوم برای ساخت مدل مجموعه B94شکل 5‑10 : پیشبینی توسط شکل در آزمایش دوم برای مجموعه B( هدف : سطح آزمون دهنده )95شکل 5‑11 : دقت شبکه عصبی آزمایش سوم برای مجموعه A97شکل 5‑12 : نسبت اهمیت ورودیها در آزمایش سوم برای ساخت مدل مجموعه A97شکل 5‑13:پیشبینی توسط شکل در آزمایش سوم برای مجموعه A(هدف : سطح آزمون دهنده)98شکل 5‑14: دقت شبکه عصبی آزمایش سوم برای مجموعه B99شکل 5‑15:نسبت اهمیت ورودیها در آزمایش سوم برای ساخت مدل مجموعه B99شکل 5‑16: پیشبینی توسط شکل در آزمایش سوم برای مجموعه B ( هدف : سطح آزمون دهنده )100شکل 6‑1: مجذور خطای استاندارد در سه مدل104 فهرست جداولجدول 2‑1 : مشاهده عملکرد توابع و بازخورد آنها بعد از پاسخ به سوال15جدول 3‑1: نمادهای متداول در مدلهای نظریه سوال پاسخ22جدول 3‑2: مجموعههاي تکرارشونده نيوتن– رافسون به دريافتن بيشينه احتمال برآورد سطح صفت33جدول 3‑3 : توزيع يک قلمرو ساده56جدول 5‑1 : مشخصات شبکه عصبی آزمایش اول بر روی مجموعه A87جدول 5‑2: نتایج اعمال مدل روی دادههای تست مجموعه A87جدول 5‑3 : مشخصات شبکه عصبی آزمایش اول بر روی مجموعه B88جدول 5‑4 : نتایج اعمال مدل روی دادههای تست مجموعه B89جدول 5‑5 : مشخصات شبکه عصبی آزمایش دوم بر روی مجموعه A90جدول 5‑6 : نتایج اعمال مدل روی دادههای تست مجموعه A90جدول 5‑7 : مشخصات شبکه عصبی آزمایش دوم بر روی مجموعه B93جدول 5‑8 : نتایج اعمال مدل آزمایش دوم روی دادههای تست مجموعه B93جدول 5‑9 : مشخصات شبکه عصبی آزمایش سوم بر روی مجموعه A96جدول 5‑10: نتایج اعمال مدل روی دادههای تست مجموعه A96جدول 5‑11 : مشخصات شبکه عصبی آزمایش سوم بر روی مجموعه B98جدول 5‑12: نتایج اعمال مدل آزمایش سوم روی دادههای تست مجموعه B99جدول 6‑1: مقایسه دقت تخمین زده شده در سه آزمایش مختلف بر روی مجموعه دادهها104جدول 6‑2: مقایسه زمان آموزش مدل در سه آزمایش مختلف بر روی مجموعه دادهها (دقیقه)104فهرست معادلاتمعادله 2‑1 تابع محاسبه اطلاعات فیشر9معادله 2‑210معادله 2‑3 : اطلاعات KL برای دو توزیع P و Q10معادله 2‑410معادله 3‑1: مدل راش23معادله 3‑2:مدل دو پارامتري24معادله 3‑3: مدل سه پارامتري25معادله 3‑4: تابع درستنمايي28معادله 3‑530معادله3‑630معادله3‑7: مشتق اول32معادله3‑8: مشتق دوم32معادله 3‑932معادله 3‑10: چگالي گرههاي انتگرال38معادله 3‑11: محاسبه اندازه صفت38معادله 3‑1238معادله3‑1341معادله3‑14: احتمال پاسخ مشاهده شده42معادله3‑15: لگاريتم احتمال پاسخ به سوال42معادله3‑16: درست نمايي الگوي پاسخدهي فرد s42معادله3‑17: درستنمايي دادهها42معادله3‑18: لگاريتم درستنمايي دادهها43معادله3‑19: اندازه بهبود يافته برآورد دشواري سوال45معادله3‑20: خطاي استاندارد مدل راش46معادله3‑21 : احتمال کناري الگوي پاسخدهي48معادله3‑22: احتمال به دست آوردن يک بردار پاسخ خاص Xp49معادله 3‑23: لگاريتم درستنمايي دادهها در MML50معادله 3‑24: احتمال يک الگوي خاص پاسخدهي52معادله 3‑2552معادله 3‑26: احتمال الگوي پاسخدهي52معادله 3‑2753معادله 3‑28: درستنمايي الگوي پاسخدهي53معادله 3‑29: درستنمايي دادهها در روش CML53نهمعادله 3‑30: لگاريتم درستنمايي53معادله 3‑31: معادلههاي برآورد CML54معادله 3‑3257معادله 3‑33 مدل احتمال سراسری مسئله به عنوان شبکه باوری بیزین62معادله 3‑34: توزیع احتمال شرطی برای هر مبحث Tj65معادله 3‑35: توزیع احتمال شرطی برای هر موضوع Aj65معادله 3‑3667معادله 4‑175معادله 4‑278معادله 4‑379معادله 4‑482 چکیدهآزمون انطباقی کامپیوتری یک روش رو به رشد ارزیابی در بسیاری از موسسات آموزشی و همچنین غیر آموزشی در سراسر جهان است. ویژگی متمایزکننده آزمون انطباقی کامپیوتری اجرای آزمون متناسب با توانایی آزموندهنده بر اساس پاسخ سوالات قبلی میباشد. از این رو، میتوان آزمون کوتاهتر را اجرا و در عین حال تخمین دقیقتری از توانایی آزموندهنده به دست آورد. روشهای مختلفی برای ایجاد آزمون انطباقی کامپیوتری بر اساس نظریه سوال پاسخ ارائه شده است. هدف این پایان نامه بهبود روش انتخاب سوال در آزمون انطباقی کامپیوتری بر اساس نظریه سوال پاسخ با توجه به سطح دانش آزموندهنده میباشد. در این پایان نامه علاوه بر پارامترهای سوال که در نظریه سوال پاسخ مطرح شده است، ساختاری برای سوالات پیشنهاد شده است که بر اساس آن میتوان روش انتخاب سوال را بهبود بخشید، علاوه بر این طول آزمون کوتاهتر خواهد شد. همچنین میتوان مبحثی که آزموندهنده در آن ضعیف میباشد را شناسایی و بر اساس آن رویکردی مناسب آزموندهنده پیشنهاد داد. یعنی اگر آزموندهندهای در مبحثی ضعیف بود، معلم میتواند تصمیمی متناسب با سطح آزموندهنده اتخاذ کند.در انتخاب سوال، موضوع دیگری که مطرح است محاسبه سطح توانایی آزموندهنده است، چون بر اساس سطح او، سوال مناسب برای او انتخاب میشود. روشهای مختلفی برای محاسبه و تخمین سطح آزموندهنده وجود دارد، در این پایان نامه از شبکههای عصبی برای تحمین سطح دانش استفاده شده است. سه مدل شبکه عصبی در اینجا مطرح شده است، مدل اول شبکه عصبی هرس جامع است که شبکهای دقیق ولی با طول زمان آموزش بالاست، مدلهای دیگر، شبکه عصبی پرسپترون چند لایه و مدل شبکه عصبی تابع پایه شعاعی است. واژگان کلیدی: سنجش کامپیوتری ، آزمون های مبتنی بر کامپیوتر ، آزمون انطباقی کامپیوتری، نظریه سوال پاسخ، شبکه بیزین، شبکه عصبی.آزمون يکي از رايجترين راههای آزمايش دانش است. هدف اصلي از آزمايش به منظور تعيين سطح دانش آزموندهندهاز يک يا چند موضوع که در آن زمينهي دانش انتخاب شده باشد، است. امروزه از روشهاي مختلفی نظير ارائه مطلب در کلاس ، نوشتن مقالات، پروژهها، و غيره برای ارزيابي دانش استفاده ميشود. با اين حال، رايجترين ابزار براي سنجش دانش، آزمون و امتحان شفاهي است. از آنجا که در دهههاي اخير کامپيوتر به عنوان بيشترين ابزار آموزش مورد استفاده بوده است، و از آنجايي که استفاده از آن در همه سطوح آموزش و پرورش رايج شده است، آزمون مبتني بر کامپيوتر بسيار مورد پسند است.امروزه از انواع روشهاي آزموني که در دسترس ميباشد، «آزمون انطباقي کامپيوتري» تعادلی حداکثری از دقت و کارايي را فراهم مي کند. در طول چند دهه گذشته، «آزمون انطباقي کامپيوتري» در زمينههاي آموزش، صدور گواهينامه و پروانه، بطورگسترده استفاده شده است. «آزمون انطباقي کامپيوتري» براساس پاسخ آزمودنی به سوالات پیشین، به صورت پیشروندهای، سوالاتی را انتخاب میکند که دقت آزمون را افزایش دهد. از نظر آزمودنی به نظر میرسد که دشواری سوال با سطح توانایی او انطباق پیدا میکند. به عنوان مثال، اگر آزمودنی در پاسخ به سوالی با دشواری متوسط خوب عمل کند به او سوالی ارائه میشود که دشواری بیشتری دارد و یا اگر در پاسخ به سوال با دشواری متوسط عمل کند سوال سادهتری ارائه میشود. در آزمونهای انطباقي کامپيوتري، در مقایسه با آزمونهای چند گزینهای ثابت که مجموعه ثابتی از سوالات به آزمودنی ارائه میشود، به تعداد سوالات کمتری نیاز دارد تا بتواند به همان نتایج دقیق دست پیدا کند. البته هیچ محدودیتی وجود ندارد که در روش شناسی «آزمون انطباقي کامپيوتري» الزاماً از سوالات چند گزینهای استفاده شود اما از آنجایی که اکثر سوالات چندگزینهای هستند، در بیشتر آزمونهای انطباقي کامپيوتري نیز از این نوع سوالات استفاده میشود.«آزمون انطباقي کامپيوتري» از اجرای سوالات نامربوط اجتناب میکند. مانند سوالهایی که برای آزمودنی خیلی آسان و یا خیلی سخت هستند و رفتارهایی نامناسب مثل حدس زدن، بی توجهی، و الگوهایی که پاسخ دادن را تحریک میکنند. این سوالات تا حد خیلی زیادی حذف می شوند. زمانی که سوالات به گونه ای ارائه شوند که با سطح توانایی آزمودنی منطبق نباشد و سطح چالش سوال (درجه دشواری) بالا باشد آزموندهنده مضطرب خواهد شد و اگر پایین باشد دچار بی علاقگی خواهد شد. تنها در صورتی فرد تجربه آزمون مناسب را تجربه خواهد کرد که دشواری سوال با سطح تواناییاش منطبق باشد که آزمونهای انطباقی این ویژگی را دارند.در این پایاننامه نحوه انتخاب سوال بعدی برای آزموندهندهرا با توجه به اینکه بیشترین نزدیکی به سطح دانش او داشته باشد را بهبود داده شده است. برای انتخاب سوال سه تابع برای آن تعریف شده است :در تابع اول سوالاتی که به موضوع مورد نظر مربوط است انتخاب میشوند. سپس در تابع با استفاده از نظریه سوال پاسخ و بهبود روشهای محاسبه احتمال پاسخگویی آزموندهنده به سوال، سوالاتی که بیشترین احتمال را دارند که آزمون دهندهآنها را پاسخ دهد انتخاب میشوند. بعد از آنکه سوالات در تابع دوم انتخاب شدند، بر اساس سابقه سوالات، از بین آنها یک سوال انتخاب و از آزموندهنده پرسیده میشود. بهبود فرآیند انتخاب سوال در تابع اول و دوم در این پایاننامه مورد نظر است. در واقع سوالاتی انتخاب خواهد شد که برای آزموندهنده از نظر سنجش دانش او، بهترین هستند.در این پایاننامه، ساختار آزمون انطباقی کامپیوتری شرح داده خواهد شد که با ترکیب روشهای استفاده شده توسط دیگران و تغییری در پیادهسازی آنها ساخته میشود، پارامترهای مطرح شده در نظریه سوال پاسخ برای انتخاب سوال کافی نمیباشد و نیاز به ویژگیهای دیگری در این تابع است، به همین منظور ساختار سوال را با استفاده از موضوع، مبحث و مفهوم ایجاد کرده و سوالات با این دستهبندی از بانک سوالات انتخاب میشوند و در صورتی که آزموندهنده در مفهومی قوی بود، میتوان آن مفهوم را کنار گذاشته و به مفهوم دیگری مراجعه کرد.مسئله مهم دیگری که در انتخاب سوالات آزمون انطباقی کامپیوتری باید به آن توجه کرد، برآورد و تخمین سطح دانش آزموندهنده است. روشهای مختلفی برای این برآورد وجود دارد که میتوان به اطلاعات فیشر، روش نیوتن-رافستر ، شبکههای بیزین و شبکه عصبی اشاره نمود. در این پایان نامه این برآورد با استفاده از سه مدل شبکه عصبی که عبارتند از شبکه عصبی هرس جامع، شبکه عصبی پرسپترون چند لایه و شبکه عصبی تابع پایه شعاعی. در این پایان نامه، این سه مدل شبکه عصبی را پیادهسازی و با استفاده از نتایج بدست آمده مقایسه خواهند شد.این پایان نامه بدین صورت سازماندهی شده است. در فصل دوم در مورد آزمون انطباقی کامپیوتری بحث خواهد شد و در فصل سوم مباحث مرتبط با آزمون انطباقی کامپیوتری که شامل نظریه سوال پاسخ، شبکههای بیزین و کاربرد آن در آزمون انطباقی کامپیوتری و در آخر شبکههای عصبی، بحث خواهد شد. در فصل چهارم روش پیشنهاد شده شرح داده خواهد شد و در فصل پنجم در مورد پیادهسازی روش پیشنهادی صحبت میشود. در فصل ششم، مقایسات و نتیجهگیریها و کارهای آینده صحبت خواهد شد.«آزمون انطباقي کامپيوتري» توسط لرد (1971) ، اوون (1975)، و وایس (1976)، در میان دیگران، برای اندازهگیری سطح توانایی آزموندهندهها با دقت بیشتر از آزمونهای معمولی و با ساخت یک آزمون فردی برای هر آزموندهنده، پیشنهاد شد [1].«آزمون انطباقي کامپيوتري» از نوع آزمون توسعه يافته براي افزايش بهرهوري برآورد دانش آزموندهنده است. هدف اصلی «آزمون انطباقي کامپيوتري»، بهینه کردن فرآیند یادگیری آزموندهنده است [2]. که برآورد را با انتخاب سوالها براي آزموندهنده بر اساس پاسخهاي خود (بنابراين اغلب به آن، آزمون مناسب[1] گفته ميشود) در طول مدت آزمون قبلي به دست آورد. درجه دشواري سوال بعدي به طوري انتخاب مي شود که براي آزموندهنده نه خيلي سخت باشد و نه خيلي آسان. بطور دقيقتر، سوال طوري انتخاب مي شود که آزموندهنده با احتمال 50 درصد سوال را به درستي پاسخ دهد. البته، سوال اول نميتواند از اين راه تعيين شود چرا که در اين نقطه هيچ چيز شناخته شدهاي در مورد قابليتهاي امتحان بدست نيامده است (سوال با دشواري متوسط انتخاب ميشود)، اما انتخاب از سوال دوم به بعد را ميتوان براي هر آزموندهنده با سازگاري بهتر انتخاب نمود. با هر پاسخ به سوال ، کامپيوتر به طور بهتري ميتواند ارزيابي دانش آزمونگر را انجام دهد. [1] Tailored