پروژه مقایسه دقت تکنیکهای کلاسه بندی در داده کاوی با استفاده از دیتاست پزشکی پژوهش کامل در حوزه کامپیوتر و پزشکی میباشد و در 5 فصل تنظیم شده است.این پروژه با معرفی داده کاوی به تکنیک های کلاسه بندی در داده کاوی پرداخته است.شما میتوانید فهرست مطالب پروژه را در ادامه مشاهده نمایید.پروژه بصورت فایل قابل ویرایش ورد(WORD) در 57 صفحه برای رشته کامپیوتر و IT در پایین همین صفحه قابل دانلود میباشد. شایسته یادآوری است که پروژه از ابتدا تا پایان ویرایش وتنظیم , سکشن بندی (section) ، نوشتن پاورقی (Footnote) و فهرست گذاری اتوماتیک کامل شده وآماده تحویل یا کپی برداری از مطالب مفید آن است.چکیدهدر این مطالعه ، 5 روش کلاسه بندی متداول ، درخت تصمیم ، بیزین ، نزدیکترین همسایه ، شبکه های عصبی و ماشین بردار پشتیبان بر روی شش مجموعه ی داده ی پزشکی سرطان سینه ، هپاتیت ، تیروئید ، دیابت ، تومور اولیه و بیماری قلبی مورد تست و ارزیابی قرار گرفتند.معیار ارزیابی میزان دقت هر روش بوده و برای تست هر روش از نرم افزار weka با مقادیر پیش فرض استفاده گردید.نتایج حاصله نشان می دهد .که اگر چه بعضی از کلاسه بندی ها نسبت به بقیه بهتر عمل می کنند ولی بطور کلی هیچ روش کلاسه بندی وجود ندارد که روی تمام مجموعه داده های مذکور از دقت بهتری برخوردار باشد و برای هر مجموعه داده یک روش کلاسه بندی خاص نسبت به سایر روش ها از دقت مطلوبی برخوردار می باشد.واژه های کلیدی:داده کاوی ، کلاسه بندی ، داده کاوی پزشکی ، الگوریتم های کلاسه بندی ، کشف دانش ،استخراج دانش ،نرم افزار weka ، Data mining ، classification فهرست مطالبمقدمه. 1فصل یکم مفاهیم داده کاوی1-1- مروری بر کشف دانش و داده کاوی.. 41-2 عوامل پیدایش داده کاوی.. 51-3 مراحل کشف دانش.... 71-3-1 استخراج داده ها71-3-2 اماده کردن داده ها81-3-3 مهندسی الگوریتم و تعیین استراتژ ی های کاوش... 91-3-3 اجرای الگوریتم کاوش و ارزیابی نتایج.. 101-4 جایگاه داده کاوی در میان علوم مختلف... 121-5 داده کاوی چه کارهایی نمی تواند انجام دهد. 131-6 داده کاوی و انباره داده ها131-7 داده کاوی و OLAP. 141-8 کاربرد یادگیری ماشین و امار در داده کاوی.. 151-9 روش های یادگیری.. 151-10 روش های کاوش... 16فصل دوم کلاسه بندی و پیشگویی2-1 کلاسه بندی.. 192-2 انواع روش های کلاسه بندی.. 212-3 ارزیابی روش های کلاسه بندی.. 22فصل سوم تکنیک های کلاسه بندی معروف3-1 درخت تصمیم.. 243-2 بیزین.. 253-2-1 تئوری بیز. 253-2-2 نحوه کلاسه بندی به روش بیز ساده. 253-3 روش کلاسه بندی نزدیکترین k- همسایه. 273-4 روش کلاسه بندی شبکه های عصبی.. 293-5 روش کلاسه بندی ماشین بردار پشتیبان.. 32فصل چهارم مقایسه و ارزیابی تکنیک های کلاسه بندی4-1 مجموعه داده های مورد استفاده. 354-1-1 مجموعه داده سرطان سینه. 354-1-2 مجموعه داده هپاتیت... 354-1-3 مجموعه داده هیپوتیروئید. 354-1-4 مجموعه داده دیابت... 364-1-5 مجموعه داده تومور اولیه. 364-1-6 مجموعه داده بیماری قلبی.. 364-2 نرم افزار Weka. 374-2-1 معرفی نرم افزار weka. 374-3 تست روشها38فصل پنجم نتیجه گیریپیوست... 42پیوست ب- روش ارزیابی k- تکه برابر. 45منابع.. 47Abstract:47 فهرست شکل هاشکل 1-1-داده کاوی به عنوان یک مرحله از فرایند کشف دانش... 5شکل1-2-سیر تکاملی صنعت پایگاه داده6شکل 1-3-معماری یک نمونه از سیستم داده کاوی. 10شکل 1-4-استخراج داده ها از انبار داده ها14شکل 1-5-استخراج داده ها از چند پایگاه داده14شکل 1-6- انواع یادگیری استنتاجی. 16شکل 2-1-مثالی از فرایند دو مرحله ای کلاسه بندی. 20شکل 2-2-عملکرد کلاسه بندی. 21شکل 3-1-نمونه ای از یک درخت تصمیم. 24شکل 3-2- محدوده همسایگی. 28شکل 3-3- شبکه عصبی با یک لایه نهان. 29شکل 3-4- الگوریتم Backpropagation. 30شکل 3-5- یک گره در لایه نهان یا خروجی. 30شکل 3-6-مثالی از کلاسه بندی SVM.. 33جدول4-1–تست روش نزدیکترین Kهمسایه به ازای مقادیر مختلف K.. 38جدول4-2 –درصد میزان دقت روشهای کلاسه بندی تست شده بر روی مجموعه داده ها39شکل 1- weka در وضعیت انتخاب واسط.. 42شکل 2- نمایی از Weka Explorer43شکل 3 –پنجره ی weka explorer پس از انتخاب مجموعه داده43شکل 4- انتخاب الگوریتم کلاسه بندی. 44شکل 5-نمایی از پنجره weka Explorer پس از انتخاب یکی از الگوریتم های کلاسه بندی. 44شکل 6- پارامتر های پیش فرض در نرم افزار weka. 45شکل 7-نتایج حاصل از تست مجموعه داده در قسمت classifier output45شکل 8-روش ارزیابی تکه برابر46
پروژه مقایسه دقت تکنیکهای کلاسه بندی در داده کاوی با استفاده از دیتاست پزشکی
پروژه مقایسه دقت تکنیکهای کلاسه بندی در داده کاوی با استفاده از دیتاست پزشکی پژوهش کامل در حوزه کامپیوتر و پزشکی میباشد و در 5 فصل تنظیم شده است.این پروژه با معرفی داده کاوی به تکنیک های کلاسه بندی در داده کاوی پرداخته است.شما میتوانید فهرست مطالب پروژه را در ادامه مشاهده نمایید.پروژه بصورت فایل قابل ویرایش ورد(WORD) در 57 صفحه برای رشته کامپیوتر و IT در پایین همین صفحه قابل دانلود میباشد. شایسته یادآوری است که پروژه از ابتدا تا پایان ویرایش وتنظیم , سکشن بندی (section) ، نوشتن پاورقی (Footnote) و فهرست گذاری اتوماتیک کامل شده وآماده تحویل یا کپی برداری از مطالب مفید آن است.چکیدهدر این مطالعه ، 5 روش کلاسه بندی متداول ، درخت تصمیم ، بیزین ، نزدیکترین همسایه ، شبکه های عصبی و ماشین بردار پشتیبان بر روی شش مجموعه ی داده ی پزشکی سرطان سینه ، هپاتیت ، تیروئید ، دیابت ، تومور اولیه و بیماری قلبی مورد تست و ارزیابی قرار گرفتند.معیار ارزیابی میزان دقت هر روش بوده و برای تست هر روش از نرم افزار weka با مقادیر پیش فرض استفاده گردید.نتایج حاصله نشان می دهد .که اگر چه بعضی از کلاسه بندی ها نسبت به بقیه بهتر عمل می کنند ولی بطور کلی هیچ روش کلاسه بندی وجود ندارد که روی تمام مجموعه داده های مذکور از دقت بهتری برخوردار باشد و برای هر مجموعه داده یک روش کلاسه بندی خاص نسبت به سایر روش ها از دقت مطلوبی برخوردار می باشد.واژه های کلیدی:داده کاوی ، کلاسه بندی ، داده کاوی پزشکی ، الگوریتم های کلاسه بندی ، کشف دانش ،استخراج دانش ،نرم افزار weka ، Data mining ، classification فهرست مطالبمقدمه. 1فصل یکم مفاهیم داده کاوی1-1- مروری بر کشف دانش و داده کاوی.. 41-2 عوامل پیدایش داده کاوی.. 51-3 مراحل کشف دانش.... 71-3-1 استخراج داده ها71-3-2 اماده کردن داده ها81-3-3 مهندسی الگوریتم و تعیین استراتژ ی های کاوش... 91-3-3 اجرای الگوریتم کاوش و ارزیابی نتایج.. 101-4 جایگاه داده کاوی در میان علوم مختلف... 121-5 داده کاوی چه کارهایی نمی تواند انجام دهد. 131-6 داده کاوی و انباره داده ها131-7 داده کاوی و OLAP. 141-8 کاربرد یادگیری ماشین و امار در داده کاوی.. 151-9 روش های یادگیری.. 151-10 روش های کاوش... 16فصل دوم کلاسه بندی و پیشگویی2-1 کلاسه بندی.. 192-2 انواع روش های کلاسه بندی.. 212-3 ارزیابی روش های کلاسه بندی.. 22فصل سوم تکنیک های کلاسه بندی معروف3-1 درخت تصمیم.. 243-2 بیزین.. 253-2-1 تئوری بیز. 253-2-2 نحوه کلاسه بندی به روش بیز ساده. 253-3 روش کلاسه بندی نزدیکترین k- همسایه. 273-4 روش کلاسه بندی شبکه های عصبی.. 293-5 روش کلاسه بندی ماشین بردار پشتیبان.. 32فصل چهارم مقایسه و ارزیابی تکنیک های کلاسه بندی4-1 مجموعه داده های مورد استفاده. 354-1-1 مجموعه داده سرطان سینه. 354-1-2 مجموعه داده هپاتیت... 354-1-3 مجموعه داده هیپوتیروئید. 354-1-4 مجموعه داده دیابت... 364-1-5 مجموعه داده تومور اولیه. 364-1-6 مجموعه داده بیماری قلبی.. 364-2 نرم افزار Weka. 374-2-1 معرفی نرم افزار weka. 374-3 تست روشها38فصل پنجم نتیجه گیریپیوست... 42پیوست ب- روش ارزیابی k- تکه برابر. 45منابع.. 47Abstract:47 فهرست شکل هاشکل 1-1-داده کاوی به عنوان یک مرحله از فرایند کشف دانش... 5شکل1-2-سیر تکاملی صنعت پایگاه داده6شکل 1-3-معماری یک نمونه از سیستم داده کاوی. 10شکل 1-4-استخراج داده ها از انبار داده ها14شکل 1-5-استخراج داده ها از چند پایگاه داده14شکل 1-6- انواع یادگیری استنتاجی. 16شکل 2-1-مثالی از فرایند دو مرحله ای کلاسه بندی. 20شکل 2-2-عملکرد کلاسه بندی. 21شکل 3-1-نمونه ای از یک درخت تصمیم. 24شکل 3-2- محدوده همسایگی. 28شکل 3-3- شبکه عصبی با یک لایه نهان. 29شکل 3-4- الگوریتم Backpropagation. 30شکل 3-5- یک گره در لایه نهان یا خروجی. 30شکل 3-6-مثالی از کلاسه بندی SVM.. 33جدول4-1–تست روش نزدیکترین Kهمسایه به ازای مقادیر مختلف K.. 38جدول4-2 –درصد میزان دقت روشهای کلاسه بندی تست شده بر روی مجموعه داده ها39شکل 1- weka در وضعیت انتخاب واسط.. 42شکل 2- نمایی از Weka Explorer43شکل 3 –پنجره ی weka explorer پس از انتخاب مجموعه داده43شکل 4- انتخاب الگوریتم کلاسه بندی. 44شکل 5-نمایی از پنجره weka Explorer پس از انتخاب یکی از الگوریتم های کلاسه بندی. 44شکل 6- پارامتر های پیش فرض در نرم افزار weka. 45شکل 7-نتایج حاصل از تست مجموعه داده در قسمت classifier output45شکل 8-روش ارزیابی تکه برابر46