دانلود فایلی با مشخصات ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی word

فهرست مطالب
چکیده
فصل اول: مقدمه1
1-۱ پیشگفتار2
1- ۲ بیان مسئله3
1-3 اهمیت وضرورت انجام تحقيق6
1-4 جنبه جديدبودن ونوآوري درتحقيق7
1-5 اهداف مشخص تحقيق8
1-6 مروری برساختارپایان نامه8
فصل دوم: مفاهیم9
2-1 مقدمه10
2-2 مدل داده چیست؟10
2-2-1 مدل های داده ساخت یافته12
2-2-1-1 مدل داده رابطه ای12
2-2-1-2 مدل داده شی گرا14
2-2-1-۳ مدل داده شی رابطه ای16
2-2-2 مدل داده ای غیرساخت یافته17
2-2-2-1 مدل داده ای کلید/ارزش19
2-2-2-2 مدل داده ای سندگرا21
2-2-2-3 مدل داده ای ستونی23
2-2-2-4 پایگاه داده های گراف24
عنوان صفحه
2-3 مدیریت داده ها29
2-4 داده های پزشکی30
2-5 کاربردهای مدیریت داده های پزشکی34
2-6 بیماری های ژنتیکی36
2-7 انتقال بیماریهای ژنتیکی37
2-8 آزمایشهای ژنتیکی38
فصل سوم: پیشینه تحقیق42
3-1مقدمه43
3-2 مدل داده رابطه ای برای بیماریهای همه گیری43
3-3 مدل داده شی رابطه ای برای بیمارستانها44
3-4مدل داده گرافی برای بیماری های همه گیری47
فصل چهارم: روش پیشنهادی48
4-1مقدمه49
4-2 موجودیتها53
4-3-صفات مربوط به هریک ازموجودیتها53
4-3-1انسان سالم53
4-3-2انسان ناقل54
4-3-3 انسان درمان شده54
4-3-4 انسان بیمار54
4-3-5پزشک55
عنوان صفحه
4-3-6بیماری55
۴-۳-۷علائم57
4-3-8 روشهای درمان58
4-3-9 دارو58
4-4مقادیرذخیره شده برروی یالها59
4-5تعیین قابلیتهای مدل داده60
4-5-1ایجادکردن60
4-5-2افزودن61
4-5-3به روزرسانی61
4-5-4حذف کردن61
4-5-5پرس وجو62
4-5-5-1پرس وجوهای وابسته به یک گره62
4-5-5-2پرس وجوهای مربوط به دوگره66
4-5-5-3پرس وجوهای بیش از دوگره68
4-6طراحی مدل داده70
۴-۶-۱ طراحیER70
۴-۶-۲ طراحی مدل گرافی72
فصل پنجم: ارزیابی75
5-1 مقدمه76
5-2 روش اول: گروه متمرکز77
۵-۲-۱ آشنایی باگروه متمرکز77
عنوان صفحه
۵-۲-۲ مزایای گروه متمرکز77
۵-۲-۳روش شناسی گروه متمرکز77
۵-۲-۴ ارزیابی به وسیله ی گروه متمرکز79
5-3 روش دوم: پیاده سازی عملی پایگاه داده79
5-3-1 نرم افزارنئوفرجی80
5-3-2 داده های موردنیاز80
5-3-3 ذخیره داده هادرپایگاه داده نئوفرجی81
5-4 نتایج83
فصل ششم:جمع بندی و کارهای آتی90
6-1 جمع بندی وکارهای آتی91
منابع97
فهرست جدول ها
عنوان صفحه
جدول (3-1) : پایگاه داده ی سنتی رابطه ای45
جدول (3-2) : پایگاه دادهEAV45
جدول(3-3) : یک شمای کلیازEAV46
جدول (5-1 ): زمان مربوط به پرس وجوهای مختلف85
فهرست نمودارها
عنوان صفحه
نمودار(۵-۱) پرس و جوهای یک گره..............................................................................................86
نمودار(۵-۲) پرس و جوهای دو گره...............................................................................................87
نمودار(۵-۳) پرس و جوهای سه گره..............................................................................................87
نمودار(۵-۴) پرس و جوهای تمام گره ها.......................................................................................88
نمودار(۵-۵) مقایسه کمترین-بیشترین و میانگین زمان پرس و جوها..............................................89
فهرست شکل ها
عنوان صفحه
شکل(2-1 ) نمونه ای اولیه از پایگاه داده گراف.............................................................. ..............27
شکل(3-1)پیاده سازی بیماری همه گیری با پایگاه داده رابطه ای...................................................44
شکل(3-2)یک پیاده سازی ساده از EAV/CR...............................................................................46
شکل (3-3) پیاده سازی بیماری همه گیری با پایگاه داده گرافی..................................... .............47
شکل (4-1) نمودارER....................................................................................................... ..........71
شکل (4-2) پایگاه داده گراف طراحی شده برای بیماری های ژنتیکی..........................................74
شکل(5-1) نمایش تمام گره ها روابط در پایگاه داده گرافی..........................................................82
در جامعه امروزی با توجه به پیشرفت علم پزشکی حجم دادههای پزشکی به سرعت در حال افزایش هستند. برای تحلیل سریعتر و کارآمدتر این دادهها نیاز به ذخیره الکترونیکی این دادهها داریم. دادههای مربوط به بیماریهای ژنتیکی نیز از این دسته دادهها به حساب میآیند. با توجه به این مسئله میبایست پایگاه دادهای مناسب ذخیره و بازیابی این داده ها طراحی نماییم. با توجه به ماهیت داده های ژنتیکی و این مسئله که در مورد انتقال بیماری های ژنتیکی روابط بین افراد و تجزیه تحلیل آن مسئله مهمی به حساب میآید در این مقاله برای ذخیره و بازیابی این دادهها از مدل دادهی گرافی که یکی از زیر مجموعههای مدل دادههای غیر ساخت یافته (NOSQL)است استفاده مینماییم. برای این کار ابتدا نیازها و پرس و جوهای مربوط به این مسئله را مشخص میکنیم و بر اساس آن مدل داده گرافی را طراحی مینماییم. برای ارزیابی مدل داده طراحی شده یک تیم متشکل از متخصصان ژنتیک نیز این مدل داده را بررسی کرده و نظر مساعد خود را در خصوص کاربرد این مدل داده برای بیماری های ژنتیکی بیان نمودند. همچنین از نرم افزار Neo4j استفاده نمودیم که دادههای مربوط به بیماری ژنتیکی تالاسمی را در آن ذخیره کرده و این مدل داده را بر اساس کارایی ذخیره سازی و بازیابی اطلاعات و زمان پرس و جوها مورد بررسی قرار دادیم که با توجه به زمان پرس و جوها و عدم پشتیبانی سایر مدل دادهها از روابط بین افراد، این مدل داده مدل مناسبی به شمار میآید.
کلمات کلیدی: ژن،بیماری های ژنتیکی، پایگاه داده های گرافی،neo4j،مدل داده
1-۱-پیشگفتار
در زمینه پزشکی دادهها به سرعت در حال تولید وگسترش هستند. این دادهها در اشکال متفاوتتری نسبت به دادههای گذشته تولید میشوند و با توجه به پیشرفتهای علم در این زمینه نیاز به مدیریتهای جدید بسیار بیشتر از گذشته احساس میشود. برای ذخیره این دادهها پایگاهدادهای که قادر به پشتیبانی از انواع مختلف دادهها و حجم زیاد دادهها باشد و همچنین توانایی انجام مدیریت صحیح و کامل دادهها را دارا باشد، نیاز داریم]14[.
در خصوص بیماریهای ژنتیکی دادههایی که نیاز به ذخیره آنها داریم، دادههای متنوعی هستند. با توجه به ماهیت بیماریهای ژنتیکی برای درک نحوه انتقال این بیماریها نیاز به ذخیره وضعیت سلامتی اجداد بیماران نیز داریم که در هر بررسی ممکن است فرد جدیدی به این شجره نامه اضافه شود، همچنین برای کشف مسیر انتقال بیماریها روابط بین افراد در این پایگاهداده بسیار مهم و ضروری میباشد. برای پشتیبانی از این نیازها و مدیریت روابط بین افراد و انتقال بیماری، پایگاهدادههای ساختیافته[1]گزینه مناسبی نیستند، زیرا قادر به پشتیبانی از انواع مختلف داده ها نمیباشند.
پایگاهدادههای غیرساختیافته[2]برای پشتیبانی انواع مختلف داده ها گزینه های مناسبتری هستند. پایگاهداده هایNOSQLانواع مختلفی دارند اما با توجه به این که در این نوع بیماری روابط بین افراد بسیار مهم است و همچنین باید در هر زمانی قادر به افزودن موجودیت ها باشیم پایگاهداده های گرافی مورد مناسبی میباشند.
1-۲-بیان مسئله
بدن انسانها از تریلیون سلول تشکیل شده و هر سلول دارای یک هسته میباشد. هسته سلولها از تعداد 46 کروموزوم یا23جفت کروموزوم تشکیل شده است. کروموزومها دارای رشتههای در هم پیچیدهای به نامDNAهستند که اینDNAها شامل ژنها هستند.هر سلول بدن انسانها شامل25000تا35000ژن است]1[.
ژنها دارای اطلاعاتی هستند که این اطلاعات ویژگیهای انسان را می سازد.ژنها ازترکیب پایهای به نام نوکلئوتید تشکیل شدهاند. ترکیب پایه از4ساختار تشکیل شده است"ادنینA[3]/گوانینG[4]/سیتوزینC[5]/ تیمینT[6]"در حقیقت برای بیان هر ژن از4حرفA,T,C,Gاستفاده میکنیم که اصطلاحا به آن توالی نوکلئوتیدی گفته میشود.
توالی ژنهای مربوط به بیماریها در بدن انسانهای نرمال به یک شکل است و بیماری زمانی اتفاق می افتد که در این توالی تغییری ایجاد شود.البته طول توالی نوکلئوتیدی بیماریهای مختلف با یکدیگر متفاوت هستند.به طور مثال طول توالی ژن انسولین333کاراکتر است.تا کنون بیشترین طول توالی نوکلئوتیدی شناخته شده مربوط به بیماری دوشن میباشد.طول این توالی2.3مگا میباشد.
به عنوان مثالهایی از بیماریهای ژنتیکی میتوان از زالی، سرطان های پوست، عقب افتادگیذهنی، کم خونی داسی شکل، فنیل کتونوری، تالاسمی و نظایر آن نام برد]2[.
برخی از مواردی که بررسیهای ژنتیکی انجام میپذیرد به شرح ذیل است:
برای انجام این تستهای ژنتیکی در وهله اول نیاز به داشتن شجرهنامه زوجین در هنگام تشکیل خوانواده، والدین در هنگام تستهای بارداری و بیمار در هنگام بررسی یک بیمار ژنتیکی داریم. پس از دانستن شجرهنامه در هنگام برخورد با بیماریها نیاز به ذخیره اطلاعاتی درباره بیمار داریم.
برای ذخیره دادههای مربوط به بیماریهای ژنتیکی نیاز به پایگاهدادهای داریم که بتواند به خوبی از ذخیره انواع داده ها پشتیبانی کند.برای این داده ها نیاز به مدلدادهای داریم که بتواند علاوه بر ذخیره این دادهها به بررسی و تجزیه تحلیل این دادهها بپردازد.یکی از مسایل مهم برای انتخاب مدل داده این است که در مورد دادههای پزشکی برای هر بیمار ممکن است خصوصیاتی را ذخیره کنیم که برای دیگر بیماران نیازی به آن نداشته باشیم مثلا ممکن است برای یک بیمار نیاز به ذخیره جواب آزمایش خون داشته باشیم اما برای بیمار دیگر نیاز به انجام این تست و ذخیره این آزمایش نداشته باشیم و یا ممکن است در حین بررسی شرایط بیمار به مواردی برخورد کنیم که از ابتدا پیش بینی نشده بود،به این دلیل بهتر است از ابتدا یک طرح کلی برای پایگاهداده طراحی نشود تا بتوانیم هر خصوصیتی را که نیاز داشتیم یا در حین کار با آن مواجه شدیم برای بیمار اضافه کنیم.با توجه به این موضوع به این نتیجه می رسیم که از پایگاهداده های SQLنمیتوانیم استفاده کنیم و پایگاهداده های NOSQLبرای این امر مناسبتر هستند.
مسئله مهم دیگر این است که با توجه به نیاز به ژنتیک اعضای خانواده و نسلهای قبل بیمار باید توانایی افزودن موجودیتها(نسل های قبل و بعد)ی جدید را در حین انجام تحقیقات به این پایگاهداده داشته باشیم. در مورد انتقال بیماریها تشخیص مسیر انتقال بیماری اهمیت ویژهای دارد زیرا باید مشخص شود که بیماری از پدر یا مادر،در مرحله بعد از کدام یک از اجداد به ارث رسیده و همینطور تشخیص داده شود که این بیماری ممکن است به کدام یک از فرزندان دختر یا پسر به ارث برسد. به این دلیل باید پایگاهدادهای طراحی کنیم که قابلیت استخراج روابط بین موجودیتها را دارا باشد. البته روابط بین موجودیتها در پایگاهدادههای رابطهای نیز قابل استخراج است اما اولا به دلیل نیاز به نوشتن رویههای تودرتو امر بسیار پیچیده و زمان بر است ثانیا در مدلداده گراف میتوانیم بر روی یالها نیز خصوصیاتی را برای ارتباط موجودیتها تعریف کنیم. با توجه به این سه مسئله به این نتیجه میرسیم پایگاهداده گرافی بهترین انتخاب برای این نوع بیماری ها است.
در این پایاننامه با استفاده از مدلداده گراف پایگاهدادهای را طراحی خواهیم کرد که توانایی ذخیره انواع و حجمهای مختلف داده را دارا باشد. پایگاهدادهطراحی شده باید قابلیت انجام عملیات برروی این داده های ذخیره شده را داشته باشد و بتواند نتایج مورد نظر در بررسی انتقال بیماریهای ژنتیکی را ازآن استخراج کند. نتایجی مانند مسیر انتقال بیماری،امکان انتقال بیماری به نسل بعد یا امکان انتقال بیماری به جنسیت خاصی از نسل بعد، درصد انتقال بیماری و ...
در این پایـگاهداده موجودیتها که همان افراد هستند درون گرهها ذخیره میشوند، در گرهها علاوه
بر مشخصات عمومی بیماران تمام اطلاعات مربوط به بیــماری افراد، شرایط و علائم بیماران نیز ذخیره
میشوند. در سطوح بعدی گراف، نسلهای بالاتر بیماران همراه با اطلاعات مربوط به بیماری مخصوصی
که در حال تحقیق در مورد آن هستند ذخیره خواهد شد. برای نمایش روابط بین افراد در این مدلداده از
یالها استفاده خواهیم کـــرد. به این صورت که اگر بیماری از شخصی به شخص دیگری انتقال یافت از
یال جهتدار برای نمایش این انتقال استفاده خواهیــم کرد. علاوه بر اینها میتـــوانیم بر روی یالهـــا
توضیحاتی را نیز اضافه نمائیم. توضیحاتی مانند درصد احتمال انتقال یک بیماری خاص از یک فرد بهفرد
دیگر.

👇 تصادفی👇

سيستم اطلاعات مديريت و كاربرد آن در برنامه ريزي توليد شركت توليدي مهپا تحقیق دعواي تصرف عدواني و ممانعت و مزاحمت از حق قسمت های 1 تا 6 فیلم آموزشی " نرم افزار هایسیس "قطعات بیل مکانیکی پایان نامه دامپروری گاوداری شيری مقاله پیرامون بخشهای مختلف یک کامپیوتر شخصی پروژه همزن در سالید دانلود کتاب PDF : معرفی انواع نقشه های مکانیکی دانلود پایان نامه آماده درباره ‎شاخص‌هاي رشد ارقام بهاره كلزا‎ با فرمت ورد 145 صفحه آموزش کسب و کار اینترنتی(کاملا واقعی) ✅فایل های دیگر✅

ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی word

👇 تصادفی👇

#️⃣ برچسب های فایل ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی word

ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی word

دانلود ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی word

خرید اینترنتی ارائه ی یک مدل داده مناسب برای کشف انتقال بیماری های ژنتیکی word

👇🏞 تصاویر 🏞