شرح مختصر : داده کاوی، فرایند مرتب سازی و طبقه بندی داده های حجیم و آشکارسازی اطلاعات مرتبط باهم می باشد. امروزه داده کاوی به عنوان یکی از ابزارهای بسیار مهم مدیران جهت شناخت وضعیت دقیق تر سازمان و همچنین کمک در اتخاذ تصمیمات مناسب کاربرد دارد. با استفاده از این تکنیک، داده های موجود در سازمان با بکارگیری ابزارهای نرم افزاری، مورد بررسی و تحلیل دقیق قرار می گیرد تا الگوهای پنهان و پیچیده ای که در آنها وجود دارد کشف و استخراج گردد. داده کاوی را می توان نسل سوم تکنولوژیهایی نامید که با داده سروکار دارند. در نسل اول یا نسل سنتی، فقط انجام پرس و جو های ساده امکان پذیر بود، مثلا تعداد فروش یک کالای خاص چقدر است؟ میزان خرید یک مشتری خاص در ماه جاری چه مبلغی است؟ در نسل دوم یا همان پردازش لحظه ای برخط (OLAP) امکان پرس و جوی همزمان چند بعدی فراهم گردید. در این روش به عنوان مثال به سوالاتی مانند: «میزان فروش محصولات به تفکیک فروشنده، خریدار و مسیر خاص چقدر است؟ » بصورت لحظه ای و با استفاده از مکعب تصمیم و گزارش ماتریسی پاسخ داده می شود. اما در نسل سوم یا همان داده کاوی فقط مساله پرس و جو و دریافت گزارش ها از داده ها نیست، بلکه از حجم انبوه داده ها، الگوهایی کشف می شود که هیچ وقت امکان کشف این الگوها در OLAP یا روش سنتی وجود نداشت. انواع اطلاعات و الگوهایی که از طریق داده کاوی بدست می آیند و کاربرد دارند عبارتند از: وابستگی، تسلسل و توالی، طبقه بندی، خوشه بندی و پیش بینی. برای استخراج این الگوها اغلب از روشهای نوینی مانند شبکه عصبی و درختهای تصمیم استفاده می شود. در عمل برای امکان انجام داده کاوی و استفاده از تکنیکهای فوق الذکر، ابتدا باید نسبت به ایجاد یک انبار داده مناسب اقدام کرد. یک انبارداده در حقیقت پایگاه داده ای است که داده های جاری و همچنین سوابق قبلی تراکنشها را در خود ذخیره کرده و با منابع خارج سازمان نیز ارتباط برقرار می کند. اهداف کلی این مقاله عبارتند از ارایه تعریف دقیقی از انبار داده، بررسی تکنیکها و کاربردهای داده کاوی و کاربرد آن در مدیریت، معرفی شبکه عصبی به عنوان یکی از روشهای اجرای داده کاوی و بیان مفهوم درخت تصمیم و ارتباط آن با داده کاوی.فهرست :چکیدهمقدمه ای بر دادهکاویفصل اولچه چيزی سبب پيدايش داده کاوی شده استمراحل کشف دانشجایگاه داده کاوی در میان علوم مختلفداده کاوی چه کارهایی نمی تواند انجام دهد؟داده کاوی و انبار داده هاداده کاوی و OLAPکاربرد یادگیری ماشین و آمار در داده کاویفصل دومتوصیف داده ها در داده کاویخلاصه سازی و به تصویر در آوردن داده هاخوشه بندیتحلیل لینکفصل سوممدل های پیش بینی داده هاClassificationRegressionTime seriesفصل چهارممدل ها و الگوریتم های داده کاویشبکه های عصبیDecision treesMultivariate Adaptive Regression Splines(MARS)Rule inductionKnearest neibour and memorybased reansoning(MBR)رگرسیون منطقیتحلیل تفکیکیمدل افزودنی کلی (GAM)Boostingفصل پنجمسلسله مراتب انتخابهافصل ششممراحل فرایند کشف دانش از پایگاه داده های بزرگانبارش داده هاانتخاب داده هاتبدیل داده هاکاوش در داده هاتفسیر نتیجهفصل هفتمعملیات های داده کاویمدل سازی پیشگویی کنندهتقطیع پایگاه داده هاتحلیل پیوندفصل هشتمقابلیت هایdata mainigداده کاوی وانبار داده هاداده کاوی آمار ویادگیری ماشینکاربرد های داده کاویداده کاوی موفقتحلیل ارتباطاتفصل نهمطبقه بندیحدس بازگشتیسری های زمانیدرخت های انتخاباستنتاج قانونالگوریتم های ژنتیکفصل دهمفرایند های داده کاویمدل فرایند دو سویهفصل یازدهمساختن یک پایگاه داده داده کاویجستجوی دادهآماده سازی داده برای مدل سازیساختن مدل برای داده کاویتائید اعتبار سادهارزیابی وتفسیرفصل دوازدهمماتریس های پیچیدگیایجادمعماری مدل ونتایجفصل سیزدهمنتیجه گیریمنابع ومآخذ
دانلود پایان نامه داده کاوی در پایگاه داده های بزرگ
شرح مختصر : داده کاوی، فرایند مرتب سازی و طبقه بندی داده های حجیم و آشکارسازی اطلاعات مرتبط باهم می باشد. امروزه داده کاوی به عنوان یکی از ابزارهای بسیار مهم مدیران جهت شناخت وضعیت دقیق تر سازمان و همچنین کمک در اتخاذ تصمیمات مناسب کاربرد دارد. با استفاده از این تکنیک، داده های موجود در سازمان با بکارگیری ابزارهای نرم افزاری، مورد بررسی و تحلیل دقیق قرار می گیرد تا الگوهای پنهان و پیچیده ای که در آنها وجود دارد کشف و استخراج گردد. داده کاوی را می توان نسل سوم تکنولوژیهایی نامید که با داده سروکار دارند. در نسل اول یا نسل سنتی، فقط انجام پرس و جو های ساده امکان پذیر بود، مثلا تعداد فروش یک کالای خاص چقدر است؟ میزان خرید یک مشتری خاص در ماه جاری چه مبلغی است؟ در نسل دوم یا همان پردازش لحظه ای برخط (OLAP) امکان پرس و جوی همزمان چند بعدی فراهم گردید. در این روش به عنوان مثال به سوالاتی مانند: «میزان فروش محصولات به تفکیک فروشنده، خریدار و مسیر خاص چقدر است؟ » بصورت لحظه ای و با استفاده از مکعب تصمیم و گزارش ماتریسی پاسخ داده می شود. اما در نسل سوم یا همان داده کاوی فقط مساله پرس و جو و دریافت گزارش ها از داده ها نیست، بلکه از حجم انبوه داده ها، الگوهایی کشف می شود که هیچ وقت امکان کشف این الگوها در OLAP یا روش سنتی وجود نداشت. انواع اطلاعات و الگوهایی که از طریق داده کاوی بدست می آیند و کاربرد دارند عبارتند از: وابستگی، تسلسل و توالی، طبقه بندی، خوشه بندی و پیش بینی. برای استخراج این الگوها اغلب از روشهای نوینی مانند شبکه عصبی و درختهای تصمیم استفاده می شود. در عمل برای امکان انجام داده کاوی و استفاده از تکنیکهای فوق الذکر، ابتدا باید نسبت به ایجاد یک انبار داده مناسب اقدام کرد. یک انبارداده در حقیقت پایگاه داده ای است که داده های جاری و همچنین سوابق قبلی تراکنشها را در خود ذخیره کرده و با منابع خارج سازمان نیز ارتباط برقرار می کند. اهداف کلی این مقاله عبارتند از ارایه تعریف دقیقی از انبار داده، بررسی تکنیکها و کاربردهای داده کاوی و کاربرد آن در مدیریت، معرفی شبکه عصبی به عنوان یکی از روشهای اجرای داده کاوی و بیان مفهوم درخت تصمیم و ارتباط آن با داده کاوی.فهرست :چکیدهمقدمه ای بر دادهکاویفصل اولچه چيزی سبب پيدايش داده کاوی شده استمراحل کشف دانشجایگاه داده کاوی در میان علوم مختلفداده کاوی چه کارهایی نمی تواند انجام دهد؟داده کاوی و انبار داده هاداده کاوی و OLAPکاربرد یادگیری ماشین و آمار در داده کاویفصل دومتوصیف داده ها در داده کاویخلاصه سازی و به تصویر در آوردن داده هاخوشه بندیتحلیل لینکفصل سوممدل های پیش بینی داده هاClassificationRegressionTime seriesفصل چهارممدل ها و الگوریتم های داده کاویشبکه های عصبیDecision treesMultivariate Adaptive Regression Splines(MARS)Rule inductionKnearest neibour and memorybased reansoning(MBR)رگرسیون منطقیتحلیل تفکیکیمدل افزودنی کلی (GAM)Boostingفصل پنجمسلسله مراتب انتخابهافصل ششممراحل فرایند کشف دانش از پایگاه داده های بزرگانبارش داده هاانتخاب داده هاتبدیل داده هاکاوش در داده هاتفسیر نتیجهفصل هفتمعملیات های داده کاویمدل سازی پیشگویی کنندهتقطیع پایگاه داده هاتحلیل پیوندفصل هشتمقابلیت هایdata mainigداده کاوی وانبار داده هاداده کاوی آمار ویادگیری ماشینکاربرد های داده کاویداده کاوی موفقتحلیل ارتباطاتفصل نهمطبقه بندیحدس بازگشتیسری های زمانیدرخت های انتخاباستنتاج قانونالگوریتم های ژنتیکفصل دهمفرایند های داده کاویمدل فرایند دو سویهفصل یازدهمساختن یک پایگاه داده داده کاویجستجوی دادهآماده سازی داده برای مدل سازیساختن مدل برای داده کاویتائید اعتبار سادهارزیابی وتفسیرفصل دوازدهمماتریس های پیچیدگیایجادمعماری مدل ونتایجفصل سیزدهمنتیجه گیریمنابع ومآخذ