چکيده امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهرهگيری از روشهايی همچون دادهکاوی برای استخراج دانش و اطلاعات نهفته در دادهها، امری غيرقابل اجتناب میباشد. بدليل حجم بسيار بالای دادهها در بسياری از کاربردها و اهميت بيشتر دادههای جديد، ذخيرهسازی اين دادهها امری مقرون به صرفه نيست، لذا دادههايی که بايد مورد پردازش قرار گيرند، همواره بصوت پويا در حال تغيير و تحول هستند. مساله ديگری که امروزه در بحث دادهکاوی وجود دارد، بحث توزيع شدگی ذاتی دادهها است. معمولا پايگاههايی که اين دادهها را ايجاد يا دريافت میکنند، متعلق به افراد حقيقی يا حقوقی هستند که هر کدام بدنبال اهداف و منافع خود میباشند و حاضر نيستند دانش خود را بطور رايگان در اختيار ديگران قرار دهند.با توجه به قابليتهای عامل و سيستمهای چندعامله و مناسب بودن آنها برای محيطهای پويا و توزيع شده بنظر میرسد که بتوان از قابليتهای آنها برای دادهکاوی در محيطهای پويا و محيطهای توزيع شده بهره برد. اکثر کارهايی که تاکنون در زمينه بهرهگيری از عامل و سيستمهای چندعامله انجام شده است خصوصيتهايی همانند خودآغازی و بخصوص متحرک بودن عاملها را مورد بررسی قرار داده است و در آنها مواردی همچون هوشمندی، يادگيری، قابليت استدلال، هدفگرايی و قابليتهاي اجتماعی عاملها مورد بررسی قرار نگرفته است. در اين تحقيق ما قصد داريم تا ضمن بررسی کارهای موجود در زمينه کاربرد عامل و سيستمهای چندعامله در دادهکاوی، بحث طبقهبندی جريان دادهها را در يک محيط پويا مورد بررسی قرار دهيم. ما مساله خود را در دو فاز مورد بررسی قرار خواهيم داد. در فاز اول خصوصيتهای يک عامل تنها مورد بررسی قرار خواهد گرفت و در فاز دوم قابليتهای اجتماعی عاملها مانند مذاکره، دستيابی به توافق و ... برای دادهکاوی در يک محيط پويا و توزيعشده رقابتی مورد استفاده قرار خواهد گرفت. بطور کلی دستاوردهای اصلی اين تحقيق عبارتند از 1) ارائه يک رويکرد مبتنی بر عامل برای مساله طبقهبندی جريان دادههای دارای تغيير مفهوم و پويا با استفاده از قابليتهای هدفگرايی، هوشمندی، يادگيری و استدلال 2) ارائه يک رويکرد مبتنی بر سيستمهای چندعامله برای طبقهبندی جريان دادههای توزيعشده در يک محيط رقابتی با استفاده از قابليتهای اجتماعی عاملها و دستيابی به توافق. نتايج حاصل از آزمايشات انجام شده در اين پاياننامه نشاندهنده برتری استفاده از عاملها و سيستمهای چندعامله برای بحث طبقهبندی و دادهکاوی در محيطهای پويا و توزيع شده میباشد.تعداد صفحات 153 word فهرست مطالب 1-1- مقدمهای بر دادهکاوی.. 21-1-1- خوشهبندی.. 31-1-2- کشف قواعد وابستگی.. 41-1-3- طبقهبندی.. 41-1-3-1- طبقهبندی مبتنی بر قواعد. 51-2- دادهکاوی توزيعشده 71-3- عاملها و سيستمهای چندعامله. 81-3-1- عامل. 81-3-1-1- مقايسه عامل با شی.. 91-3-1-2- معماری عاملها 111-3-1-3- معماری BDI. 121-3-2- سيستمهای چندعامله. 141-3-2-1- مذاکره 171-4- بهرهگيری از عامل برای دادهکاوی.. 191-4-1- سيستمهای چندعامله، بستری برای دادهکاوی توزيع شده 191-5- جمعبندی.. 222-1- مقدمهای بر دادهکاوی پويا 242-2- جريان داده 252-3- طبقهبندی جريان داده 262-3-1- موضوعات پژوهشی.. 272-4- جمعبندی.. 313-1- مقدمه. 343-2- دادهکاوی توزيعشده ايستا 353-2-1- روشهای غيرمتمرکز. 363-2-2- روشهای مبتنی بر توزيع ذاتی دادهها 373-3- کارهای مهم انجام شده در زمينه دادهکاوی با استفاده از عامل. 383-4- کارهای انجام شده در زمينه طبقهبندی جريان دادهها 413-4-1- روشهای طبقهبندی Ensemble-based. 413-4-2- درختهای تصميم بسيار سريع. 433-4-3- بقهبندی On-Demand. 463-4-4- OLIN.. 483-4-5- الگوريتمهای LWClass. 493-4-6- الگوريتم ANNCAD.. 513-4-7- الگوريتم SCALLOP. 513-4-8- طبقهبندی جريان دادهها با استفاده از يک روش Rule-based. 533-5- جمعبندی.. 544-1- مقدمه. 564-2- تعريف مساله برای فاز اول. 564-2-1- جريان داده 574-2-2- مفهوم يا مدل موجود در جريان داده 574-2-3- مساله طبقهبندی جريان دادههای دارای تغيير مفهوم. 574-3- تعريف مساله برای فاز دوم. 595-1- مقدمه. 635-2- رويکرد پيشنهادی برای فاز اول پروژه 635-2-1- عامل و ويژگيهای آن در اين مساله. 645-2-2- عملکرد کلی عامل. 655-2-3- معماری عامل. 665-2-3-1- حسگرها 675-2-3-2- پايگاه دانش عامل. 685-2-3-3- تابع ارزيابی محيط.. 705-2-3-3-1- نحوه تشخيص اطلاعات و نگهداری الگوهای recur در جريان داده 705-2-3-3-2- نحوه استخراج الگوهای recur 705-2-3-3-3- نحوه بروزرسانی اطلاعات مربوط به الگوهای recur 735-2-3-3-4- نحوه محاسبه وقوع احتمال وقوع يک الگوی خاص... 745-2-3-4- تابع سودمندی.. 755-2-3-5- بخش تصميمگيری و Planning. 795-2-3-5-1- بخش تصميمگيری.. 795-2-3-5-2- Planning. 835-2-3-6- بخش Action. 865-3- رويکرد پيشنهادی برای فاز دوم مساله. 875-3-1- عاملهای مشتری.. 885-3-2- عامل صفحه زرد. 905-3-3- عاملهای دادهکاو. 915-3-3-1- معماری عاملهای دادهکاو. 925-3-3-1-1- تابع BRF. 945-3-3-1-2- تابع Generate Options. 955-3-3-1-3- تابع فيلتر. 955-3-3-1-4- بخش Actions. 965-3-3-1-5- Plan های عامل. 975-3-3-1-5- 1- Plan مربوط به طبقهبندی.. 975-3-3-1-5-2- Plan مربوط به تطبيق طبقهبند 985-3-3-1-5-3- Plan مربوط به خريد و فروش قواعد با استفاده از مذاکره 1015-4- جمعبندی.. 1116-1- مقدمه. 1146-2- محيط عملياتی.. 1146-3- مجموعه دادههای مورد استفاده 1166-3-1- مجموعه دادههای استاندارد. 1166-3-2- مجموعه دادههای واقعی.. 1176-4- معيارهای ارزيابی و روشهای مورد استفاده برای مقايسه. 1176-5- آزمايشات انجام شده 1186-5-1- آزمايشات مربوط به فاز اول. 1196-5-2- آزمايشات مربوط به فاز دوم. 1286-6- جمعبندی.. 130 فهرست مراجع. 136فهرست اشکال فهرست جدولها
پایان نامه داده کاوی پويا با استفاده از عامل
چکيده امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهرهگيری از روشهايی همچون دادهکاوی برای استخراج دانش و اطلاعات نهفته در دادهها، امری غيرقابل اجتناب میباشد. بدليل حجم بسيار بالای دادهها در بسياری از کاربردها و اهميت بيشتر دادههای جديد، ذخيرهسازی اين دادهها امری مقرون به صرفه نيست، لذا دادههايی که بايد مورد پردازش قرار گيرند، همواره بصوت پويا در حال تغيير و تحول هستند. مساله ديگری که امروزه در بحث دادهکاوی وجود دارد، بحث توزيع شدگی ذاتی دادهها است. معمولا پايگاههايی که اين دادهها را ايجاد يا دريافت میکنند، متعلق به افراد حقيقی يا حقوقی هستند که هر کدام بدنبال اهداف و منافع خود میباشند و حاضر نيستند دانش خود را بطور رايگان در اختيار ديگران قرار دهند.با توجه به قابليتهای عامل و سيستمهای چندعامله و مناسب بودن آنها برای محيطهای پويا و توزيع شده بنظر میرسد که بتوان از قابليتهای آنها برای دادهکاوی در محيطهای پويا و محيطهای توزيع شده بهره برد. اکثر کارهايی که تاکنون در زمينه بهرهگيری از عامل و سيستمهای چندعامله انجام شده است خصوصيتهايی همانند خودآغازی و بخصوص متحرک بودن عاملها را مورد بررسی قرار داده است و در آنها مواردی همچون هوشمندی، يادگيری، قابليت استدلال، هدفگرايی و قابليتهاي اجتماعی عاملها مورد بررسی قرار نگرفته است. در اين تحقيق ما قصد داريم تا ضمن بررسی کارهای موجود در زمينه کاربرد عامل و سيستمهای چندعامله در دادهکاوی، بحث طبقهبندی جريان دادهها را در يک محيط پويا مورد بررسی قرار دهيم. ما مساله خود را در دو فاز مورد بررسی قرار خواهيم داد. در فاز اول خصوصيتهای يک عامل تنها مورد بررسی قرار خواهد گرفت و در فاز دوم قابليتهای اجتماعی عاملها مانند مذاکره، دستيابی به توافق و ... برای دادهکاوی در يک محيط پويا و توزيعشده رقابتی مورد استفاده قرار خواهد گرفت. بطور کلی دستاوردهای اصلی اين تحقيق عبارتند از 1) ارائه يک رويکرد مبتنی بر عامل برای مساله طبقهبندی جريان دادههای دارای تغيير مفهوم و پويا با استفاده از قابليتهای هدفگرايی، هوشمندی، يادگيری و استدلال 2) ارائه يک رويکرد مبتنی بر سيستمهای چندعامله برای طبقهبندی جريان دادههای توزيعشده در يک محيط رقابتی با استفاده از قابليتهای اجتماعی عاملها و دستيابی به توافق. نتايج حاصل از آزمايشات انجام شده در اين پاياننامه نشاندهنده برتری استفاده از عاملها و سيستمهای چندعامله برای بحث طبقهبندی و دادهکاوی در محيطهای پويا و توزيع شده میباشد.تعداد صفحات 153 word فهرست مطالب 1-1- مقدمهای بر دادهکاوی.. 21-1-1- خوشهبندی.. 31-1-2- کشف قواعد وابستگی.. 41-1-3- طبقهبندی.. 41-1-3-1- طبقهبندی مبتنی بر قواعد. 51-2- دادهکاوی توزيعشده 71-3- عاملها و سيستمهای چندعامله. 81-3-1- عامل. 81-3-1-1- مقايسه عامل با شی.. 91-3-1-2- معماری عاملها 111-3-1-3- معماری BDI. 121-3-2- سيستمهای چندعامله. 141-3-2-1- مذاکره 171-4- بهرهگيری از عامل برای دادهکاوی.. 191-4-1- سيستمهای چندعامله، بستری برای دادهکاوی توزيع شده 191-5- جمعبندی.. 222-1- مقدمهای بر دادهکاوی پويا 242-2- جريان داده 252-3- طبقهبندی جريان داده 262-3-1- موضوعات پژوهشی.. 272-4- جمعبندی.. 313-1- مقدمه. 343-2- دادهکاوی توزيعشده ايستا 353-2-1- روشهای غيرمتمرکز. 363-2-2- روشهای مبتنی بر توزيع ذاتی دادهها 373-3- کارهای مهم انجام شده در زمينه دادهکاوی با استفاده از عامل. 383-4- کارهای انجام شده در زمينه طبقهبندی جريان دادهها 413-4-1- روشهای طبقهبندی Ensemble-based. 413-4-2- درختهای تصميم بسيار سريع. 433-4-3- بقهبندی On-Demand. 463-4-4- OLIN.. 483-4-5- الگوريتمهای LWClass. 493-4-6- الگوريتم ANNCAD.. 513-4-7- الگوريتم SCALLOP. 513-4-8- طبقهبندی جريان دادهها با استفاده از يک روش Rule-based. 533-5- جمعبندی.. 544-1- مقدمه. 564-2- تعريف مساله برای فاز اول. 564-2-1- جريان داده 574-2-2- مفهوم يا مدل موجود در جريان داده 574-2-3- مساله طبقهبندی جريان دادههای دارای تغيير مفهوم. 574-3- تعريف مساله برای فاز دوم. 595-1- مقدمه. 635-2- رويکرد پيشنهادی برای فاز اول پروژه 635-2-1- عامل و ويژگيهای آن در اين مساله. 645-2-2- عملکرد کلی عامل. 655-2-3- معماری عامل. 665-2-3-1- حسگرها 675-2-3-2- پايگاه دانش عامل. 685-2-3-3- تابع ارزيابی محيط.. 705-2-3-3-1- نحوه تشخيص اطلاعات و نگهداری الگوهای recur در جريان داده 705-2-3-3-2- نحوه استخراج الگوهای recur 705-2-3-3-3- نحوه بروزرسانی اطلاعات مربوط به الگوهای recur 735-2-3-3-4- نحوه محاسبه وقوع احتمال وقوع يک الگوی خاص... 745-2-3-4- تابع سودمندی.. 755-2-3-5- بخش تصميمگيری و Planning. 795-2-3-5-1- بخش تصميمگيری.. 795-2-3-5-2- Planning. 835-2-3-6- بخش Action. 865-3- رويکرد پيشنهادی برای فاز دوم مساله. 875-3-1- عاملهای مشتری.. 885-3-2- عامل صفحه زرد. 905-3-3- عاملهای دادهکاو. 915-3-3-1- معماری عاملهای دادهکاو. 925-3-3-1-1- تابع BRF. 945-3-3-1-2- تابع Generate Options. 955-3-3-1-3- تابع فيلتر. 955-3-3-1-4- بخش Actions. 965-3-3-1-5- Plan های عامل. 975-3-3-1-5- 1- Plan مربوط به طبقهبندی.. 975-3-3-1-5-2- Plan مربوط به تطبيق طبقهبند 985-3-3-1-5-3- Plan مربوط به خريد و فروش قواعد با استفاده از مذاکره 1015-4- جمعبندی.. 1116-1- مقدمه. 1146-2- محيط عملياتی.. 1146-3- مجموعه دادههای مورد استفاده 1166-3-1- مجموعه دادههای استاندارد. 1166-3-2- مجموعه دادههای واقعی.. 1176-4- معيارهای ارزيابی و روشهای مورد استفاده برای مقايسه. 1176-5- آزمايشات انجام شده 1186-5-1- آزمايشات مربوط به فاز اول. 1196-5-2- آزمايشات مربوط به فاز دوم. 1286-6- جمعبندی.. 130 فهرست مراجع. 136فهرست اشکال فهرست جدولها