چکیدهگسترش وب که فاقد یک ساختار یکپارچه است مشکلات متعددی را برای کاربران ایجاد مینماید. عدم یافتن اطلاعات مورد نیاز کاربران در این انبارهی عظیم یکی از مشکلات کاربران وب میباشد.به منظور مقابله با این مشکلات سیستمهای شخصی سازی وب ارائه شده است که با یافتن الگوهای رفتاری کاربران بدون درخواست صریح آنها قادر هستند تا پیشنهاداتی مطابق با علایق کاربران به آنها ارائه دهند. بنابراین امروزه وجود یک سیستم پیشنهاد دهنده که بتواند براساس الگوهای کشف شده از پیمایش کاربران توصیه هایی به صورت اتوماتیک به کاربر جاری ارائه دهد ضروری است. اخیرا روشهای وب کاوی به منظور شخصیسازی وب به کار گرفته میشوند. در این میان تکنیک های وب کاوی مبتنی بر کاربرد به منظور کشف الگوهای رفتاری کاربران ارائه شده است که این تکنیک ها با بهره گیری از ثبتهای وب سرورها به صورت ضمنی میتوانند الگوهای رفتاری کاربران را استخراج کنند. در این تحقیق روشی برای ایجاد نمایه کاربران ارائه شده است که با بهرهگیری از وب کاوی مبتنی بر کاربرد یک الگوی حرکتی جهت کاربران با استفاده از شبکههای عصبی ایجاد مینماید تا بتواند درخواستهای آینده کاربر را پیش بینی و سپس لیستی از صفحات مورد علاقه کاربر را تولید نماید. نتایج تحقیق نشان میدهد که سیستم پیشنهادی نسبت به سیستمهای پیشین از دقت مناسبی برخوردار میباشد.کلمات کلیدی: نمایه کاربر، شبکه عصبی، خوشه بندی، وب کاوی مبتنی بر کاربرد فهرست مطالبعنوان صفحهفهرست شکلهادفهرست جدولهاهفصل اول: کلیات تحقیق21-1-بیان مسئله31-2-ضرورت تحقیق41-3-اهداف تحقیق51-4-ساختار تحقیق5فصل دوم: ادبیات موضوع72-1-تعریف واژگان و اصطلاحات82-2-چالش های وب92-3-انواع روشهای وب کاوی102-3-1-وب کاوی مبتنی بر کاربرد112-3-2-وب کاوی مبتنی بر محتوا142-3-3-وب کاوی مبتنی بر ساختار152-4-شخصی سازی وب162-4-1-فواید سیستم شخصی سازی وب202-4-2-سیستمهای فیلتر کنندهی مبتنی بر قانون202-4-3-سیستمهای فیلتر کنندهی مبتنی بر محتوا202-4-4-سیستمهای فیلتر کنندهی مشارکتی212-5-سیستمهای توصیهگر212-6-شخصی سازی وب براساس وب کاوی مبتنی بر کاربرد222-7-منابع داده242-7-1-داده های کاربرد242-7-2-داده های محتوا252-7-3-داده های ساختار252-8-خوشه بندی262-8-1-الگوریتم K-Means272-8-2-معیارهای شباهت282-9-شبکههای عصبی30فصل سوم: کارهای پیشین323-1-رویکردهای مبتنی بر کاوش قواعد انجمنی و خوشه بندی333-2-روشهای ترکیبی در شخصیسازی وب383-3-رویکردهای مبتنی بر شاخص گذاری و کلمات کلیدی423-4-مروری بر سیستمهای پیشنهاد دهنده وب433-4-1-سیستم پیشنهاد دهنده وب433-4-2-روشهای تولید پیشنهاد443-4-2-1-روش های مبتنی بر فیلتر مشارکتی443-4-2-2-روشهای مبتنی بر محتوا443-4-2-3-روش های مبتنی بر دانش453-4-2-4-سیستم های پیشنهاد دهنده ترکیبی463-4-3-مقایسه روشهای تولید پیشنهاد46فصل چهارم: روش پیشنهادی494-1-پیش پردازش دادهها514-1-1-پاکسازی دادهها514-1-2-شناسایی و بازسازی نشستهای بازدید کاربران524-2-ایجاد نمایه برای شخصی سازی در وب524-2-1-ایجاد بردار نشست524-2-2-پاکسازی نشستها544-2-3-ساخت نمایه کاربران554-3-خوشه بندی نمایهها براساس رفتار کاربران554-4-ساخت سیستم توصیهگر با استفاده از شبکههای عصبی56فصل پنجم: پیادهسازی و ارزیابی روش پیشنهادی585-1-مرحله پیش پردازش و ساخت بردارهای نشست595-2-مرحله خوشهبندی615-3-مرحله تولید پیشنهادات با استفاده از شبکهی عصبی625-4-ارزیابی سیستم پیشنهادی63فصل ششم: نتیجهگیری و پیشنهادات آتی666-1-نتایج تحقیق و تحلیل ها676-2-کارهای آتی68فهرست مراجع..............70 فهرست شکلهاعنوان صفحهشکل 2‑1: فرایند وب کاوی مبتنی بر کاربرد[42]14شکل 2‑2: مولفه های برون خط آماده سازی داده و کشف الگو[40]23شکل 2‑3:مولفه های بر خط شخصی سازی وب[40]23شکل 4‑1:روش پیشنهادی50شکل 5‑1: نمایی از محیط اجرایی نرم افزار Rapidminer62شکل 5‑2: مقایسه دقت روش پیشنهادی با روش مبتنی بر قواعد انجمنی64شکل 5‑3: مقایسه دقت روش پیشنهادی با سیستم مشابه مرجع [31]65 فهرست جدولهاعنوان صفحهجدول 2‑1: نمونه ای از فیلدهای فرمت ثبت25جدول 3‑1: مقایسه روش های تولید پیشنهاد48جدول5‑1: ثبت های وب سرو ناسا60جدول 5‑2: اطلاعات آماری مجموعه داده61کلیات تحقیق امروزه رشد گسترده در استفاده و اندازه وب باعث به وجود آمدن مشکلات فراوانی برای کاربران وب شده است. ساختارهای استفاده شده در وب، ساختارهایی غیریکپارچه و پیچیده هستند و کاربران اغلب در تعامل با این حجم عظیم اطلاعات به هدف پرس و جوی خود دست نمییابند. از سوی دیگر تجارت الکترونیکی نیز به سرعت در حال گسترش میباشد و این موضوع که کاربران به نیازهای خود دست پیدا نمی کنند بیش از پیش مورد توجه قرار گرفته است. در این میان با کمک تکنیک های شخصی سازی وب میتوان نیازهای کاربران را بدون درخواست صریح آنها به صورت اتوماتیک فراهم کرد. در حقیقت هدف از سیستمهای شخصی سازی وب کشف الگوهای رفتاری و حرکتی کاربران در تعامل با وب میباشد تا بتوانند براساس این الگوها حرکت بعدی کاربر را پیش بینی نموده و به او در رسیدن به هدف پرس و جوی وی کمک کنند. به منظور نیل به این هدف روشهای وب کاوی مورد توجه قرار گرفتهاند و در تولید سیستم های شخصی سازی وب از این روش ها استفاده میشود. این تکنیک ها به سه دسته وب کاوی مبتنی بر محتوا، وب کاوی مبتنی بر ساختار و وب کاوی مبتنی بر کاربرد تقسیم میشوند. از میان این روشها تکنیکهای وب کاوی مبتنی بر کاربرد به طور گسترده به منظور کشف الگوهای حرکتی و رفتاری کاربران مورد استفاده قرار گرفته است. این تکنیک ها از اطلاعات موجود درفایلهای ثبت[1] وب سرور برای تولید الگوهای کاربران بهره میگیرند. و به منظور ساخت سیستمهای توصیهگر میتوان از این الگوهای رفتاری کاربران بهره جست.اخیرا وب به منبع بزرگی از اطلاعات تبدیل شده است که با افزایش استفاده از اینترنت و همچنین افزایش وب سایتها باعث بروز مشکلاتی برای کاربران شده است. یکی از مشکلات پیش آمده برای کاربران یافتن اطلاعات مورد علاقه و یا مورد نیاز آنها در این حجم انبوه اطلاعات میباشد.در این میان رقابت ایجاد شده در بخش تجارت الکترونیک نیز نیازمند ایجاد وب سایتهایی مورد علاقه کاربران میباشد. به همین دلیل روشهای شخصی سازی وب به منظور حل این مشکلات پیشنهاد میشود تا بتوان با کمک این روشها وب سایتهایی مورد علاقه و مطابق با نیازهای کاربران ایجاد نمود.هدف شخصی سازی وب تولید پیشنهادهایی پویا مبتنی بر الگوهای رفتاری کاربران میباشد. اخیرا به منظور کشف الگوهای رفتاری کاربران از تکنیک های وب کاوی استفاده میشود. از میان تکنیک های وب کاوی، تکنیک وب کاوی مبتنی بر کاربرد به طور گسترده ای به منظور کشف الگوهای رفتاری کاربران و مدل سازی این رفتارها استفاده میشود. این تکنیک از دادههای موجود در فایل های ثبت سرورها استفاده میکند در حقیقت بدون در خواست صریح کاربران تکنیک های وب کاوی مبتنی بر کاربرد قادر است از اطلاعات موجود در فایل های ثبت علایق کاربر را استخراج نموده و براساس آنها به مدل سازی رفتار کاربران نماید و الگوهای رفتاری آنها را تولید کند.در این زمینه کارهای تحقیقاتی بسیاری انجام شده است. در این تحقیق پیشنهاد میشود از کاربردکاوی وب و شبکههای عصبی برای این منظور استفاده شود تا بتوان درخواستهای آینده کاربر را پیش بینی کرد و سپس لیستی از صفحات مورد علاقهی کاربر تولید شود. به عبارت دیگر بتوان نمایه ای[2] دقیق از رفتار کاربران به دست آورده و صفحهای پیش بینی شود که کاربر در حرکت بعدی آن را انتخاب خواهد کرد. این پیشنهادهای پویا میتوانند همان پیوندهاي[3] صفحات باشند.در این پایان نامه با بهرهگیری از روش وب کاوی مبتنی بر کاربرد و در نظر گرفتن ویژگیهایی که رفتار کاربر را به صورت دقیق مشخص میکند نمایههای کاربران ساخته میشود، سپس با تکنیک خوشهبندی الگوهای حرکتی کاربران را به دست آورده میشود. به عبارت دیگر با تلفیق خوشه بندی و ویژگیهایی مانند تاریخ رویت صفحه میتوان بهترین نمایهای که توصیفگر رفتار کاربر میباشد را تولید نمود. پس از پیدا کردن الگوهاي حرکتی کاربران، با استفاده از شبکه عصبی الگوي مناسب براي کاربر پیدا شده و پیشنهادهاي مناسب براي درخواستهاي آینده کاربر تولید خواهد شد.
ایجاد یک سیستم توصیهگر در وب با بهرهگیری از نمایههای کاربران و روشهای یادگیری ماشین WORD
چکیدهگسترش وب که فاقد یک ساختار یکپارچه است مشکلات متعددی را برای کاربران ایجاد مینماید. عدم یافتن اطلاعات مورد نیاز کاربران در این انبارهی عظیم یکی از مشکلات کاربران وب میباشد.به منظور مقابله با این مشکلات سیستمهای شخصی سازی وب ارائه شده است که با یافتن الگوهای رفتاری کاربران بدون درخواست صریح آنها قادر هستند تا پیشنهاداتی مطابق با علایق کاربران به آنها ارائه دهند. بنابراین امروزه وجود یک سیستم پیشنهاد دهنده که بتواند براساس الگوهای کشف شده از پیمایش کاربران توصیه هایی به صورت اتوماتیک به کاربر جاری ارائه دهد ضروری است. اخیرا روشهای وب کاوی به منظور شخصیسازی وب به کار گرفته میشوند. در این میان تکنیک های وب کاوی مبتنی بر کاربرد به منظور کشف الگوهای رفتاری کاربران ارائه شده است که این تکنیک ها با بهره گیری از ثبتهای وب سرورها به صورت ضمنی میتوانند الگوهای رفتاری کاربران را استخراج کنند. در این تحقیق روشی برای ایجاد نمایه کاربران ارائه شده است که با بهرهگیری از وب کاوی مبتنی بر کاربرد یک الگوی حرکتی جهت کاربران با استفاده از شبکههای عصبی ایجاد مینماید تا بتواند درخواستهای آینده کاربر را پیش بینی و سپس لیستی از صفحات مورد علاقه کاربر را تولید نماید. نتایج تحقیق نشان میدهد که سیستم پیشنهادی نسبت به سیستمهای پیشین از دقت مناسبی برخوردار میباشد.کلمات کلیدی: نمایه کاربر، شبکه عصبی، خوشه بندی، وب کاوی مبتنی بر کاربرد فهرست مطالبعنوان صفحهفهرست شکلهادفهرست جدولهاهفصل اول: کلیات تحقیق21-1-بیان مسئله31-2-ضرورت تحقیق41-3-اهداف تحقیق51-4-ساختار تحقیق5فصل دوم: ادبیات موضوع72-1-تعریف واژگان و اصطلاحات82-2-چالش های وب92-3-انواع روشهای وب کاوی102-3-1-وب کاوی مبتنی بر کاربرد112-3-2-وب کاوی مبتنی بر محتوا142-3-3-وب کاوی مبتنی بر ساختار152-4-شخصی سازی وب162-4-1-فواید سیستم شخصی سازی وب202-4-2-سیستمهای فیلتر کنندهی مبتنی بر قانون202-4-3-سیستمهای فیلتر کنندهی مبتنی بر محتوا202-4-4-سیستمهای فیلتر کنندهی مشارکتی212-5-سیستمهای توصیهگر212-6-شخصی سازی وب براساس وب کاوی مبتنی بر کاربرد222-7-منابع داده242-7-1-داده های کاربرد242-7-2-داده های محتوا252-7-3-داده های ساختار252-8-خوشه بندی262-8-1-الگوریتم K-Means272-8-2-معیارهای شباهت282-9-شبکههای عصبی30فصل سوم: کارهای پیشین323-1-رویکردهای مبتنی بر کاوش قواعد انجمنی و خوشه بندی333-2-روشهای ترکیبی در شخصیسازی وب383-3-رویکردهای مبتنی بر شاخص گذاری و کلمات کلیدی423-4-مروری بر سیستمهای پیشنهاد دهنده وب433-4-1-سیستم پیشنهاد دهنده وب433-4-2-روشهای تولید پیشنهاد443-4-2-1-روش های مبتنی بر فیلتر مشارکتی443-4-2-2-روشهای مبتنی بر محتوا443-4-2-3-روش های مبتنی بر دانش453-4-2-4-سیستم های پیشنهاد دهنده ترکیبی463-4-3-مقایسه روشهای تولید پیشنهاد46فصل چهارم: روش پیشنهادی494-1-پیش پردازش دادهها514-1-1-پاکسازی دادهها514-1-2-شناسایی و بازسازی نشستهای بازدید کاربران524-2-ایجاد نمایه برای شخصی سازی در وب524-2-1-ایجاد بردار نشست524-2-2-پاکسازی نشستها544-2-3-ساخت نمایه کاربران554-3-خوشه بندی نمایهها براساس رفتار کاربران554-4-ساخت سیستم توصیهگر با استفاده از شبکههای عصبی56فصل پنجم: پیادهسازی و ارزیابی روش پیشنهادی585-1-مرحله پیش پردازش و ساخت بردارهای نشست595-2-مرحله خوشهبندی615-3-مرحله تولید پیشنهادات با استفاده از شبکهی عصبی625-4-ارزیابی سیستم پیشنهادی63فصل ششم: نتیجهگیری و پیشنهادات آتی666-1-نتایج تحقیق و تحلیل ها676-2-کارهای آتی68فهرست مراجع..............70 فهرست شکلهاعنوان صفحهشکل 2‑1: فرایند وب کاوی مبتنی بر کاربرد[42]14شکل 2‑2: مولفه های برون خط آماده سازی داده و کشف الگو[40]23شکل 2‑3:مولفه های بر خط شخصی سازی وب[40]23شکل 4‑1:روش پیشنهادی50شکل 5‑1: نمایی از محیط اجرایی نرم افزار Rapidminer62شکل 5‑2: مقایسه دقت روش پیشنهادی با روش مبتنی بر قواعد انجمنی64شکل 5‑3: مقایسه دقت روش پیشنهادی با سیستم مشابه مرجع [31]65 فهرست جدولهاعنوان صفحهجدول 2‑1: نمونه ای از فیلدهای فرمت ثبت25جدول 3‑1: مقایسه روش های تولید پیشنهاد48جدول5‑1: ثبت های وب سرو ناسا60جدول 5‑2: اطلاعات آماری مجموعه داده61کلیات تحقیق امروزه رشد گسترده در استفاده و اندازه وب باعث به وجود آمدن مشکلات فراوانی برای کاربران وب شده است. ساختارهای استفاده شده در وب، ساختارهایی غیریکپارچه و پیچیده هستند و کاربران اغلب در تعامل با این حجم عظیم اطلاعات به هدف پرس و جوی خود دست نمییابند. از سوی دیگر تجارت الکترونیکی نیز به سرعت در حال گسترش میباشد و این موضوع که کاربران به نیازهای خود دست پیدا نمی کنند بیش از پیش مورد توجه قرار گرفته است. در این میان با کمک تکنیک های شخصی سازی وب میتوان نیازهای کاربران را بدون درخواست صریح آنها به صورت اتوماتیک فراهم کرد. در حقیقت هدف از سیستمهای شخصی سازی وب کشف الگوهای رفتاری و حرکتی کاربران در تعامل با وب میباشد تا بتوانند براساس این الگوها حرکت بعدی کاربر را پیش بینی نموده و به او در رسیدن به هدف پرس و جوی وی کمک کنند. به منظور نیل به این هدف روشهای وب کاوی مورد توجه قرار گرفتهاند و در تولید سیستم های شخصی سازی وب از این روش ها استفاده میشود. این تکنیک ها به سه دسته وب کاوی مبتنی بر محتوا، وب کاوی مبتنی بر ساختار و وب کاوی مبتنی بر کاربرد تقسیم میشوند. از میان این روشها تکنیکهای وب کاوی مبتنی بر کاربرد به طور گسترده به منظور کشف الگوهای حرکتی و رفتاری کاربران مورد استفاده قرار گرفته است. این تکنیک ها از اطلاعات موجود درفایلهای ثبت[1] وب سرور برای تولید الگوهای کاربران بهره میگیرند. و به منظور ساخت سیستمهای توصیهگر میتوان از این الگوهای رفتاری کاربران بهره جست.اخیرا وب به منبع بزرگی از اطلاعات تبدیل شده است که با افزایش استفاده از اینترنت و همچنین افزایش وب سایتها باعث بروز مشکلاتی برای کاربران شده است. یکی از مشکلات پیش آمده برای کاربران یافتن اطلاعات مورد علاقه و یا مورد نیاز آنها در این حجم انبوه اطلاعات میباشد.در این میان رقابت ایجاد شده در بخش تجارت الکترونیک نیز نیازمند ایجاد وب سایتهایی مورد علاقه کاربران میباشد. به همین دلیل روشهای شخصی سازی وب به منظور حل این مشکلات پیشنهاد میشود تا بتوان با کمک این روشها وب سایتهایی مورد علاقه و مطابق با نیازهای کاربران ایجاد نمود.هدف شخصی سازی وب تولید پیشنهادهایی پویا مبتنی بر الگوهای رفتاری کاربران میباشد. اخیرا به منظور کشف الگوهای رفتاری کاربران از تکنیک های وب کاوی استفاده میشود. از میان تکنیک های وب کاوی، تکنیک وب کاوی مبتنی بر کاربرد به طور گسترده ای به منظور کشف الگوهای رفتاری کاربران و مدل سازی این رفتارها استفاده میشود. این تکنیک از دادههای موجود در فایل های ثبت سرورها استفاده میکند در حقیقت بدون در خواست صریح کاربران تکنیک های وب کاوی مبتنی بر کاربرد قادر است از اطلاعات موجود در فایل های ثبت علایق کاربر را استخراج نموده و براساس آنها به مدل سازی رفتار کاربران نماید و الگوهای رفتاری آنها را تولید کند.در این زمینه کارهای تحقیقاتی بسیاری انجام شده است. در این تحقیق پیشنهاد میشود از کاربردکاوی وب و شبکههای عصبی برای این منظور استفاده شود تا بتوان درخواستهای آینده کاربر را پیش بینی کرد و سپس لیستی از صفحات مورد علاقهی کاربر تولید شود. به عبارت دیگر بتوان نمایه ای[2] دقیق از رفتار کاربران به دست آورده و صفحهای پیش بینی شود که کاربر در حرکت بعدی آن را انتخاب خواهد کرد. این پیشنهادهای پویا میتوانند همان پیوندهاي[3] صفحات باشند.در این پایان نامه با بهرهگیری از روش وب کاوی مبتنی بر کاربرد و در نظر گرفتن ویژگیهایی که رفتار کاربر را به صورت دقیق مشخص میکند نمایههای کاربران ساخته میشود، سپس با تکنیک خوشهبندی الگوهای حرکتی کاربران را به دست آورده میشود. به عبارت دیگر با تلفیق خوشه بندی و ویژگیهایی مانند تاریخ رویت صفحه میتوان بهترین نمایهای که توصیفگر رفتار کاربر میباشد را تولید نمود. پس از پیدا کردن الگوهاي حرکتی کاربران، با استفاده از شبکه عصبی الگوي مناسب براي کاربر پیدا شده و پیشنهادهاي مناسب براي درخواستهاي آینده کاربر تولید خواهد شد.