سیستمهای پیشنهادگر ابزارهای نرم افزاری و تکنیکهایی هستند که اقلام را مطابق با نیاز کاربر به او معرفی میکنند. روشهای محتوا محور و فیلترینگ اشتراکی از راهکارهای موفق در سیستمهای پیشنهادگر میباشند. روش محتوا محور بر اساس ویژگیهای اقلام تعریف میشود. این روش بررسی میکند که اقلام مورد علاقه کاربر دارای چه ویژگیهایی بودهاند، سپس اقلام دارای ویژگیهای مشابه را به او پیشنهاد میکند. روش فیلترینگ اشتراکی بر اساس تعیین اقلام مشابه یا کاربران مشابه کار میکند که به ترتیب فیلترینگ اشتراکی مبتنی بر اقلام و مبتنی بر کاربران نامیده میشود. در این پایان نامه یک روش تلفیقی از روشهای فیلترینگ اشتراکی و محتوا محور ارائه شده است. این روش میتواند به عنوان روش فیلترینگ اشتراکی مبتنی بر کاربر در نظر گرفته شود.به این صورت که به منظور یافتن کاربرانی با سلیقه مشابه با کاربر فعال به عنوان کاربرانی با دقت پیشگویی بالا از ویژگیهای مربوط به محتوای اقلام برای افزایش تاثیر امتیازهایی که توسط کاربران به اقلام مشابه تخصیص داده شده است استفاده میکند. به بیان دیگر دو کاربر مشابه هستند در صورتی که امتیازهایی که به اقلامی که از نظر محتوا مشابه هستند نسبت دادهاند، همسان باشند. برای این منظور در هنگام سنجیدن شباهت دو کاربر، به امتیاز نسبت داده شده به هر قلم، با توجه به میزان شباهت آن به قلم هدف، وزن تخصیص مییابد. فهرست مطالب عنوان صفحه فصل 1 : مقدمه.............................................................................................................................................11-1- پیشگفتار..............................................................................................................................................21-2- موتورهای جستجوگر........................................................................................................................21-2-1- موتورهای جستجوگر پیمایشی..................................................................................................31-2- 2- فهرستهای تکمیل دستی........................................................................................................31-2-3- موتورهای جستجوگر ترکیبی.....................................................................................................41-2-4- ابرجستجوگرها...............................................................................................................................41-3- سیستمهای پیشنهادگر....................................................................................................................51-3-1- سیستم پیشنهادگر بر اساس فیلترینگ اشتراکی..................................................................71-3-2- سیستم پیشنهادگر بر اساس محتوا..........................................................................................81-3-3- سیستم پیشنهادگر بر اساس آمار گیری..................................................................................81-3-4- سیستم پیشنهادگر بر اساس سود.............................................................................................91-3-5- سیستم پیشنهادگر بر اساس دانش..........................................................................................91-3-6- سیستم پیشنهادگر ترکیبی........................................................................................................91-4- بررسی سایت MovieLens........................................................................................................101-5- اهداف پایان نامه.............................................................................................................................131-6- ساختار پایان نامه............................................................................................................................14 فصل 2 : روش فیلترینگ اشتراکی.........................................................................................................152-1- پیشگفتار...........................................................................................................................................162-2- مروری بر کارهای انجام شده در این راستا................................................................................162-3- مبانی فیلترینگ اشتراکی..............................................................................................................212-4- وظایف فیلترینگ اشتراکی..........................................................................................................222-4-1- پیشنهاد........................................................................................................................................232-4-2- پیشبینی.....................................................................................................................................232-5- دسته بندی متدهای فیلترینگ اشتراکی..................................................................................232-5-1- فیلترینگ اشتراکی مبتنی بر حافظه....................................................................................242-5-1-1- فیلترینگ اشتراکی مبتنی بر حافظه با پیشبینی بر اساس کاربران.........................252-5-1-2- فیلترینگ اشتراکی مبتنی بر حافظه با پیشبینی بر اساس اقلام..............................252-5-1- 3- تفاوت فیلترینگ اشتراکی بر اساس کاربران و بر اساس اقلام...................................262-5-2-فیلترینگ اشتراکی مبتنی بر مدل.........................................................................................262-6- نحوه تشخیص علائق کاربران.......................................................................................................272-6-1- تشخیص علائق به صورت صریح.............................................................................................272-6-2- تشخیص علائق به صورت ضمنی...........................................................................................272-7- محاسبه شباهت...............................................................................................................................282-7-1- معیار همبستگی پیرسون.........................................................................................................282-7-2- معیار اندازهگیری کسینوس.....................................................................................................292-8- انتخاب همسایه...............................................................................................................................302-8-1- استفاده از حد آستانه................................................................................................................302-8-2- انتخاب تعداد ثابتی از همسایگان...........................................................................................302-9- پیشبینی و تخمین رتبه...............................................................................................................312-9-1- استفاده از امتیازهای خام.........................................................................................................312-9-2-استفاده از امتیازهای نرمال شده............................................................................................312-10- مشکلات فیلترینگ اشتراکی.....................................................................................................322-10-1- پراکنده بودن داده...................................................................................................................322-10-2- مقیاس پذیری.........................................................................................................................322-10-3- اقلام مشابه...............................................................................................................................332-10-4- گریشیپ.................................................................................................................................332-11- بررسی چگونگی کارکرد سایت آمازون....................................................................................33 فصل 3: روش محتوا محور.....................................................................................................................363-1- پیشگفتار...........................................................................................................................................373-2- روند کار روش محتوا محور...........................................................................................................373-2-1- تحلیلگر محتوا..........................................................................................................................383-2-2- یادگیرنده نمایه.................................................................................................................393-2-3- جزء فیلترینگ............................................................................................................................423-3- مزایای روش محتوا محور..............................................................................................................423-3-1- استقلال کاربر.............................................................................................................................423-3-2- شفافیت........................................................................................................................................423-3-3- قلم جدید.....................................................................................................................................433-4- معایب روش محتوا محور...............................................................................................................433-4-1- کمبود محتوا...............................................................................................................................433-4-2- خصوصی سازی افزون...............................................................................................................433-4-3- کاربر جدید..................................................................................................................................44 فصل 4 : روش پیشنهادی.........................................................................................................................454-1- پیشگفتار...........................................................................................................................................464-2- مروری بر کارهای انجام شده در این راستا................................................................................464-3- مقدمهای بر روش پیشنهادی........................................................................................................484-4- روش پیشنهادی..............................................................................................................................484-4-1- پیش پردازش..............................................................................................................................494-4-1-1- پیش پردازش بر روی پایگاه داده MovieLens........................................................494-4-1-2- پیش پردازش بر روی پایگاه داده EachMovie........................................................504-4-2- وزندهی به اقلام........................................................................................................................514-4-3- انتخابهمسایگی........................................................................................................................534-4-4- پیشبینی....................................................................................................................................54 فصل 5 : آزمایشها و نتایج......................................................................................................................565-1- پایگاه دادههای مورد استفاده........................................................................................................575-2- نحوه اجرای روش پیشنهادی روی پایگاه دادهMovieLens..............................................575-3- نحوه اجرای روش پیشنهادی روی پایگاه داده ٍEachMovie..............................................585-4- معیارهایارزیابی..............................................................................................................................585-4-1- میانگین خطای مطلق...............................................................................................................585-4-2- دقت و فراخوانی.........................................................................................................................595-4-3- معیار ارزیابیF1........................................................................................................................605-5- ارزیابی روش پیشنهادی توسط معیارهای معرفی شده...........................................................61 فصل 6 : بحث و نتیجهگیری...................................................................................................................666-1- بحث...................................................................................................................................................676-2- نتیجهگیری......................................................................................................................................676-4- پیشنهادات........................................................................................................................................68 مراجع...........................................................................................................................................................69 فهرست جدول ها عنوان و شماره صفحه جدول شماره 1 : نمونههایی از سیستمهای پیشنهادگر و اقلام پیشنهادی آنها..............................7جدول شماره 2 : مقایسه میانگین خطای مطلق روش پایه و روش پیشنهادی، اعمال شده بر MovieLens.............................................................................................................................................61جدول شماره 3 : مقایسه میانگین خطای مطلق روش پایه و روش پیشنهادی، اعمال شده بر EachMovie.............................................................................................................................................61جدول شماره 4 : مقایسه معیار دقت روش پایه و روش پیشنهادی، اعمال شده بر MovieLens.............................................................................................................................................61جدول شماره 5 : مقایسه معیار دقت روش پایه و روش پیشنهادی، اعمال شده برEachMovie ............................................................................................................................................62جدول شماره 6 : مقایسه معیار فراخوانیروش پایه و روش پیشنهادی، اعمال شده بر MovieLens.............................................................................................................................................62جدول شماره 7 : مقایسه معیار فراخوانیروش پایه و روش پیشنهادی، اعمال شده بر EachMovie.............................................................................................................................................62جدول شماره 8 : مقایسهمعیارF1روش پایه و روش پیشنهادی، اعمال شده بر MovieLens.............................................................................................................................................62جدول شماره 9 : مقایسه معیارF1 روش پایه و روش پیشنهادی، اعمال شده برEachMovie.............................................................................................................................................62 جدولشماره 10: مقایسه میانگین خطای مطلق روش پیشنهادی با روشهای[19] و [20]..............................................................................................................................................................65 فهرست تصاویر عنوان و شماره صفحه شکل شماره 1: نمونههایی از موتورهای جستجوگر............................................................................5شکل شماره 2 : نمونه صفحهای از سایت Movielens...................................................................11شکل شماره 3: نمونه صفحه درخواست امتیازدهی Movielens از کاربر..................................12شکل شماره 4 : نمونه صفحه فیلمهای پیشنهادی از سوی Movielens به کاربر..................13شکل شماره 5 : نمونه ماتریس امتیازدهی کاربران - اقلام...............................................................22شکل شماره 6: فیلترینگ اشتراکی مبتنی بر اقلام..........................................................................25شکل شماره7: فیلترینگ اشتراکی مبتنی بر کاربران......................................................................25شکل شماره 8: روند تولید پیشنهاد در آمازون..................................................................................34شکل شماره 9: نمونه صفحهای از سایت آمازون...............................................................................35شکل شماره10:ارائه پیشنهاد بر اساس کارت خرید مشتری.......................................................35شکل شماره11 :روند کار روش محتوا محور.....................................................................................38شکل شماره 12: نمونه صفحهای از سایت آمازون...........................................................................40شکل شماره 13 :استفاده از روش محتوا محور در سایت آمازون..................................................41شکل شماره 14 : نمایش مفاهیم دقت و فراخوانی در حوزه بازیابی اطلاعات.............................59شکل شماره 15: رابطه معیار فراخوانی با معیار دقت.......................................................................60شکل شماره 16: مقایسه میانگین خطای مطلق روش پایه و روش پیشنهادی، اعمال شده برMovieLens.............................................................................................................................................63شکل شماره 17: مقایسه میانگین خطای مطلق روش پایه و روش پیشنهادی، اعمال شده برEachMovie.............................................................................................................................................63شکل شماره 18: مقایسه معیار دقت، فراخوانی و F روش پایه و روش پیشنهادی، اعمال شده بر EachMovie.......................................................................................................................................64شکل شماره 19: مقایسه معیار دقت، فراخوانی و F روش پایه و روش پیشنهادی، اعمال شده بر MovieLens.........................................................................................................................................64 فصل اول1- مقدمه 1-1- پیشگفتار پیدایش اینترنت و وب جهان گستر[1] موجب شده است که در رابطه با هر موضوع قابل تصور، حجم بسیار زیادی از اطلاعات وجود داشته باشد که کاربران[2] بتوانند با استفاده از آن نیاز اطلاعاتی خود را برطرف سازند. افزایش روز افزون اطلاعات باعث شد که مشکل سربار اطلاعات[3] به وجود آید و کاربران به تنهایی قادر به برطرف کردن نیازهای خود نباشند. . زیرا کاربران مجبور بودند به صورت بر خط[4] تمامی صفحات را جستجو کنند تا بتوانند آن قسمتی را که مورد نیازشان است پیدا کنند. به همین دلیل موتورهای جستجوگر[5] به وجود آمدند تا کاربران بتوانند با استفاده از آنها بدون نیاز به بررسی تعداد زیادی از صفحات به اطلاعات مورد نظرشان دسترسی پیدا کنند. 1-2- موتورهای جستجوگر به عبارت دیگر یک موتور جستجوگر وب سایتی است که میتوان از آن برای پیدا کردن صفحات وباستفاده کرد.وقتی کاربر درخواستخود را در قالب کلمات کلیدی وارد موتور جستجوگر میکند موتور جستجوگر در بین بیلیونها صفحه وب جستجو کرده و به کاربر کمک میکند اطلاعاتی که به دنبال آن است را بیابد. با استفاده از این ابزار سرعت ودقت در جستجو بسیار افزایش یافت و کاربران توانستند به سادگی و در کمترین زمان به بهترین نتایج دست یابند.انواع زیادی از موتورهای جستجوگر توسط کمپانیهای مختلف ساخته شده است که معروفترین آنها بینگ[6]، یاهو[7] و گوگل[8] میباشد (شکل شماره 1).هر موتور جستجوگر راه و روش خود را برای سازماندهی اطلاعات دارد، پس نتیجه از یک موتور جستجوگر تا دیگری متفاوت خواهد بود.موتورهای جستجوگر به دو دسته کلی تقسیم میشوند : موتورهای جستجوگر پیمایشی[9] و فهرستهای تکمیل دستی[10]. موتورهای جستجوگر ترکیبی[11] نیز حاصل ترکیب دو نوع بالا میباشند. گونهای جدید از موتورهای جستجوگر نیز تحت عنوان ابر جستجوگرها[12] وجود دارد که در ادامه به طور خلاصه به توضیح هر کدام از این موارد خواهیم پرداخت. 1-2-1- موتورهای جستجوگر پیمایشی این موتورهای جستجوگر، وب را پیمایش و اطلاعاتی را ذخیره میکنند. سپس کاربران از میان این اطلاعات آنچه را که میخواهند جستجو میکنند. اگر در صفحه وب تغییراتی اعمال شود موتورهای جستجوگر پیمایشی به طور خودکار آنها را مییابند و تغییرات مذکور را در فهرستها اعمال میکنند. نمونههایی ازموتورهای جستجوگر پیمایشیگوگلو یاهو میباشند. 1-2- 2- فهرستهای تکمیل دستی فهرستهای تکمیل دستی وابسته به کاربرانی میباشد که آن را تکمیل میکنند. یا کاربر خودش صفحه مورد نظر را به همراه توضیحی کوتاه در فهرست ثبت میکند یا این کار توسط ویراستارهایی که برای آن فهرست در نظر گرفته شده صورت میپذیرد. در این حالت عمل جستجو تنها بر روی توضیحات ثبت شده انجام میگیرد و اگر تغییری روی صفحه وب به وجود آید در فهرست تغییر به وجود نخواهد آمد.نمونهای از فهرستهای تکمیل دستیOpen Directoryمیباشد[13].
استفاده ازکاربرانی با دقت پیشگویی بالا در سیستم-های فیلترینگ اشتراکی WORD
سیستمهای پیشنهادگر ابزارهای نرم افزاری و تکنیکهایی هستند که اقلام را مطابق با نیاز کاربر به او معرفی میکنند. روشهای محتوا محور و فیلترینگ اشتراکی از راهکارهای موفق در سیستمهای پیشنهادگر میباشند. روش محتوا محور بر اساس ویژگیهای اقلام تعریف میشود. این روش بررسی میکند که اقلام مورد علاقه کاربر دارای چه ویژگیهایی بودهاند، سپس اقلام دارای ویژگیهای مشابه را به او پیشنهاد میکند. روش فیلترینگ اشتراکی بر اساس تعیین اقلام مشابه یا کاربران مشابه کار میکند که به ترتیب فیلترینگ اشتراکی مبتنی بر اقلام و مبتنی بر کاربران نامیده میشود. در این پایان نامه یک روش تلفیقی از روشهای فیلترینگ اشتراکی و محتوا محور ارائه شده است. این روش میتواند به عنوان روش فیلترینگ اشتراکی مبتنی بر کاربر در نظر گرفته شود.به این صورت که به منظور یافتن کاربرانی با سلیقه مشابه با کاربر فعال به عنوان کاربرانی با دقت پیشگویی بالا از ویژگیهای مربوط به محتوای اقلام برای افزایش تاثیر امتیازهایی که توسط کاربران به اقلام مشابه تخصیص داده شده است استفاده میکند. به بیان دیگر دو کاربر مشابه هستند در صورتی که امتیازهایی که به اقلامی که از نظر محتوا مشابه هستند نسبت دادهاند، همسان باشند. برای این منظور در هنگام سنجیدن شباهت دو کاربر، به امتیاز نسبت داده شده به هر قلم، با توجه به میزان شباهت آن به قلم هدف، وزن تخصیص مییابد. فهرست مطالب عنوان صفحه فصل 1 : مقدمه.............................................................................................................................................11-1- پیشگفتار..............................................................................................................................................21-2- موتورهای جستجوگر........................................................................................................................21-2-1- موتورهای جستجوگر پیمایشی..................................................................................................31-2- 2- فهرستهای تکمیل دستی........................................................................................................31-2-3- موتورهای جستجوگر ترکیبی.....................................................................................................41-2-4- ابرجستجوگرها...............................................................................................................................41-3- سیستمهای پیشنهادگر....................................................................................................................51-3-1- سیستم پیشنهادگر بر اساس فیلترینگ اشتراکی..................................................................71-3-2- سیستم پیشنهادگر بر اساس محتوا..........................................................................................81-3-3- سیستم پیشنهادگر بر اساس آمار گیری..................................................................................81-3-4- سیستم پیشنهادگر بر اساس سود.............................................................................................91-3-5- سیستم پیشنهادگر بر اساس دانش..........................................................................................91-3-6- سیستم پیشنهادگر ترکیبی........................................................................................................91-4- بررسی سایت MovieLens........................................................................................................101-5- اهداف پایان نامه.............................................................................................................................131-6- ساختار پایان نامه............................................................................................................................14 فصل 2 : روش فیلترینگ اشتراکی.........................................................................................................152-1- پیشگفتار...........................................................................................................................................162-2- مروری بر کارهای انجام شده در این راستا................................................................................162-3- مبانی فیلترینگ اشتراکی..............................................................................................................212-4- وظایف فیلترینگ اشتراکی..........................................................................................................222-4-1- پیشنهاد........................................................................................................................................232-4-2- پیشبینی.....................................................................................................................................232-5- دسته بندی متدهای فیلترینگ اشتراکی..................................................................................232-5-1- فیلترینگ اشتراکی مبتنی بر حافظه....................................................................................242-5-1-1- فیلترینگ اشتراکی مبتنی بر حافظه با پیشبینی بر اساس کاربران.........................252-5-1-2- فیلترینگ اشتراکی مبتنی بر حافظه با پیشبینی بر اساس اقلام..............................252-5-1- 3- تفاوت فیلترینگ اشتراکی بر اساس کاربران و بر اساس اقلام...................................262-5-2-فیلترینگ اشتراکی مبتنی بر مدل.........................................................................................262-6- نحوه تشخیص علائق کاربران.......................................................................................................272-6-1- تشخیص علائق به صورت صریح.............................................................................................272-6-2- تشخیص علائق به صورت ضمنی...........................................................................................272-7- محاسبه شباهت...............................................................................................................................282-7-1- معیار همبستگی پیرسون.........................................................................................................282-7-2- معیار اندازهگیری کسینوس.....................................................................................................292-8- انتخاب همسایه...............................................................................................................................302-8-1- استفاده از حد آستانه................................................................................................................302-8-2- انتخاب تعداد ثابتی از همسایگان...........................................................................................302-9- پیشبینی و تخمین رتبه...............................................................................................................312-9-1- استفاده از امتیازهای خام.........................................................................................................312-9-2-استفاده از امتیازهای نرمال شده............................................................................................312-10- مشکلات فیلترینگ اشتراکی.....................................................................................................322-10-1- پراکنده بودن داده...................................................................................................................322-10-2- مقیاس پذیری.........................................................................................................................322-10-3- اقلام مشابه...............................................................................................................................332-10-4- گریشیپ.................................................................................................................................332-11- بررسی چگونگی کارکرد سایت آمازون....................................................................................33 فصل 3: روش محتوا محور.....................................................................................................................363-1- پیشگفتار...........................................................................................................................................373-2- روند کار روش محتوا محور...........................................................................................................373-2-1- تحلیلگر محتوا..........................................................................................................................383-2-2- یادگیرنده نمایه.................................................................................................................393-2-3- جزء فیلترینگ............................................................................................................................423-3- مزایای روش محتوا محور..............................................................................................................423-3-1- استقلال کاربر.............................................................................................................................423-3-2- شفافیت........................................................................................................................................423-3-3- قلم جدید.....................................................................................................................................433-4- معایب روش محتوا محور...............................................................................................................433-4-1- کمبود محتوا...............................................................................................................................433-4-2- خصوصی سازی افزون...............................................................................................................433-4-3- کاربر جدید..................................................................................................................................44 فصل 4 : روش پیشنهادی.........................................................................................................................454-1- پیشگفتار...........................................................................................................................................464-2- مروری بر کارهای انجام شده در این راستا................................................................................464-3- مقدمهای بر روش پیشنهادی........................................................................................................484-4- روش پیشنهادی..............................................................................................................................484-4-1- پیش پردازش..............................................................................................................................494-4-1-1- پیش پردازش بر روی پایگاه داده MovieLens........................................................494-4-1-2- پیش پردازش بر روی پایگاه داده EachMovie........................................................504-4-2- وزندهی به اقلام........................................................................................................................514-4-3- انتخابهمسایگی........................................................................................................................534-4-4- پیشبینی....................................................................................................................................54 فصل 5 : آزمایشها و نتایج......................................................................................................................565-1- پایگاه دادههای مورد استفاده........................................................................................................575-2- نحوه اجرای روش پیشنهادی روی پایگاه دادهMovieLens..............................................575-3- نحوه اجرای روش پیشنهادی روی پایگاه داده ٍEachMovie..............................................585-4- معیارهایارزیابی..............................................................................................................................585-4-1- میانگین خطای مطلق...............................................................................................................585-4-2- دقت و فراخوانی.........................................................................................................................595-4-3- معیار ارزیابیF1........................................................................................................................605-5- ارزیابی روش پیشنهادی توسط معیارهای معرفی شده...........................................................61 فصل 6 : بحث و نتیجهگیری...................................................................................................................666-1- بحث...................................................................................................................................................676-2- نتیجهگیری......................................................................................................................................676-4- پیشنهادات........................................................................................................................................68 مراجع...........................................................................................................................................................69 فهرست جدول ها عنوان و شماره صفحه جدول شماره 1 : نمونههایی از سیستمهای پیشنهادگر و اقلام پیشنهادی آنها..............................7جدول شماره 2 : مقایسه میانگین خطای مطلق روش پایه و روش پیشنهادی، اعمال شده بر MovieLens.............................................................................................................................................61جدول شماره 3 : مقایسه میانگین خطای مطلق روش پایه و روش پیشنهادی، اعمال شده بر EachMovie.............................................................................................................................................61جدول شماره 4 : مقایسه معیار دقت روش پایه و روش پیشنهادی، اعمال شده بر MovieLens.............................................................................................................................................61جدول شماره 5 : مقایسه معیار دقت روش پایه و روش پیشنهادی، اعمال شده برEachMovie ............................................................................................................................................62جدول شماره 6 : مقایسه معیار فراخوانیروش پایه و روش پیشنهادی، اعمال شده بر MovieLens.............................................................................................................................................62جدول شماره 7 : مقایسه معیار فراخوانیروش پایه و روش پیشنهادی، اعمال شده بر EachMovie.............................................................................................................................................62جدول شماره 8 : مقایسهمعیارF1روش پایه و روش پیشنهادی، اعمال شده بر MovieLens.............................................................................................................................................62جدول شماره 9 : مقایسه معیارF1 روش پایه و روش پیشنهادی، اعمال شده برEachMovie.............................................................................................................................................62 جدولشماره 10: مقایسه میانگین خطای مطلق روش پیشنهادی با روشهای[19] و [20]..............................................................................................................................................................65 فهرست تصاویر عنوان و شماره صفحه شکل شماره 1: نمونههایی از موتورهای جستجوگر............................................................................5شکل شماره 2 : نمونه صفحهای از سایت Movielens...................................................................11شکل شماره 3: نمونه صفحه درخواست امتیازدهی Movielens از کاربر..................................12شکل شماره 4 : نمونه صفحه فیلمهای پیشنهادی از سوی Movielens به کاربر..................13شکل شماره 5 : نمونه ماتریس امتیازدهی کاربران - اقلام...............................................................22شکل شماره 6: فیلترینگ اشتراکی مبتنی بر اقلام..........................................................................25شکل شماره7: فیلترینگ اشتراکی مبتنی بر کاربران......................................................................25شکل شماره 8: روند تولید پیشنهاد در آمازون..................................................................................34شکل شماره 9: نمونه صفحهای از سایت آمازون...............................................................................35شکل شماره10:ارائه پیشنهاد بر اساس کارت خرید مشتری.......................................................35شکل شماره11 :روند کار روش محتوا محور.....................................................................................38شکل شماره 12: نمونه صفحهای از سایت آمازون...........................................................................40شکل شماره 13 :استفاده از روش محتوا محور در سایت آمازون..................................................41شکل شماره 14 : نمایش مفاهیم دقت و فراخوانی در حوزه بازیابی اطلاعات.............................59شکل شماره 15: رابطه معیار فراخوانی با معیار دقت.......................................................................60شکل شماره 16: مقایسه میانگین خطای مطلق روش پایه و روش پیشنهادی، اعمال شده برMovieLens.............................................................................................................................................63شکل شماره 17: مقایسه میانگین خطای مطلق روش پایه و روش پیشنهادی، اعمال شده برEachMovie.............................................................................................................................................63شکل شماره 18: مقایسه معیار دقت، فراخوانی و F روش پایه و روش پیشنهادی، اعمال شده بر EachMovie.......................................................................................................................................64شکل شماره 19: مقایسه معیار دقت، فراخوانی و F روش پایه و روش پیشنهادی، اعمال شده بر MovieLens.........................................................................................................................................64 فصل اول1- مقدمه 1-1- پیشگفتار پیدایش اینترنت و وب جهان گستر[1] موجب شده است که در رابطه با هر موضوع قابل تصور، حجم بسیار زیادی از اطلاعات وجود داشته باشد که کاربران[2] بتوانند با استفاده از آن نیاز اطلاعاتی خود را برطرف سازند. افزایش روز افزون اطلاعات باعث شد که مشکل سربار اطلاعات[3] به وجود آید و کاربران به تنهایی قادر به برطرف کردن نیازهای خود نباشند. . زیرا کاربران مجبور بودند به صورت بر خط[4] تمامی صفحات را جستجو کنند تا بتوانند آن قسمتی را که مورد نیازشان است پیدا کنند. به همین دلیل موتورهای جستجوگر[5] به وجود آمدند تا کاربران بتوانند با استفاده از آنها بدون نیاز به بررسی تعداد زیادی از صفحات به اطلاعات مورد نظرشان دسترسی پیدا کنند. 1-2- موتورهای جستجوگر به عبارت دیگر یک موتور جستجوگر وب سایتی است که میتوان از آن برای پیدا کردن صفحات وباستفاده کرد.وقتی کاربر درخواستخود را در قالب کلمات کلیدی وارد موتور جستجوگر میکند موتور جستجوگر در بین بیلیونها صفحه وب جستجو کرده و به کاربر کمک میکند اطلاعاتی که به دنبال آن است را بیابد. با استفاده از این ابزار سرعت ودقت در جستجو بسیار افزایش یافت و کاربران توانستند به سادگی و در کمترین زمان به بهترین نتایج دست یابند.انواع زیادی از موتورهای جستجوگر توسط کمپانیهای مختلف ساخته شده است که معروفترین آنها بینگ[6]، یاهو[7] و گوگل[8] میباشد (شکل شماره 1).هر موتور جستجوگر راه و روش خود را برای سازماندهی اطلاعات دارد، پس نتیجه از یک موتور جستجوگر تا دیگری متفاوت خواهد بود.موتورهای جستجوگر به دو دسته کلی تقسیم میشوند : موتورهای جستجوگر پیمایشی[9] و فهرستهای تکمیل دستی[10]. موتورهای جستجوگر ترکیبی[11] نیز حاصل ترکیب دو نوع بالا میباشند. گونهای جدید از موتورهای جستجوگر نیز تحت عنوان ابر جستجوگرها[12] وجود دارد که در ادامه به طور خلاصه به توضیح هر کدام از این موارد خواهیم پرداخت. 1-2-1- موتورهای جستجوگر پیمایشی این موتورهای جستجوگر، وب را پیمایش و اطلاعاتی را ذخیره میکنند. سپس کاربران از میان این اطلاعات آنچه را که میخواهند جستجو میکنند. اگر در صفحه وب تغییراتی اعمال شود موتورهای جستجوگر پیمایشی به طور خودکار آنها را مییابند و تغییرات مذکور را در فهرستها اعمال میکنند. نمونههایی ازموتورهای جستجوگر پیمایشیگوگلو یاهو میباشند. 1-2- 2- فهرستهای تکمیل دستی فهرستهای تکمیل دستی وابسته به کاربرانی میباشد که آن را تکمیل میکنند. یا کاربر خودش صفحه مورد نظر را به همراه توضیحی کوتاه در فهرست ثبت میکند یا این کار توسط ویراستارهایی که برای آن فهرست در نظر گرفته شده صورت میپذیرد. در این حالت عمل جستجو تنها بر روی توضیحات ثبت شده انجام میگیرد و اگر تغییری روی صفحه وب به وجود آید در فهرست تغییر به وجود نخواهد آمد.نمونهای از فهرستهای تکمیل دستیOpen Directoryمیباشد[13].