عنوان پروژه: بررسي معماري جويشگر googleدرس: پایگاه داده پیشرفتهقالب بندی:wordتعداد صفحات: 37قسمتی از متن:پيدايش وب، چالشهاي جديدي را براي بازيابي اطلاعات بوجود آورده است. ميزان اطلاعات عرضه شده در وب بسيار زياد است و اين مقدار با روند فزايندهاي درحال افزايش است. از سوي ديگر تعداد كاربران وب و بهطبع آن، تعداد كاربران غير حرفهاي نيز درحال افزايش است. اغلب كاربران تمايل به پيمايش وب از طريق ساختار پيوندي[1] آن بكمك جويشگرها يا نمايه[2]هاي توليد شده توسط متخصصين نظير Yahoo Directory هستند. البته شايان ذكر است كه توليد ليستها يا نمايههاي دستي از اطلاعات وب، داراي مشكلات متعددي از جمله هزينهبر بودن در مراحل توليد و بهنگامسازي، كندي ايجاد و نيز وابستگي به علايق و نظرات توليدكنندگان در طبقهبندي اطلاعات هستند و در عين حال قادر به پوشش همه اطلاعات نيستند. از سوي ديگر جويشگرهايي كه بر اساس انطباق كليدواژه[3]هاي دريافتي از كاربران عمل ميكنند، غالباً عملكرد نامطلوبي دارند و نتايجي با كيفيت بسيار پائين توليد ميكنند. ضمناً بايستي توجه داشت كه برخي سايتهاي تبليغات كه ميل به جلب نظر بازديدكنندگان دارند، ميكوشند تا با گمراه كردن جويشگرها، خود را مرتبط با پرسوجوي كاربر نشان دهند. در جويشگر Google كوشيده شده تا با تركيب اطلاعات متن و پيوند بين صفحات، بر اين مشكلات فائق آيد. شايان توجه است كه اسم اين جويشگر بر گرفته شده از کلمه Googol که به معنی «یک عدد یک و صد صفر جلوی آن» است که توسط میلتون سیروتا[4] پسر خواهر ادوارد کاسنر[5] ریاضیدان آمریکایی اختراع شدهاست. این موضوع «یک عدد یک و صد صفر جلوی آن»، نوعی شعار و در واقع مقصود موضوع است. بدین معنی که گوگل قصد دارد تا سرویسها، اهداف و اطلاعرسانی و اطلاعات خود را تا آن مقدار در وب در جهان گسترش دهد. در ادامه مختصري از روند فعاليت جويشگرهاي منتهي به عرضه جويشگر Google بطور مطرح ميشود.فهرست مطالب:1.1. سیر تحول تاریخی ابزارهای جستجو درمحيط وب.. 51.2. تاريخچه جويشگر Google. 71.3. اهداف طراحي Google. 81.3.1. مقياسپذيري در وب.. 81.3.2. بهبود كيفيت جستجو. 101.3.3. امكان تحقيق آكادميك در حوزه جويشگرهاي وب.. 102.1. الگوريتم PageRank. 112.2. متن لنگري.. 142.3. ديگر ويژگيهاي جويشگر Google. 143.1. كليات معماري جويشگر Google. 153.2. ساختارهاي داده اصلي.. 173.2.1. فايلهاي بزرگ.. 173.2.2. مخزن. 183.2.3. نمايه اسناد. 183.2.4. واژهنامه. 193.2.5. ليستهاي برخورد. 193.2.6. نمايههاي روبهجلو. 213.2.7. نمايههاي معكوس.. 223.3. عمليات خزش در وب.. 223.4. نمايهسازي اطلاعات وب.. 243.4.1. تجزيه. 243.4.2. نمايهسازي اسناد در مخازن. 243.4.3. مرتبسازي.. 253.5. جستجو. 253.5.1. سيستم رتبهبندي.. 263.5.2. بازخورد. 285.1. مراحل پردازش يك پرسوجو در جويشگر Google. 305.2. استفاده از نسخههاي كپي براي ايجاد ظرفيت و تحملپذيري خطا325.3. روش استفاده از تجهيزات محاسباتي.. 335.4. مساله تامين برق تجهيزات.. 349. فهرست منابع 37
پروژه بررسي معماري جويشگر Google
عنوان پروژه: بررسي معماري جويشگر googleدرس: پایگاه داده پیشرفتهقالب بندی:wordتعداد صفحات: 37قسمتی از متن:پيدايش وب، چالشهاي جديدي را براي بازيابي اطلاعات بوجود آورده است. ميزان اطلاعات عرضه شده در وب بسيار زياد است و اين مقدار با روند فزايندهاي درحال افزايش است. از سوي ديگر تعداد كاربران وب و بهطبع آن، تعداد كاربران غير حرفهاي نيز درحال افزايش است. اغلب كاربران تمايل به پيمايش وب از طريق ساختار پيوندي[1] آن بكمك جويشگرها يا نمايه[2]هاي توليد شده توسط متخصصين نظير Yahoo Directory هستند. البته شايان ذكر است كه توليد ليستها يا نمايههاي دستي از اطلاعات وب، داراي مشكلات متعددي از جمله هزينهبر بودن در مراحل توليد و بهنگامسازي، كندي ايجاد و نيز وابستگي به علايق و نظرات توليدكنندگان در طبقهبندي اطلاعات هستند و در عين حال قادر به پوشش همه اطلاعات نيستند. از سوي ديگر جويشگرهايي كه بر اساس انطباق كليدواژه[3]هاي دريافتي از كاربران عمل ميكنند، غالباً عملكرد نامطلوبي دارند و نتايجي با كيفيت بسيار پائين توليد ميكنند. ضمناً بايستي توجه داشت كه برخي سايتهاي تبليغات كه ميل به جلب نظر بازديدكنندگان دارند، ميكوشند تا با گمراه كردن جويشگرها، خود را مرتبط با پرسوجوي كاربر نشان دهند. در جويشگر Google كوشيده شده تا با تركيب اطلاعات متن و پيوند بين صفحات، بر اين مشكلات فائق آيد. شايان توجه است كه اسم اين جويشگر بر گرفته شده از کلمه Googol که به معنی «یک عدد یک و صد صفر جلوی آن» است که توسط میلتون سیروتا[4] پسر خواهر ادوارد کاسنر[5] ریاضیدان آمریکایی اختراع شدهاست. این موضوع «یک عدد یک و صد صفر جلوی آن»، نوعی شعار و در واقع مقصود موضوع است. بدین معنی که گوگل قصد دارد تا سرویسها، اهداف و اطلاعرسانی و اطلاعات خود را تا آن مقدار در وب در جهان گسترش دهد. در ادامه مختصري از روند فعاليت جويشگرهاي منتهي به عرضه جويشگر Google بطور مطرح ميشود.فهرست مطالب:1.1. سیر تحول تاریخی ابزارهای جستجو درمحيط وب.. 51.2. تاريخچه جويشگر Google. 71.3. اهداف طراحي Google. 81.3.1. مقياسپذيري در وب.. 81.3.2. بهبود كيفيت جستجو. 101.3.3. امكان تحقيق آكادميك در حوزه جويشگرهاي وب.. 102.1. الگوريتم PageRank. 112.2. متن لنگري.. 142.3. ديگر ويژگيهاي جويشگر Google. 143.1. كليات معماري جويشگر Google. 153.2. ساختارهاي داده اصلي.. 173.2.1. فايلهاي بزرگ.. 173.2.2. مخزن. 183.2.3. نمايه اسناد. 183.2.4. واژهنامه. 193.2.5. ليستهاي برخورد. 193.2.6. نمايههاي روبهجلو. 213.2.7. نمايههاي معكوس.. 223.3. عمليات خزش در وب.. 223.4. نمايهسازي اطلاعات وب.. 243.4.1. تجزيه. 243.4.2. نمايهسازي اسناد در مخازن. 243.4.3. مرتبسازي.. 253.5. جستجو. 253.5.1. سيستم رتبهبندي.. 263.5.2. بازخورد. 285.1. مراحل پردازش يك پرسوجو در جويشگر Google. 305.2. استفاده از نسخههاي كپي براي ايجاد ظرفيت و تحملپذيري خطا325.3. روش استفاده از تجهيزات محاسباتي.. 335.4. مساله تامين برق تجهيزات.. 349. فهرست منابع 37