عنوان مقاله: طراحي SPAM: ابزاري براي کاوش در شبکة گستردة جهانيقالب بندی: wordتعداد صفحات: 19قسمتی از متن:ما در «عصر اطلاعات» زندگي ميکنيم، عصري که در آن انسانها بيش از هر زمان ديگري در گذشته داده و اطلاعات توليد و منتشر ميکنند. در واقع اطلاعاتي که در اختيار ما قرار دارد خيلي بيشتر از آن است که بتوانيم آن را تجزيه و تحليل کنيم. به اين ترتيب انتخاب منابع مورد نظر كاربر از اين حجم رياد اطلاعات روز به روز مشكلتر مي شود، که اين مسئله به دلايل مختلفي است که از آن جمله مي توان به موارد زير اشاره کرد:1- وب خيلي بزرگ و متنوع است. مطالعهای[1] نشان داده است که بيش از 10 بيليون صفحه با دسترسي عمومي در وب وجود دارد. علاوه بر اين، تقريباً هر ماه 6 ترا بايت اطلاعات جديد به وب اضافه ميشود.2- داده هاي وب به سرعت در حال تغييرند. در حيني که وب به سرعت از لحاظ اندازه رشد مي کند، اطلاعات آن هم مدام تغيير ميکنند و به روز ميشوند.3- وب خيلي بد سازماندهي شده است. گر چه ممکن است بخشهاي کوچکي از وب خوب سازماندهي شده باشند و به خوبي نگهداري شوند اما کل وب کاملاً غير ساخت يافته است.علاوه بر اينها وب کاربران خيلي متفاوتي داردو هرکاربری ممکن است تنها به بخش کوچکي از وب علاقمند باشد. در نتيجه، کاربران بر خط مشکلات زيادي در يافتن اطلاعات موردنظرشان دارند.موتورهاي جستجو به کاربران در يافتن منابع اطلاعاتي مرتبط کمک ميکنند. اما موتورهاي جستجو داراي مشکلات زيادي هستند. يک عنوان ممکن است صدها يا هزاران سند را شامل شود که باعث میشود موتور جستجو تعداد زيادي سند شامل اسناد غيرمرتبط برگرداند. تعداد زيادي از اسنادي که کاملاً به عنوان مورد نظر وابسته هستند هم ممکن است داراي کلمات کليدي که آن موضوع را تعريف ميکند، نباشند.
طراحي SPAM: ابزاري براي کاوش در شبکة گستردة جهاني
عنوان مقاله: طراحي SPAM: ابزاري براي کاوش در شبکة گستردة جهانيقالب بندی: wordتعداد صفحات: 19قسمتی از متن:ما در «عصر اطلاعات» زندگي ميکنيم، عصري که در آن انسانها بيش از هر زمان ديگري در گذشته داده و اطلاعات توليد و منتشر ميکنند. در واقع اطلاعاتي که در اختيار ما قرار دارد خيلي بيشتر از آن است که بتوانيم آن را تجزيه و تحليل کنيم. به اين ترتيب انتخاب منابع مورد نظر كاربر از اين حجم رياد اطلاعات روز به روز مشكلتر مي شود، که اين مسئله به دلايل مختلفي است که از آن جمله مي توان به موارد زير اشاره کرد:1- وب خيلي بزرگ و متنوع است. مطالعهای[1] نشان داده است که بيش از 10 بيليون صفحه با دسترسي عمومي در وب وجود دارد. علاوه بر اين، تقريباً هر ماه 6 ترا بايت اطلاعات جديد به وب اضافه ميشود.2- داده هاي وب به سرعت در حال تغييرند. در حيني که وب به سرعت از لحاظ اندازه رشد مي کند، اطلاعات آن هم مدام تغيير ميکنند و به روز ميشوند.3- وب خيلي بد سازماندهي شده است. گر چه ممکن است بخشهاي کوچکي از وب خوب سازماندهي شده باشند و به خوبي نگهداري شوند اما کل وب کاملاً غير ساخت يافته است.علاوه بر اينها وب کاربران خيلي متفاوتي داردو هرکاربری ممکن است تنها به بخش کوچکي از وب علاقمند باشد. در نتيجه، کاربران بر خط مشکلات زيادي در يافتن اطلاعات موردنظرشان دارند.موتورهاي جستجو به کاربران در يافتن منابع اطلاعاتي مرتبط کمک ميکنند. اما موتورهاي جستجو داراي مشکلات زيادي هستند. يک عنوان ممکن است صدها يا هزاران سند را شامل شود که باعث میشود موتور جستجو تعداد زيادي سند شامل اسناد غيرمرتبط برگرداند. تعداد زيادي از اسنادي که کاملاً به عنوان مورد نظر وابسته هستند هم ممکن است داراي کلمات کليدي که آن موضوع را تعريف ميکند، نباشند.