واژگان کليدي: طبقهبندي پوشش اراضي شهري، قطعهبندي تصوير، ويژگيهاي شيگرا، الگوريتم جنگل تصادفي، انتخاب ويژگي، ماشين بردار پشتيبان، شبکههاي عصبي، سنجش از دورفهرست مطالبفصل 1مقدمه.. 21-1 پيشگفتار.. 21-2 ضرورتها، انگيزهها و ويژگيهاي تحقيق.. 41-3 اهداف و سؤالات تحقيق.. 51-4 روش تحقيق.. 61-5 معرفي اختصاري ساير فصول.. 7فصل 2مروري بر تحقيقات پيشين.. 102-1 مقدمه.. 102-2 مروري بر روشهاي طبقهبندي پوشش اراضي.. 102-2-1 فنهای طبقهبندی شیگرا.. 112-2-2 فنهای طبقهبندی نظارتنشده پیکسل-مبنا.. 122-2-3 فنهای طبقهبندی نظارتشده پیکسل-مبنا.. 122-3 مروري بر روشهاي طبقهبندي جديد در سنجش از دور.. 132-3-1 طبقهبندي با شبکههاي عصبي مصنوعي.. 142-3-2 طبقهبندي با درختان تصميم.. 152-3-3 طبقهبندي با روشهاي مبتني بر ماشين بردار پشتيبان.. 152-3-4 فنهاي طبقهبندي دانش-پايه.. 172-3-5 طبقهبندي با الگوريتمهاي ترکيبي.. 182-4 روشهاي انتخاب و کاهش فضاي ويژگي.. 212-5 خلاصه فصل.. 22فصل 3مفاهيم و روشها.. 253-1 مقدمه.. 253-2 مفاهيم پايه.. 253-3 الگوريتمهاي يادگيري متداول.. 273-3-1 آناليز جداسازي خطي.. 273-3-2 درختهاي تصميم.. 283-3-3 شبکههاي عصبي.. 313-3-4 طبقهبنديکننده بيز ساده.. 333-3-5 روشهاي مبتني بر ماشينهاي بردار پشتيبان و کرنل.. 343-4 روشهاي دسته جمعي.. 393-5 تقويت.. 413-6 روش Bagging. 423-6-1 دو الگوي گروهي.. 423-6-2 الگوريتم Bagging. 433-6-3 جنگل تصادفي.. 473-6-4 انتخاب ويژگي با کمک شاخص تعيين اهميت ويژگي RF. 513-7 قطعهبندي تصوير.. 533-7-1 قطعهبندي به روش چند رزولوشنه.. 543-7-2 روش برآورد مقياس مناسب براي قطعهبندي تصوير.. 583-8 برآورد دقت طبقهبندي.. 593-8-1 ماتريس ابهام.. 603-9 خلاصه.. 62فصل 4روش تحقيق و نتايج.. 644-1 مقدمه.. 644-2 دادهها و منطقه مورد مطالعه.. 644-3 روش پيشنهادي تحقيق.. 664-3-1 انتخاب باند با کمک شاخص اهميت ويژگي RF. 694-3-2 قطعهبندي تصوير ابرطيفي.. 704-3-3 گروههاي ويژگي.. 714-3-4 طبقهبندي.. 724-4 ارزيابي.. 744-4-1 نتايج ارزيابي دقت کلي و ضريب کاپا.. 744-4-2 ارزيابي زماني روشهاي طبقهبندي.. 794-4-3 نتايج طبقهبندي به تفکيک کلاسها.. 804-4-4 ارزيابي بصري.. 844-5 جمعبندي مطالب فصل.. 88فصل 5نتيجهگيري و پيشنهادها.. 915-1 مقدمه.. 915-2 خلاصه تحقيق.. 915-3 دستاوردهاي تحقيق.. 925-4 پيشنهادها.. 95منابع 97 فهرست اشکالشکل 1‑1) روند کلي تحقيق.. 7شکل 3‑1: مرز تصميم LDA بر روي يک مجموعه داده three-Gaussians. 27شکل 3‑2: مثالي از درخت تصميم.. 28شکل 3‑3: مرز تصميم يک درخت تصميم بر روي مجموعه داده three-Gaussians. 31شکل 3‑4: شکل (الف) يک نرون و (ب) يک شبکه عصبي.. 32شکل 3‑5: نمايي از SVM خطي دوتايي.. 35شکل 3‑7: تفکيک غير-خطي با استفاده از فن کرنل SVMs (Bekkari et al., 2012) 38شکل 3‑8: معماري يک روش دسته جمعي معمولي.. 39شکل 3‑9: معمولاً مجموعه چند طبقهبنديکننده بهتر از بهترين تک طبقهبنديکننده عمل ميکند (Hansen and Salamon, 1990)... 40شکل 3‑10: الگوريتم Bagging. 44شکل 3‑11: مرزهاي تصميم (شکل بالا چپ) يک تک درخت، (شکل بالا راست) Bagging و (شکل پايين) درختهاي تشکيلدهنده آن بر روي مجموعه داده three-Guassian. 46شکل 3‑12: الگوريتم توليد درخت تصادفي در RF. 48شکل 3‑13: روند کلي الگوريتم جنگل تصادفي (Guo et al., 2011).. 49شکل 3‑14: مرزهاي تصميم بر روي مجموعه داده مصنوعي: (الف) 10 طبقهبنديکننده پايه Bagging؛ (ب) 10 طبقهبنديکننده پايه RF؛ (ج) Bagging؛ (د) RF. 51شکل 3‑15: (راست) قطعهبندي Top-down؛ (چپ) قطعهبندي Bottom-up. 54شکل 3‑16: مراحل ادغام دو شي تصويري يا پيکسل و تشکيل يک شي تصويري جديد با در نظر گرفتن شرط بهترين برازش دوطرفه بين جفت شي ادغام شونده.. 57شکل 3‑17: نمايي از پلات ROC-LV.. 59شکل 4‑1: نمايي از تصوير ابرطيفي با نمونههاي مرجع.. 65شکل 4‑2: نمايي از داده ليدار مورد مطالعه.. 65شکل 4‑3: روند کل روش پيشنهادي.. 67شکل 4‑4: الگوريتم افزايش تعداد نمونههاي آموزشي با استفاده از احتمالات محاسبه شده با RF. 69شکل 4‑5: اهميت نرمال شده هر يک از باندهاي تصوير ابرطيفي در طبقهبندي.. 70شکل 4‑6: منحني RMS شبکه عصبي براي 500 تکرار مرحله آموزش، (راست) براي NN و (چپ) براي PCA-NN.. 75شکل 4‑7: نمودار ضريب کاپا روشهاي طبقهبندي پيکسل-مبناي مختلف 77شکل 4‑8: نمودار دقت کلي روشهاي طبقهبندي پيکسل-مبناي مختلف 77شکل 4‑9: نمودار ضريب کاپا روشهاي مختلف طبقهبندي ويژگيهاي شي-گرا 79شکل 4‑10: نمودار دقت روشهاي مختلف طبقهبندي ويژگيهاي شي-گرا 79شکل 4‑11: نمودار زمان محاسباتي روشهاي مختلف طبقهبندي ويژگيهاي شي-گرا.. 80شکل 4‑14: نمايي از نتايج طبقهبندي ويژگيهاي شي-گرا پس قطعهبندي در چند مقياس (به ترتيب از بالا به پايين) با روش NN، SVM و RF 85شکل 4‑15: نمايي از نتايج طبقهبندي ويژگيهاي شي-گرا براي قطعهبندي يک سطح با نمونههاي آموزشي اوليه (به ترتيب از بالا به پايين) با روش MLC، NN، SVM و RF. 86شکل 4‑16: نمايي از نتايج طبقهبندي ويژگيهاي شي-گرا براي قطعهبندي يک سطح با نمونههاي آموزشي حاصل از RF (به ترتيب از بالا به پايين) با روش MLC، NN، SVM و RF. 87 فهرست جداولجدول 3‑1: ماتريس ابهام براي 3 کلاس.. 60جدول 4‑1: اطلاعات مربوط به مجموعه دادههای استفاده شده.. 65جدول 4‑2: تعداد نمونههاي آموزشي و مرجع.. 66جدول 4‑3 : قطعهبندی چند مقیاسه و پارامترهای آن.. 71جدول 4‑4: فهرست ويژگيهاي قابل استخراج از اشيا.. 72جدول 4‑5: پارامترهاي مورد نياز براي شروع الگوريتمهاي طبقهبندي 73جدول 4‑6: جدول دقتهاي طبقهبندي پيکسل-مبنا.. 76جدول 4‑7: جدول دقتهاي طبقهبندي شي-مبنا تصوير ابرطيفي و داده ليدار 78جدول 4‑8: برآورد دقت طبقهبندي پيکسل-مبناي ويژگيهاي ليدار و تصوير ابرطيفي.. 81جدول 4‑9: برآورد دقت طبقهبندي پيکسل-مبناي 20 باند انتخاب شده از تصوير ابرطيفي.. 82جدول 4‑10: برآورد دقت طبقهبندي شي-گرا در سطح 124 با نمونههاي آموزشي اوليه.. 83جدول 4‑11: برآورد دقت طبقهبندي شي-گرا در سطح 124 با نمونههاي آموزشي حاصل از RF. 84 فصل اولمقدمهدر زندگي امروزي داشتن اطلاعات بهروز، يک برتري بزرگ به شمار ميآيد که به تصميمگيري درست و زندگي بهتر در جوامع انساني منجر ميشود. يکي از مهمتر ين اطلاعات، نقشههاي بهروز پوشش اراضي است که براي تصميمگيري صحيح و مديريت و برنامهريزي آگاهانه براي مديران (شهري) مورد نياز است.سنجش از دور يک منبع غني براي توليد بسياري از اطلاعات مکاني و محيطي است و يکي از بنياديترين اطلاعاتي که توليد ميکند نقشههاي پوشش اراضي است . اطلاعات پوشش اراضي براي توليد نقشههاي کاربري اراضي، مطالعه تغييرات محيطي و برقراري ارتباط بين عوامل انساني مختلف و متغيرهاي فيزيکي محيط مورد استفاده قرار ميگيرد. براي توليد نقشههاي پوشش اراضي ابتدا بايستي اين اطلاعات از تصاوير ماهوارهاي و دادههاي ديگر استخراج شود. تفسير بصري و الگوريتمهاي يادگيري ماشيني دو روش متداول براي استخراج اطلاعات از تصاوير ماهوارههاي و دادههاي سنجش از دور است، که هر يک داراي مزايا و معايبي ميباشند. در برخي موارد استخراج اطلاعات از تصاوير ماهوارهاي و هوايي توسط عامل انساني نتايج مطلوبتري نسبت به روشهاي خودکار يا نيمه خودکار توليد ميکند. اما در جوامع امروزي توليد اطلاعات توسط عامل انساني و به روشهاي سنتي ديگر پاسخگوي نيازهاي موجود نيست و لازم است روشهاي خودکار و عاري از دخالت انسان توسعه داده شود. در اين راستا پيوسته الگوريتمهاي يادگيري جديدتري توسعه داده ميشود تا اين نياز را برطرف سازد. در زمينه استخراج اطلاعات از تصاوير سنجش از دور به روش سنتي، مسائلي که بايستي مورد توجه واقع شود عبارتاند از: 1- حجم زياد و رشد سريع دادهها و تصاوير در سنجش از دور، 2- زمانبر بودن استخراج اطلاعات توسط انسان و از طرف ديگر 3- پيچيدگي عوارض براي تفسير بصري و استخراج به وسيله چشم ممکن است باعث خطا گردد و در برخي موارد نيز استخراج اطلاعات به اين روش غيرممکن ميشود. راهحل اين مسئله استفاده از الگوريتمهاي يادگيري ماشيني است که هدف نهايي آنها استخراج اطلاعات بدون دخالت انسان است . مهمتر ين کاري که الگوريتمهاي يادگيري ماشيني در سنجش از دور انجام ميدهند طبقهبندي دادهها به کلاسهاي اطلاعاتي است. الگوريتمهاي يادگيري ماشيني متداول در سنجش از دور مثل روشهاي طبقهبندي بيشينه شباهت (MLC[1])، ماشين بردار پشتيبان (SVM[2]) و شبکههاي عصبي مصنوعي (ANN[3]) داراي مشکلاتي مثل 1- نيازمندي به دادههاي آموزشي زياد و بدون خطا، 2- نيازمندي به تعيين بهينه و صحيح پارامترهاي آغازکننده، 3- محاسبات زياد و 4- دقت پايين در استخراج اطلاعات هستند. جنگل تصادفي (RF[4]) يک الگوريتم يادگيري ماشيني جديد است که با ترکيب طبقهبنديکنندههاي درختي نتايج رضايتبخشي را در طبقهبندي توليد ميکند همچنين استفاده از اين روش ميتواند برخي از مشکلات مطرح در الگوريتمهاي قبلي را رفع کند.ارزش اطلاعاتي يک تصوير بيشتر از هزار کلمه است. سنجش از دور تصاويري با اطلاعات گوناگون از محيط را در اختيار ما قرار ميدهد. همان طور که گفته شد ميتوان با طبقهبندي تصاوير به اين اطلاعات دست يافت. در بيشتر موارد در طبقهبندي تصاوير از روشهاي پيکسل-مبنا استفاده ميشود. اين روشها پيکسلهاي تصوير را بر اساس اطلاعات عددي آنها طبقهبندي ميکنند. اما معمولاً عوارضي که در اکثر موارد در يک تصوير به دنبال آن هستيم، تک پيکسلي نيستند بلکه به صورت مجموعهاي از پيکسلها يا يک شي هستند. لذا در اين تحقيق نيز با توجه به اين که هدف طبقهبندي پوشش اراضي است و عوارض نهايي مورد نظر، تک پيکسلي نيستند، ابتدا يک قطعهبندي روي تصوير انجام ميشود تا اشيا تصويري توليد شوند و سپس اين اشيا با توجه به ويژگيهايي که دارند طبقهبندي ميشوند تا کلاسهاي اطلاعاتي پوشش اراضي را ارائه دهند.در اين تحقيق طبقهبندي هم به صورت پيکسل-مبنا و هم به صورت شي-مبنا با چند روش انجام ميشود و نتايج هر يک مورد بحث و بررسي قرار ميگيرد، تا در نهايت روشي مناسب از ميان روشهاي بررسيشده براي طبقهبندي پوشش اراضي شهري با استفاده از تصاوير ابرطيفي ارائه گردد. از آنجا پوشش اراضي شهري پيچيدهتر و مهمتر از پوشش اراضي طبيعي است در اين تحقيق يک تصوير از يک صحنه شهري با عوارض مختلف مورد بررسي قرار گرفته است تا بتوانيم ارزيابي صحيحتري را به طور عملي از روشهاي طبقهبندي مختلف انجام دهيم.
بررسي روش جنگل تصادفي جهت بهبود طبقهبندي پوشش اراضي شهري با استفاده از تصاوير ماهوارهاي WORD
واژگان کليدي: طبقهبندي پوشش اراضي شهري، قطعهبندي تصوير، ويژگيهاي شيگرا، الگوريتم جنگل تصادفي، انتخاب ويژگي، ماشين بردار پشتيبان، شبکههاي عصبي، سنجش از دورفهرست مطالبفصل 1مقدمه.. 21-1 پيشگفتار.. 21-2 ضرورتها، انگيزهها و ويژگيهاي تحقيق.. 41-3 اهداف و سؤالات تحقيق.. 51-4 روش تحقيق.. 61-5 معرفي اختصاري ساير فصول.. 7فصل 2مروري بر تحقيقات پيشين.. 102-1 مقدمه.. 102-2 مروري بر روشهاي طبقهبندي پوشش اراضي.. 102-2-1 فنهای طبقهبندی شیگرا.. 112-2-2 فنهای طبقهبندی نظارتنشده پیکسل-مبنا.. 122-2-3 فنهای طبقهبندی نظارتشده پیکسل-مبنا.. 122-3 مروري بر روشهاي طبقهبندي جديد در سنجش از دور.. 132-3-1 طبقهبندي با شبکههاي عصبي مصنوعي.. 142-3-2 طبقهبندي با درختان تصميم.. 152-3-3 طبقهبندي با روشهاي مبتني بر ماشين بردار پشتيبان.. 152-3-4 فنهاي طبقهبندي دانش-پايه.. 172-3-5 طبقهبندي با الگوريتمهاي ترکيبي.. 182-4 روشهاي انتخاب و کاهش فضاي ويژگي.. 212-5 خلاصه فصل.. 22فصل 3مفاهيم و روشها.. 253-1 مقدمه.. 253-2 مفاهيم پايه.. 253-3 الگوريتمهاي يادگيري متداول.. 273-3-1 آناليز جداسازي خطي.. 273-3-2 درختهاي تصميم.. 283-3-3 شبکههاي عصبي.. 313-3-4 طبقهبنديکننده بيز ساده.. 333-3-5 روشهاي مبتني بر ماشينهاي بردار پشتيبان و کرنل.. 343-4 روشهاي دسته جمعي.. 393-5 تقويت.. 413-6 روش Bagging. 423-6-1 دو الگوي گروهي.. 423-6-2 الگوريتم Bagging. 433-6-3 جنگل تصادفي.. 473-6-4 انتخاب ويژگي با کمک شاخص تعيين اهميت ويژگي RF. 513-7 قطعهبندي تصوير.. 533-7-1 قطعهبندي به روش چند رزولوشنه.. 543-7-2 روش برآورد مقياس مناسب براي قطعهبندي تصوير.. 583-8 برآورد دقت طبقهبندي.. 593-8-1 ماتريس ابهام.. 603-9 خلاصه.. 62فصل 4روش تحقيق و نتايج.. 644-1 مقدمه.. 644-2 دادهها و منطقه مورد مطالعه.. 644-3 روش پيشنهادي تحقيق.. 664-3-1 انتخاب باند با کمک شاخص اهميت ويژگي RF. 694-3-2 قطعهبندي تصوير ابرطيفي.. 704-3-3 گروههاي ويژگي.. 714-3-4 طبقهبندي.. 724-4 ارزيابي.. 744-4-1 نتايج ارزيابي دقت کلي و ضريب کاپا.. 744-4-2 ارزيابي زماني روشهاي طبقهبندي.. 794-4-3 نتايج طبقهبندي به تفکيک کلاسها.. 804-4-4 ارزيابي بصري.. 844-5 جمعبندي مطالب فصل.. 88فصل 5نتيجهگيري و پيشنهادها.. 915-1 مقدمه.. 915-2 خلاصه تحقيق.. 915-3 دستاوردهاي تحقيق.. 925-4 پيشنهادها.. 95منابع 97 فهرست اشکالشکل 1‑1) روند کلي تحقيق.. 7شکل 3‑1: مرز تصميم LDA بر روي يک مجموعه داده three-Gaussians. 27شکل 3‑2: مثالي از درخت تصميم.. 28شکل 3‑3: مرز تصميم يک درخت تصميم بر روي مجموعه داده three-Gaussians. 31شکل 3‑4: شکل (الف) يک نرون و (ب) يک شبکه عصبي.. 32شکل 3‑5: نمايي از SVM خطي دوتايي.. 35شکل 3‑7: تفکيک غير-خطي با استفاده از فن کرنل SVMs (Bekkari et al., 2012) 38شکل 3‑8: معماري يک روش دسته جمعي معمولي.. 39شکل 3‑9: معمولاً مجموعه چند طبقهبنديکننده بهتر از بهترين تک طبقهبنديکننده عمل ميکند (Hansen and Salamon, 1990)... 40شکل 3‑10: الگوريتم Bagging. 44شکل 3‑11: مرزهاي تصميم (شکل بالا چپ) يک تک درخت، (شکل بالا راست) Bagging و (شکل پايين) درختهاي تشکيلدهنده آن بر روي مجموعه داده three-Guassian. 46شکل 3‑12: الگوريتم توليد درخت تصادفي در RF. 48شکل 3‑13: روند کلي الگوريتم جنگل تصادفي (Guo et al., 2011).. 49شکل 3‑14: مرزهاي تصميم بر روي مجموعه داده مصنوعي: (الف) 10 طبقهبنديکننده پايه Bagging؛ (ب) 10 طبقهبنديکننده پايه RF؛ (ج) Bagging؛ (د) RF. 51شکل 3‑15: (راست) قطعهبندي Top-down؛ (چپ) قطعهبندي Bottom-up. 54شکل 3‑16: مراحل ادغام دو شي تصويري يا پيکسل و تشکيل يک شي تصويري جديد با در نظر گرفتن شرط بهترين برازش دوطرفه بين جفت شي ادغام شونده.. 57شکل 3‑17: نمايي از پلات ROC-LV.. 59شکل 4‑1: نمايي از تصوير ابرطيفي با نمونههاي مرجع.. 65شکل 4‑2: نمايي از داده ليدار مورد مطالعه.. 65شکل 4‑3: روند کل روش پيشنهادي.. 67شکل 4‑4: الگوريتم افزايش تعداد نمونههاي آموزشي با استفاده از احتمالات محاسبه شده با RF. 69شکل 4‑5: اهميت نرمال شده هر يک از باندهاي تصوير ابرطيفي در طبقهبندي.. 70شکل 4‑6: منحني RMS شبکه عصبي براي 500 تکرار مرحله آموزش، (راست) براي NN و (چپ) براي PCA-NN.. 75شکل 4‑7: نمودار ضريب کاپا روشهاي طبقهبندي پيکسل-مبناي مختلف 77شکل 4‑8: نمودار دقت کلي روشهاي طبقهبندي پيکسل-مبناي مختلف 77شکل 4‑9: نمودار ضريب کاپا روشهاي مختلف طبقهبندي ويژگيهاي شي-گرا 79شکل 4‑10: نمودار دقت روشهاي مختلف طبقهبندي ويژگيهاي شي-گرا 79شکل 4‑11: نمودار زمان محاسباتي روشهاي مختلف طبقهبندي ويژگيهاي شي-گرا.. 80شکل 4‑14: نمايي از نتايج طبقهبندي ويژگيهاي شي-گرا پس قطعهبندي در چند مقياس (به ترتيب از بالا به پايين) با روش NN، SVM و RF 85شکل 4‑15: نمايي از نتايج طبقهبندي ويژگيهاي شي-گرا براي قطعهبندي يک سطح با نمونههاي آموزشي اوليه (به ترتيب از بالا به پايين) با روش MLC، NN، SVM و RF. 86شکل 4‑16: نمايي از نتايج طبقهبندي ويژگيهاي شي-گرا براي قطعهبندي يک سطح با نمونههاي آموزشي حاصل از RF (به ترتيب از بالا به پايين) با روش MLC، NN، SVM و RF. 87 فهرست جداولجدول 3‑1: ماتريس ابهام براي 3 کلاس.. 60جدول 4‑1: اطلاعات مربوط به مجموعه دادههای استفاده شده.. 65جدول 4‑2: تعداد نمونههاي آموزشي و مرجع.. 66جدول 4‑3 : قطعهبندی چند مقیاسه و پارامترهای آن.. 71جدول 4‑4: فهرست ويژگيهاي قابل استخراج از اشيا.. 72جدول 4‑5: پارامترهاي مورد نياز براي شروع الگوريتمهاي طبقهبندي 73جدول 4‑6: جدول دقتهاي طبقهبندي پيکسل-مبنا.. 76جدول 4‑7: جدول دقتهاي طبقهبندي شي-مبنا تصوير ابرطيفي و داده ليدار 78جدول 4‑8: برآورد دقت طبقهبندي پيکسل-مبناي ويژگيهاي ليدار و تصوير ابرطيفي.. 81جدول 4‑9: برآورد دقت طبقهبندي پيکسل-مبناي 20 باند انتخاب شده از تصوير ابرطيفي.. 82جدول 4‑10: برآورد دقت طبقهبندي شي-گرا در سطح 124 با نمونههاي آموزشي اوليه.. 83جدول 4‑11: برآورد دقت طبقهبندي شي-گرا در سطح 124 با نمونههاي آموزشي حاصل از RF. 84 فصل اولمقدمهدر زندگي امروزي داشتن اطلاعات بهروز، يک برتري بزرگ به شمار ميآيد که به تصميمگيري درست و زندگي بهتر در جوامع انساني منجر ميشود. يکي از مهمتر ين اطلاعات، نقشههاي بهروز پوشش اراضي است که براي تصميمگيري صحيح و مديريت و برنامهريزي آگاهانه براي مديران (شهري) مورد نياز است.سنجش از دور يک منبع غني براي توليد بسياري از اطلاعات مکاني و محيطي است و يکي از بنياديترين اطلاعاتي که توليد ميکند نقشههاي پوشش اراضي است . اطلاعات پوشش اراضي براي توليد نقشههاي کاربري اراضي، مطالعه تغييرات محيطي و برقراري ارتباط بين عوامل انساني مختلف و متغيرهاي فيزيکي محيط مورد استفاده قرار ميگيرد. براي توليد نقشههاي پوشش اراضي ابتدا بايستي اين اطلاعات از تصاوير ماهوارهاي و دادههاي ديگر استخراج شود. تفسير بصري و الگوريتمهاي يادگيري ماشيني دو روش متداول براي استخراج اطلاعات از تصاوير ماهوارههاي و دادههاي سنجش از دور است، که هر يک داراي مزايا و معايبي ميباشند. در برخي موارد استخراج اطلاعات از تصاوير ماهوارهاي و هوايي توسط عامل انساني نتايج مطلوبتري نسبت به روشهاي خودکار يا نيمه خودکار توليد ميکند. اما در جوامع امروزي توليد اطلاعات توسط عامل انساني و به روشهاي سنتي ديگر پاسخگوي نيازهاي موجود نيست و لازم است روشهاي خودکار و عاري از دخالت انسان توسعه داده شود. در اين راستا پيوسته الگوريتمهاي يادگيري جديدتري توسعه داده ميشود تا اين نياز را برطرف سازد. در زمينه استخراج اطلاعات از تصاوير سنجش از دور به روش سنتي، مسائلي که بايستي مورد توجه واقع شود عبارتاند از: 1- حجم زياد و رشد سريع دادهها و تصاوير در سنجش از دور، 2- زمانبر بودن استخراج اطلاعات توسط انسان و از طرف ديگر 3- پيچيدگي عوارض براي تفسير بصري و استخراج به وسيله چشم ممکن است باعث خطا گردد و در برخي موارد نيز استخراج اطلاعات به اين روش غيرممکن ميشود. راهحل اين مسئله استفاده از الگوريتمهاي يادگيري ماشيني است که هدف نهايي آنها استخراج اطلاعات بدون دخالت انسان است . مهمتر ين کاري که الگوريتمهاي يادگيري ماشيني در سنجش از دور انجام ميدهند طبقهبندي دادهها به کلاسهاي اطلاعاتي است. الگوريتمهاي يادگيري ماشيني متداول در سنجش از دور مثل روشهاي طبقهبندي بيشينه شباهت (MLC[1])، ماشين بردار پشتيبان (SVM[2]) و شبکههاي عصبي مصنوعي (ANN[3]) داراي مشکلاتي مثل 1- نيازمندي به دادههاي آموزشي زياد و بدون خطا، 2- نيازمندي به تعيين بهينه و صحيح پارامترهاي آغازکننده، 3- محاسبات زياد و 4- دقت پايين در استخراج اطلاعات هستند. جنگل تصادفي (RF[4]) يک الگوريتم يادگيري ماشيني جديد است که با ترکيب طبقهبنديکنندههاي درختي نتايج رضايتبخشي را در طبقهبندي توليد ميکند همچنين استفاده از اين روش ميتواند برخي از مشکلات مطرح در الگوريتمهاي قبلي را رفع کند.ارزش اطلاعاتي يک تصوير بيشتر از هزار کلمه است. سنجش از دور تصاويري با اطلاعات گوناگون از محيط را در اختيار ما قرار ميدهد. همان طور که گفته شد ميتوان با طبقهبندي تصاوير به اين اطلاعات دست يافت. در بيشتر موارد در طبقهبندي تصاوير از روشهاي پيکسل-مبنا استفاده ميشود. اين روشها پيکسلهاي تصوير را بر اساس اطلاعات عددي آنها طبقهبندي ميکنند. اما معمولاً عوارضي که در اکثر موارد در يک تصوير به دنبال آن هستيم، تک پيکسلي نيستند بلکه به صورت مجموعهاي از پيکسلها يا يک شي هستند. لذا در اين تحقيق نيز با توجه به اين که هدف طبقهبندي پوشش اراضي است و عوارض نهايي مورد نظر، تک پيکسلي نيستند، ابتدا يک قطعهبندي روي تصوير انجام ميشود تا اشيا تصويري توليد شوند و سپس اين اشيا با توجه به ويژگيهايي که دارند طبقهبندي ميشوند تا کلاسهاي اطلاعاتي پوشش اراضي را ارائه دهند.در اين تحقيق طبقهبندي هم به صورت پيکسل-مبنا و هم به صورت شي-مبنا با چند روش انجام ميشود و نتايج هر يک مورد بحث و بررسي قرار ميگيرد، تا در نهايت روشي مناسب از ميان روشهاي بررسيشده براي طبقهبندي پوشش اراضي شهري با استفاده از تصاوير ابرطيفي ارائه گردد. از آنجا پوشش اراضي شهري پيچيدهتر و مهمتر از پوشش اراضي طبيعي است در اين تحقيق يک تصوير از يک صحنه شهري با عوارض مختلف مورد بررسي قرار گرفته است تا بتوانيم ارزيابي صحيحتري را به طور عملي از روشهاي طبقهبندي مختلف انجام دهيم.