فهرست مطالب1-مقدمه....... 21-1-تعاریف اولیه در رباتیک...... 31-2-چالش های ناوبری خودمختار..... 31-3-روش های حل مساله ی ناوبری ربات...... 41-4-اهداف و نتایج........... 61-5-ساختار پایان نامه...... 92-بررسی روشهای پیشین...... 112-1-مقدمه...... 112-2-معماری سلسله مراتبی....... 112-2-1-روش گراف دیداری....... 122-2-2-روش تجزیه سلولی.... 132-2-3-روش میدان پتانسیل.... 132-3-معماري مبتني بر رفتار........ 142-4-روش ترکیبی....... 172-5-مطالعات مرتبط........ 182-6-نتیجه گیری........ 213- منطق فازی، یادگیری Q و بهینه سازی کلونی زنبور مصنوعی.. 243-1-مقدمه ............................................................................................................................................243-2-منطق فازی.................................................................................. 243-3-یادگیری Q................................................................................. 273-4-بهینه سازی کلونی زنبور مصنوعی........................................ 283-4-1-زنبور ها در طبیعت ......................................... 293-4-2-الگوریتم بهینه سازی کلونی زنبورهای مصنوعی.......... 303-4-3-فاز جمعیت اولیه............................................... 323-4-4-انتخاب جمعیت اولیه......................................... 323-4-5-فاز رنبورهای به کار گرفته شده............ 323-4-6-فاز زنبورهای تماشاگر.................................. 323-4-7-فاز زنبورهای دیده بان................................ 334-الگوریتم یادگیری Q فازی پیشنهادی................................ 354-1-مقدمه........................................................................................... 354-2-ربات کپرا.................................................................................... 354-3-یادگیری Q فازی......................................................................... 384-4-بهینه سازی.................................................................................. 435-نتایج شبیه سازی ها و پیشنهادهای ادامه کار......... 485-1-مقدمه............................................................................................ 485-2- نرم افزار شبیه سازی KiKS................................................... 485-3-محیط های شبیه سازی................................................................ 515-4-نتایج شبیه سازی....................................................................... 535-4-1-موفقيت در رسيدن به هدف (GR)..................... 535-4-2-امنيت مسير طي شده تا هدف (SF)............... 535-4-3-سرعت مسير طي شده تا هدف (SP)................. 535-5-بحث و نتيجه گيري..................................................................... 655-6-پيشنهادهاي ادامه كار.............................................................. 66مراجع....................................................................................................................................................................................................67چکیده لاتین...........................................................................................................................................................................................70 فهرست شکل هاشکل(2‑1): معماری سلسله مراتبی جهت ناوبری ربات........... 12شکل(2‑2): معماری مبتنی بر رفتار جهت ناوبری ربات......... 15شکل(2‑3): معماری ردهبندی جهت ناوبری ربات............... 15شکل(2‑4): معماری الگوهای حرکتی جهت ناوبری ربات.......... 16شکل(2‑5): معماری ترکیبی جهت ناوبری ربات................. 18شکل(3‑1): توابع عضویت فازی متغیرهای ورودی............... 25شکل(3‑2): روش فازی زدایی متوسط مقدار بیشینه............ 26شکل(4-1): ربات کپرا.................................... 35شکل(4‑2):میزان دریافت نور بازتاب شده از موانع مختلف توسط گیرندههای مادونقرمز ربات کپرا................................. 36شکل(4-3): توابع عضویت فازی ورودی ....................... 38شکل(4-4): نمایش راستای محاسبه زاویه چرخش در دستگاه کارتزین39شکل(4-5): الگوریتم یادگیری Q فازی...................... 40شکل(4-6): فلوچارت الگوریتم یادگیری Q فازی پیشنهادي..... 41شکل(4-8): محیط در نظر گرفته شده جهت فرآیند بهینه سازی.. 44شکل(4-9): نمودار بهینه سازی تابع هدف بر حسب تعداد تکرارها45شکل(4-10): فلوچارت الگوریتم بهینه سازی.................. 46شکل(5-1): پنجره آماده سازیKiKS......................... 49شکل(5-2): نمونه شکل های موانع.......................... 52شکل(5-3): عملکرد الگوریتم یادگیری Q فازی در محیط ساده.. 56شکل(5-4): عملکرد الگوریتم فازی در محیط ساده............ 56شکل(5-5): عملکرد الگوریتم یادگیری Q فازی در محیط ساده.. 57شکل(5-6): عملکرد الگوریتم فازی در محیط ساده............ 57شکل(5-7): عملکرد الگوریتم یادگیری Q فازی در محیط ساده.. 58شکل(5-8): عملکرد الگوریتم فازی در محیط ساده............ 58شکل(5-9): عملکرد الگوریتم یادگیری Q فازی در محیط معمولی59شکل(5-10): عملکرد الگوریتم فازی در محیط معمولی......... 59شکل(5-11): عملکرد الگوریتم یادگیری Q فازی در محیط معمولی59شکل(5-12): عملکرد الگوریتم فازی در محیط معمولی.......... 59شکل(5-13): عملکرد الگوریتم یادگیری Q فازی در محیط معمولی60شکل(5-14): عملکرد الگوریتم فازی در محیط معمولی......... 61شکل(5-15): عملکرد الگوریتم یادگیری Q فازی در محیط پیچیده62شکل(5-16): عملکرد الگوریتم فازی در محیط پیچیده.......... 62شکل(5-17): عملکرد الگوریتم یادگیری Q فازی در محیط پیچیده63شکل(5-18): عملکرد الگوریتم فازی در محیط پیچیده......... 63شکل(5-19): عملکرد الگوریتم یادگیری Q فازی در محیط پیچیده64شکل(5-20): عملکرد الگوریتم فازی در محیط پیچیده......... 64 فهرست جدول هاجدول(2‑1): مقایسه خصوصیات معماری های مختلف.............. 22جدول(2‑2): تعریف معیارهای ارزیابی معماری های مختلف...... 22جدول(4‑1): محدوده صفات زبانی زاویه چرخش................. 39جدول(4‑2): مقادیر سیگنال تشدیدی در حالتهای مختلف........ 42جدول(4-3): پارامترهای الگوریتم بهینه سازی............... 44جدول(4-4): مقادیر پارامترهای بهینه شده و تابع هدف....... 45جدول(5‑1): توصیف کمی درجه پیچیدگی محیط ها............... 53جدول(5-2): عملکرد الگوریتم یادگیری Q فازی پیشنهادی..... 54جدول(5-3): عملکرد الگوریتم فازی......................... 55 فهرست علایم و اختصاراتFQL................................................................................................................. Fuzzy Q-learningDFQL............................................................................................... Dynamic Fuzzy Q-learningABC.................................................................................... Artificial Bee Colony OptimizationKiKS............................................................................................. KiKS is a Khepera Simulatorربات خودمختار[1] به سامانهی فیزیکیای اطلاق میشود که بتواند به طور هدفمند، بدون دانش پیشین از محیط و بدون دخالت انسان در دنیای واقعی، که مخصوصا برای ربات مهندسی نشده، حرکت کند و وظایف مشخصی را انجام دهد[1]. به عنوان مثال، مطلوب مساله ناوبری[2] ربات، که در این پژوهش مطرح است، حرکت ربات به سمت هدفی مشخص بدون برخورد با موانع موجود میباشد.اينموانعميتوانندموانعثابتمثلديوار،ميز،صندليوياموانعمتحركمثلانسانها و ...باشند. جهتعملکردبهترلازماسترباتمحيطراحسنمايدوقادربهبرنامهريزيعملياتخودباشد.پيچيدگيوتنوعمحيطهاييكهرباتبايددرآنها كاركند،همچنین محدوديتهايزيادحركتي (مانند حداکثر سرعت ممکن ربات)ومحيطي (مانند وجود موانع)كهرباتمجبوربهرعايتآنهاميباشد،مسالهناوبریرباترا بهيكمسالهمشكلتبديلكردهاست.رباتهای خودمختار بایستی قادر به سازگاری با عدم قطعیتهای بسیار موجود در محیط باشند، زیرا محیطهای فیزیکی معمولاً پویا و غیر قابل پیشبینی هستند. اغلب موانع ایستا نیستند و داده های حسگرها به علت نویز، غیردقیق و غیر قابل اطمینان هستند.حركترباتها،معمولاًبراساس معیارهایكاراييعملكردومحدوديتهايذاتيآنهابهينهمیشود.معیارهای كارايي متداول،غالباً کمینهسازی تعداد برخوردبا موانعو زمان رسیدن به هدف میباشند و از آن سو محدودیت، لحاظ نمودن حداکثر سرعت ربات است.ماشینهای هوشمندی که بتوانند وظایف خسته کننده، تکراری و خطرناک را انجام دهند، جایگزین تواناتر و قدرتمندتر و قابل اطمینان تری نسبت به نیروهای انسانی میباشند. رباتیک امروزی از زمینهای ساخت یافتهی کارخانهها به محیطهای انسانی غیرقابل پیشبینی حرکت کرده است. رباتهای امروزی میبایست در محیطهای ساختنیافته و پویا فعالیت کنند. رباتها به طور گسترده در منازل، ادارهها، بیمارستانها، امدادرسانی در نواحی خطرناک یا غیرقابل دسترس، یاریرسانی به افراد معلول، تولید و مونتاژ و بستهبندی، حمل و نقل، اکتشافات زمینی و فضایی، جنگ افزارها و تحقیقات آزمایشگاهی به کار میروند. 1-1- تعاریف اولیه در رباتیکیک تعریف ساده از ربات میتواند این باشد: مکانیزمی که قادر به حس و درک محیط پیرامون و حرکت و واکنش باشد. در تعریفی دقیقتر و جزییتر میتوان ربات را مجموعهای از زیر سامانههای ادوات حسگری، واحد تصمیمگیری، کنترلکننده، محرکها، بازوهای مکانیکی و منابع تغذیه دانست [2]. براي ناوبریرباتهايمتحركممكناستازحسگرهايمختلفاستفادهشودکهلزوماًازيكنوعنيستند.بعضيازحسگرهااطلاعاتيكديگرراتكمیلوبرخیديگر،اطلاعاتيكديگرراتصحيحمينمایند. ربات از حسگرهای با محرک خارجی مانند دوربین، حسگر فراصوت یا مادونقرمز برای مشاهدهی حالت محیط استفاده میکند؛ و از حسگرهایی با محرک داخلی مانند قطبنما یا رمزگذارمحور[3] (بر روی چرخها) برای مشاهدهی موقعیت، سرعت و شتاب پیوندها و مفاصل مختلف خود بهره میگیرد. اطلاعات به دست آمده از حسگرها به منظور ترکیب و تفسیر به واحد تصمیمگیری ارسال میشوند، که مغز ربات تلقی میشود و مهمترین نقش را در برنامهریزیهای ربات ایفا میکند. پس از تحلیل دادههای حسگرها و اخذ تصمیم، فرمان مناسب به کنترلکننده ارسال میشود. وظیفهی کنترلکننده تولید سیگنالهای لازم جهت درایو محرکها میباشد. محرکها، سیگنالهای دریافتی از کنترلکننده را به حرکت تبدیل مینمایند. بازوهای مکانیکی مانند بازوهای رباتیک یا محور چرخها مجموعهای از پیوندها هستند که توسط مفاصل به هم متصل شدهاند و توانایی تاثیرگذاری در محیط را دارند (حرکت دادن یا گرفتن اجسام). منابع تغذیه سامانههای قدرتی میباشند که برای تولید و تنظیم انرژی مورد نیاز محرکها و درایورها به کار میروند.
هدایت فازی ربات های خود مختار با استفاده از یادگیری تشدیدی و بهینه سازی کلونی زنبور مصنوعی word
فهرست مطالب1-مقدمه....... 21-1-تعاریف اولیه در رباتیک...... 31-2-چالش های ناوبری خودمختار..... 31-3-روش های حل مساله ی ناوبری ربات...... 41-4-اهداف و نتایج........... 61-5-ساختار پایان نامه...... 92-بررسی روشهای پیشین...... 112-1-مقدمه...... 112-2-معماری سلسله مراتبی....... 112-2-1-روش گراف دیداری....... 122-2-2-روش تجزیه سلولی.... 132-2-3-روش میدان پتانسیل.... 132-3-معماري مبتني بر رفتار........ 142-4-روش ترکیبی....... 172-5-مطالعات مرتبط........ 182-6-نتیجه گیری........ 213- منطق فازی، یادگیری Q و بهینه سازی کلونی زنبور مصنوعی.. 243-1-مقدمه ............................................................................................................................................243-2-منطق فازی.................................................................................. 243-3-یادگیری Q................................................................................. 273-4-بهینه سازی کلونی زنبور مصنوعی........................................ 283-4-1-زنبور ها در طبیعت ......................................... 293-4-2-الگوریتم بهینه سازی کلونی زنبورهای مصنوعی.......... 303-4-3-فاز جمعیت اولیه............................................... 323-4-4-انتخاب جمعیت اولیه......................................... 323-4-5-فاز رنبورهای به کار گرفته شده............ 323-4-6-فاز زنبورهای تماشاگر.................................. 323-4-7-فاز زنبورهای دیده بان................................ 334-الگوریتم یادگیری Q فازی پیشنهادی................................ 354-1-مقدمه........................................................................................... 354-2-ربات کپرا.................................................................................... 354-3-یادگیری Q فازی......................................................................... 384-4-بهینه سازی.................................................................................. 435-نتایج شبیه سازی ها و پیشنهادهای ادامه کار......... 485-1-مقدمه............................................................................................ 485-2- نرم افزار شبیه سازی KiKS................................................... 485-3-محیط های شبیه سازی................................................................ 515-4-نتایج شبیه سازی....................................................................... 535-4-1-موفقيت در رسيدن به هدف (GR)..................... 535-4-2-امنيت مسير طي شده تا هدف (SF)............... 535-4-3-سرعت مسير طي شده تا هدف (SP)................. 535-5-بحث و نتيجه گيري..................................................................... 655-6-پيشنهادهاي ادامه كار.............................................................. 66مراجع....................................................................................................................................................................................................67چکیده لاتین...........................................................................................................................................................................................70 فهرست شکل هاشکل(2‑1): معماری سلسله مراتبی جهت ناوبری ربات........... 12شکل(2‑2): معماری مبتنی بر رفتار جهت ناوبری ربات......... 15شکل(2‑3): معماری ردهبندی جهت ناوبری ربات............... 15شکل(2‑4): معماری الگوهای حرکتی جهت ناوبری ربات.......... 16شکل(2‑5): معماری ترکیبی جهت ناوبری ربات................. 18شکل(3‑1): توابع عضویت فازی متغیرهای ورودی............... 25شکل(3‑2): روش فازی زدایی متوسط مقدار بیشینه............ 26شکل(4-1): ربات کپرا.................................... 35شکل(4‑2):میزان دریافت نور بازتاب شده از موانع مختلف توسط گیرندههای مادونقرمز ربات کپرا................................. 36شکل(4-3): توابع عضویت فازی ورودی ....................... 38شکل(4-4): نمایش راستای محاسبه زاویه چرخش در دستگاه کارتزین39شکل(4-5): الگوریتم یادگیری Q فازی...................... 40شکل(4-6): فلوچارت الگوریتم یادگیری Q فازی پیشنهادي..... 41شکل(4-8): محیط در نظر گرفته شده جهت فرآیند بهینه سازی.. 44شکل(4-9): نمودار بهینه سازی تابع هدف بر حسب تعداد تکرارها45شکل(4-10): فلوچارت الگوریتم بهینه سازی.................. 46شکل(5-1): پنجره آماده سازیKiKS......................... 49شکل(5-2): نمونه شکل های موانع.......................... 52شکل(5-3): عملکرد الگوریتم یادگیری Q فازی در محیط ساده.. 56شکل(5-4): عملکرد الگوریتم فازی در محیط ساده............ 56شکل(5-5): عملکرد الگوریتم یادگیری Q فازی در محیط ساده.. 57شکل(5-6): عملکرد الگوریتم فازی در محیط ساده............ 57شکل(5-7): عملکرد الگوریتم یادگیری Q فازی در محیط ساده.. 58شکل(5-8): عملکرد الگوریتم فازی در محیط ساده............ 58شکل(5-9): عملکرد الگوریتم یادگیری Q فازی در محیط معمولی59شکل(5-10): عملکرد الگوریتم فازی در محیط معمولی......... 59شکل(5-11): عملکرد الگوریتم یادگیری Q فازی در محیط معمولی59شکل(5-12): عملکرد الگوریتم فازی در محیط معمولی.......... 59شکل(5-13): عملکرد الگوریتم یادگیری Q فازی در محیط معمولی60شکل(5-14): عملکرد الگوریتم فازی در محیط معمولی......... 61شکل(5-15): عملکرد الگوریتم یادگیری Q فازی در محیط پیچیده62شکل(5-16): عملکرد الگوریتم فازی در محیط پیچیده.......... 62شکل(5-17): عملکرد الگوریتم یادگیری Q فازی در محیط پیچیده63شکل(5-18): عملکرد الگوریتم فازی در محیط پیچیده......... 63شکل(5-19): عملکرد الگوریتم یادگیری Q فازی در محیط پیچیده64شکل(5-20): عملکرد الگوریتم فازی در محیط پیچیده......... 64 فهرست جدول هاجدول(2‑1): مقایسه خصوصیات معماری های مختلف.............. 22جدول(2‑2): تعریف معیارهای ارزیابی معماری های مختلف...... 22جدول(4‑1): محدوده صفات زبانی زاویه چرخش................. 39جدول(4‑2): مقادیر سیگنال تشدیدی در حالتهای مختلف........ 42جدول(4-3): پارامترهای الگوریتم بهینه سازی............... 44جدول(4-4): مقادیر پارامترهای بهینه شده و تابع هدف....... 45جدول(5‑1): توصیف کمی درجه پیچیدگی محیط ها............... 53جدول(5-2): عملکرد الگوریتم یادگیری Q فازی پیشنهادی..... 54جدول(5-3): عملکرد الگوریتم فازی......................... 55 فهرست علایم و اختصاراتFQL................................................................................................................. Fuzzy Q-learningDFQL............................................................................................... Dynamic Fuzzy Q-learningABC.................................................................................... Artificial Bee Colony OptimizationKiKS............................................................................................. KiKS is a Khepera Simulatorربات خودمختار[1] به سامانهی فیزیکیای اطلاق میشود که بتواند به طور هدفمند، بدون دانش پیشین از محیط و بدون دخالت انسان در دنیای واقعی، که مخصوصا برای ربات مهندسی نشده، حرکت کند و وظایف مشخصی را انجام دهد[1]. به عنوان مثال، مطلوب مساله ناوبری[2] ربات، که در این پژوهش مطرح است، حرکت ربات به سمت هدفی مشخص بدون برخورد با موانع موجود میباشد.اينموانعميتوانندموانعثابتمثلديوار،ميز،صندليوياموانعمتحركمثلانسانها و ...باشند. جهتعملکردبهترلازماسترباتمحيطراحسنمايدوقادربهبرنامهريزيعملياتخودباشد.پيچيدگيوتنوعمحيطهاييكهرباتبايددرآنها كاركند،همچنین محدوديتهايزيادحركتي (مانند حداکثر سرعت ممکن ربات)ومحيطي (مانند وجود موانع)كهرباتمجبوربهرعايتآنهاميباشد،مسالهناوبریرباترا بهيكمسالهمشكلتبديلكردهاست.رباتهای خودمختار بایستی قادر به سازگاری با عدم قطعیتهای بسیار موجود در محیط باشند، زیرا محیطهای فیزیکی معمولاً پویا و غیر قابل پیشبینی هستند. اغلب موانع ایستا نیستند و داده های حسگرها به علت نویز، غیردقیق و غیر قابل اطمینان هستند.حركترباتها،معمولاًبراساس معیارهایكاراييعملكردومحدوديتهايذاتيآنهابهينهمیشود.معیارهای كارايي متداول،غالباً کمینهسازی تعداد برخوردبا موانعو زمان رسیدن به هدف میباشند و از آن سو محدودیت، لحاظ نمودن حداکثر سرعت ربات است.ماشینهای هوشمندی که بتوانند وظایف خسته کننده، تکراری و خطرناک را انجام دهند، جایگزین تواناتر و قدرتمندتر و قابل اطمینان تری نسبت به نیروهای انسانی میباشند. رباتیک امروزی از زمینهای ساخت یافتهی کارخانهها به محیطهای انسانی غیرقابل پیشبینی حرکت کرده است. رباتهای امروزی میبایست در محیطهای ساختنیافته و پویا فعالیت کنند. رباتها به طور گسترده در منازل، ادارهها، بیمارستانها، امدادرسانی در نواحی خطرناک یا غیرقابل دسترس، یاریرسانی به افراد معلول، تولید و مونتاژ و بستهبندی، حمل و نقل، اکتشافات زمینی و فضایی، جنگ افزارها و تحقیقات آزمایشگاهی به کار میروند. 1-1- تعاریف اولیه در رباتیکیک تعریف ساده از ربات میتواند این باشد: مکانیزمی که قادر به حس و درک محیط پیرامون و حرکت و واکنش باشد. در تعریفی دقیقتر و جزییتر میتوان ربات را مجموعهای از زیر سامانههای ادوات حسگری، واحد تصمیمگیری، کنترلکننده، محرکها، بازوهای مکانیکی و منابع تغذیه دانست [2]. براي ناوبریرباتهايمتحركممكناستازحسگرهايمختلفاستفادهشودکهلزوماًازيكنوعنيستند.بعضيازحسگرهااطلاعاتيكديگرراتكمیلوبرخیديگر،اطلاعاتيكديگرراتصحيحمينمایند. ربات از حسگرهای با محرک خارجی مانند دوربین، حسگر فراصوت یا مادونقرمز برای مشاهدهی حالت محیط استفاده میکند؛ و از حسگرهایی با محرک داخلی مانند قطبنما یا رمزگذارمحور[3] (بر روی چرخها) برای مشاهدهی موقعیت، سرعت و شتاب پیوندها و مفاصل مختلف خود بهره میگیرد. اطلاعات به دست آمده از حسگرها به منظور ترکیب و تفسیر به واحد تصمیمگیری ارسال میشوند، که مغز ربات تلقی میشود و مهمترین نقش را در برنامهریزیهای ربات ایفا میکند. پس از تحلیل دادههای حسگرها و اخذ تصمیم، فرمان مناسب به کنترلکننده ارسال میشود. وظیفهی کنترلکننده تولید سیگنالهای لازم جهت درایو محرکها میباشد. محرکها، سیگنالهای دریافتی از کنترلکننده را به حرکت تبدیل مینمایند. بازوهای مکانیکی مانند بازوهای رباتیک یا محور چرخها مجموعهای از پیوندها هستند که توسط مفاصل به هم متصل شدهاند و توانایی تاثیرگذاری در محیط را دارند (حرکت دادن یا گرفتن اجسام). منابع تغذیه سامانههای قدرتی میباشند که برای تولید و تنظیم انرژی مورد نیاز محرکها و درایورها به کار میروند.