فهرست مطالبتقدیر و تشکرچکیدهفهرست شکل هاسفهرست جدول هاصفصلاول:1مقـــــدمه11-1 پیشگفتار. 11-2 بهسازی گفتار نویزی:اهداف،کاربردها،مفاهیم21-3 تعریف مسئله و تقسیم بندی روش ها31-4 نوآوری تحقیق. 41-5 ساختار پایانامه. 4فصل دوم5پیش زمینه های پردازش سیگنال گفتار52-1 نحوه توليد گفتار در انسان. 52-2 معرفی نويز و انواع آن. 102-2-1 نويز سفيد132-2-2 نويز صورتي. 132-2-3 نويز قهوهاي.. 142-2-4 نويز صنعتي. 142-3 تحلیل زمان- فرکانسی سیگنال گفتار. 152-3-1 تبدیل فوریه. 152-3-2 تبديل فوريه زمان-كوتاه172-3-3 آناليز چند دقت زمان فرکانسی. 202-3-4 تبديلموجکيكبعدي.. 202-3-4-1 تبديل موجک پيوسته202-3-4-1-1 دقت های زمانی و فركانسی. 222-3-4-1-2 روابط رياضي تبديل موجک:222-3-4-1-3 عكس تبديل موجک:242-3-4-2 تبدیل موجک گسسته242-4 الگوریتم بهینه سازی ژنتیک... 282-4-1 درباره علم ژنتیک... 282-4-2 تاریخچۀ علم ژنتیک... 292-4-3 تکامل طبیعی (قانون انتخاب طبیعی داروین)و رابطه آن با روش های هوش مصنوعی. 292-4-4 الگوریتم ژنتیک... 322-4-5 مكانيزم الگوريتم ژنتيك.. 342-4-6 عملگرههاي الگوريتم ژنتيك.. 372-4-6-1 کدگذاری. 372-4-6-2 ارزیابی. 372-4-6-3 ترکیب.. 372-4-6-4 جهش.. 372-4-6-5 رمزگشايي. 382-4-7 چارت الگوريتم به همراه شبه كد آن. 382-4-7-1 شبه كد و توضيح آن. 382-4-7-2 چارت الگوریتم ژنتیک... 402-4-8 تابع هدف.. 412-4-9 روشهای کد کردن. 412-4-9-1 کدینگ باینری. 422-4-9-2 کدینگ جایگشتی. 422-4-9-3 کد گذاری مقدار. 432-4-9-4 کدینگ درخت.. 442-4-10 نمایش رشتهها452-4-11 جمعيت.. 462-4-11-1 ايجادجمعيت اوليه462-4-11-2 اندازه جمعيت.. 462-4-12 محاسبه برازندگي (تابع ارزش)472-4-13 انواع روشهای انتخاب.. 482-4-13-1 انتخاب چرخ رولت.. 492-4-13-2 انتخاب حالت پایدار. 512-4-13-3 انتخاب نخبه گرایی. 512-4-13-4 انتخاب رقابتی. 512-4-13-5 انتخاب قطع سر. 522-4-13-6 انتخاب قطعی بریندل. 522-4-13-7 انتخاب جایگزینی نسلی اصلاح شده532-4-13-8 انتخاب مسابقه532-4-13-9 انتخاب مسابقه تصادفی. 532-4-14 انواع روشهای ترکیب.. 532-4-14-1 جابهجایی دودوئی. 542-4-14-2 جابهجایي حقيقي. 562-4-14-3 ترکیب تکنقطهای. 572-4-14-4 ترکیب دو نقطهای. 582-4-14-5 ترکیب n نقطهای. 582-4-14-6 ترکیب یکنواخت.. 582-4-14-7 ترکیب حسابی. 592-4-14-8 ترتیب.. 592-4-14-9 چرخه602-4-15 احتمال تركيب.. 602-4-16 تحليل مكانيزم جابجایي. 612-4-17 جهش.. 612-4-17-1 جهش باينري. 632-4-17-2 جهش حقيقي. 642-4-17-3 وارونه سازی بیت.. 642-4-17-4 تغییر ترتیب قرارگیری. 642-4-17-5 وارون سازی. 642-4-17-6 تغییر مقدار. 652-4-18 محک اختتام اجرای الگوریتم ژنتیک... 652-4-19 نقاط قوّت الگوریتمهای ژنتیک... 662-4-20 محدودیتهای GAها682-5 آنالیز ضرایب پیشگویی خطی (LPC)692-5-1 محاسبه ضرایب LPC. 70فصل سوم73مروری برروش های عمده بهسازی گفتار733-1 مقدمه. 733-2 روش تفریق طیفی. 743-3 روش فیلتر وینر. 763-4 بهسازی گفتار با استفاده از مدل های آماری.. 783-4-1 تخمین زننده لگاریتمی بر مبنایكمينه كردنخطايميانگينمربعات(Log MMSE)783-4-2 استفاده از مدل مخفی مارکف(HMM) برای بهسازی گفتار. 803-5 روش زیر فضای سیگنال. 823-6 بهسازی گفتار با استفاده از تبدیل موجک... 833-7 مقایسه روش ها و بررسی نقاط قوت و ضعف.. 853-7-1 بررسی های مقایسه ای انجام شده بین برخی از روش های بهینه سازی گفتار. 862-3-2 چکیده ای ازویژگی ها ونقاط قوت و ضعف روش های مختلف.. 873-8 نکات و ملاحظاتی مهم درطراحی سیستم بهسازی گفتار. 893-8-1 استفاده از سیستم های ترکیبی. 893-8-2 استفاده از پردازش های زیر باند و مزایای آن. 893-8-3 استفاده از میکروفون دوم90فصل چهارم : روش های پیشنهادی924-1 مقدمه. 924-2 روش های پیشنهادی.. 934-2-1 بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک... 934-2-1-1 روش تفریق طیفی ضرایب موجک (WSS)944-2-1-2 اصلاحروشتفريقطيفيضرايب موجك (IWSS)954-2-1-3 تخميننويز. 964-2-1-4 الگوریتم ژنتیک.. 974-2-1-4-1 عملگرانتخاب.. 974-2-1-4-2 عملگربرش.. 984-2-1-4-3 عملگرجهش.. 984-2-1-4-4 جمعيتاوليه984-2-1-4-5 تابع هدف.. 984-2-2 بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک... 984-2-2-1 تخمین زننده Log MMSE در فضای موجک.. 994-2-2-2 تخمین نویز. 100فصل پنجم: نتایج و آزمایش ها1015-1 مقدمه. 1015-2 جزئیات پیاده سازی.. 1025-3 نتایج بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک... 1035-4 نتایج بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک... 106فصل ششم: نتیجه گیری و پیشنهادها1096-1 نتیجه گیری.. 1096-2 پیشنهاد برای کارهای آتی. 111مراجع112 فهرست شکل هاشکل 2‑1: شکل موج زماني جمله "The wife helped her husband" که به وسيله يک مرد توليد شده است.. 6شکل 2‑2: يک تصوير مقطعي از آناتومي توليد صوت7شکل 2‑3: طرحي از تارهاي صوتي که پايين حنجره وجود دارند.(a) حالت صدادار، (b) حالت بيصدا7شکل 2‑4: شکل موج هواي ناي. دوره پيچ با T نشانه گذاري شده است.8شکل 2‑5: نمودار بالايي شکل موج جريان هوايي ناي است و نمودار پاييني طيف آن را نشان مي دهد.9شکل 2‑6: طيف شکل موج ناي، پاسخ فرکانسي تارهاي صوتي، طيف گفتار خروجي.10شکل 2‑7: شکل موج وطیف نویز خودرو. 12شکل 2‑8: شکل موج و طیف نویز رستوران.12شکل 2‑9: شکل موج و طیف نویز قطار.13شکل 2‑10: طیف نویز سفید.13شکل 2‑11: طيف نويز صورتي.14شکل 2‑12: شکل موج زماني نويز صنعتي.14شکل 2‑13: طیف نویز صنعتی.14شکل 2‑14: دو نمونه سيگنال شامل مخلوطي از فركانس هاي 5، 10، 20، 50 هرتز و تبديل فوريه آن ها. (الف) مخلوط كسينوسي شامل تمام فركانس ها در تمام زمان ها، (ب) مخلوط كسينوسي به نحوي كه هر فركانس فقط در يك بازه زماني به خصوص حضور دارد، (پ) تبديل فوريه سيگنال. 18شکل 2‑15 :نمايشگرافيكينحوهپنجرهكردنسيگنالغيرايستابهمنظورمحاسبهتبديلفوريهزمان-كوتاه19شکل 2‑16: نمايش3 بعديتبديلموجکپيوستهسيگنالهاينشاندادهشده در شکل 2-14 بااستفادهازموجکمادردابیشیز 8 [5] الف (تبديلويولتسيگنالايستا،ب)تبديلويولتسيگنالناايستا.21شکل 2‑17: مقایسه ای بین میزان تفکیک پذیری در صفحات مختلف. (الف) صفحه زمان، (ب) صفحه فرکانس، (پ) صفحه زمان- فرکانس در تبدیل فوریه زمان کوتاه، (ت) صفحه زمان – فرکانس در تبدیل موجک22شکل 2‑18: نمايشنحوهمحاسبهتبديلموجکگسسته3مرحلهايبااستفادهازايدهبانكفيلتربراييكسيگنالدلخواه26شکل 2‑19: تابع موجک کلاه مکزیکی. 26شکل 2‑20: تابع موجک مورلت.. 27شکل 2‑21: تابع موجک دابیچز. 27شکل 2‑22: تابع موجک سیملت.. 28شکل 2‑23: نقاط بهینۀ محلی و بهینۀ کلی. 32شکل 2‑24: چارت الگوریتم ژنتیک... 40شکل 2‑25: ترکیب تک نقطه.43شکل 2‑26: ترکیب جایگشتی.43شکل 2‑27: جهش: کدینگ جایگشتی. 43شکل 2‑28: جهش: کدینگ مقدار.44شکل 2‑29:کدینگ درختی.44شکل 2‑30: نمونه کروموزوم الگوریتم ژنتیکی.45شکل 2‑31: : چرخ رولت.50شکل 2‑32: جابجایی چند نقطه.54شکل 2‑33: ترکیب تک نقطهای.57شکل 2‑34: ترکیب دو نقطهای. 58شکل 2‑35: ترکیب یکنواخت.. 59شکل 2‑36: شبیه سازی جهش به کمک نمودار. 62شکل 2‑37: جهش باینری.63شکل 2‑38: جهش: وارونه سازی بیت.64شکل 2‑39: جهش: تغییر ترتیب قرارگیری.64شکل 2‑40: : جهش: وارون سازی.65شکل 2‑41: جهش: تغییر مقدار.65شکل 2‑42: نمایش پیش بینی نمونه سیگنال با توجه به نمونه های قبل سیگنال. 69شکل 2-43: نمایش بلوک دیاگرام پیشگویی خطی. 71شکل 3- 1: بلوک دیاگرام روش تفریق طیفی. 75شکل 4- 1: بلوک دیاگرام روش پیشنهادی.. 94شکل 4- 2: بلوك دياگرام روش تفريق طيفي ضرايب موجك. 95شکل 4- 3: : بلوک دیاگرام قسمت تخمین نویز. 97شکل 4- 4: بلوک دیاگرام قسمت تخمین نویز و الگوریتم ژنتیک... 97شکل 4- 5: : بلوک دیاگرام روش پیشنهادی.. 99شکل 4- 6: بلوک دیاگرام تخمین نویز. 100شکل 5-1: 1. سیگنال تمیز 2. سیگنال نویزی با(SNR=5db) 3. سیگنال بهبود یافتهاز روش پیشنهادی و4. سیگنال بهبود یافته از روش تفریق طیفی. 104شکل 5-2: نموداراسپکتوگرام 1. سیگنال تمیز 2. سیگنال نویزی با(SNR=5db) 3. سیگنال بهبود یافتهاز روش پیشنهادی و4. سیگنال بهبود یافته از روش تفریق طیفی. 105شکل 5-3: SNR سیگنال بهسازی شده نسبت به تغییرات α در روش تفریق طیفی. 105شکل 5-4: 1. سیگنال تمیز2.سیگنال نویزی با (SNR=5db) 3. سیگنال بهبود یافته از روش پیشنهادی و4.سیگنال بهبود یافته از روش log MMSE. 107شکل 5-5: نموداراسپکتوگرام 1. سیگنال تمیز 2. سیگنال نویزی با(SNR=5db) 3. سیگنال بهبود یافتهاز روش پیشنهادی و4. سیگنال بهبود یافته از روش logMMSE. 108 فهرست جدول هاجدول(5-1) :مقايسه تست شنوایی روشهايروش تخمین زننده لگاریتمی (logmmse) وروش پیشنهادی(wmmse)103جدول(5-2):مقايسهميانگينSNRروشهايتفريقطيفي موجک(wss) وتفریق طیفی موجک پیشنهادی(gwss)103جدول(5-4):مقايسه تست شنوایی روشهايروش تخمین زننده لگاریتمی (logmmse) وروش پیشنهادی(wmmse)106جدول(5-3):مقايسهميانگينSNRروشهايروش تخمین زننده لگاریتمی (logmmse) وروش پیشنهادی(wmmse)106 لیست علائم و اختصارات CWT Continuous Wavelet Transformتبدیل موجک پیوستهDWT Discrete Wavelet Transformتبدیل موجک گسستهFFTFast Fourier Transform تبدیل فوریه سریعFBFeed backپسخورFFFeed forwardپيشخورFIRFinite Impulse Response پاسخ ضربه محدودGAGenetic Argorithmالگوریتم ژنتیکHMM Hide Marcov Modelمدل مخفی مارکوفIFFTInverse Fast Fourier Transform معکوس تبدیل فوریه سریعIIRInfinite Impulse Response پاسخ ضربهنامحدودIWTInverse Wavelet Transformمعکوس تبدیل موجکLPC Linear Prediction coefficientضرایب خطی پیش گوMMSEMinimum Mean Square Eror filterفیلتر میانگین مربعات خطاMOSMean Opinion Scoreمیانگین تست شنواییPDFProbabillty Density Functionتابع چگالی احتمالSSSpectral subtractionتفریق طیفیSHSpeech Enhancementبهسازی سیگنال گفتارSNRSignal-to-Noise Ratioنسبت سیگنال به نویزVADVoice Activity Detectorآشکارساز فعال صداWTWavelet Transformتبدیل موجکWSSWavelet Spectral subtractionتفریق طیفی موجک 1-1 پیشگفتاربا رشد روز افزون استفاده از سیستم های گفتاری درکاربرد های عملی و روزمره، نیاز به حفظ کیفیت گفتار به عنوان امری اجتناب ناپذیر مطرح گردیده است. شرایط ایده ال و عاری از نویزی که در کارها و شبیه سازی های آزمایشگاهی در نظر گرفته می شود، در بسیاری از کاربردهای واقعی، به طور جدی نقض گردیده و برقراری آنها زیر سوال می رود. به عنوان مثال، استفاده ار تلفن همراه، سمعک، سیستم بازشناسی گفتار یا هر وسیله ارتباط گفتاری در یک محیط نویزی، همگی از مواردی است که در آن، حفظ کیفیت گفتار و بالا نگه داشتن کارایی سیستم از اهمیت خاصی برخوردار می باشد؛ بدون استفاده از روش های بهسازی گفتار، عملکرد این سیستم ها به شدت تنزل یافته و چه بسا که غیر قابل قبول خواهد گردید. از این رو، مبحث بهسازی گفتار به عنوان یکی از ضرورت های کاربردی و عملی، از زمینه های فعال تحقیقاتی در سال های اخیر بوده است. در ادامه این فصل به بررسی اجمالی مسايل و مباحث موجود در زمینه بهسازی گفتار می پردازیم.در قالب یک تعریف کلی، موضوع بهسازی گفتار یاspeechenhancement، عبارتست از تلاش برای بهبود عملکرد سیستم های ارتباط گفتاری در مواردی که سیگنال تحت تاثیرنویز، انعکاس ها و سایر عوامل تخریبی گردیده است.نیاز به بهسازی گفتار از آنجا ناشی می شود که سیگنال گفتار:یا: از منبعی تولید می شود که در محیط نویزی قرار دارد،یا: تحت تاثیر کانال انتشار و در اثرنویز یا انعکاس دچار تخریب می شود،یا: در گیرنده به نویز آلوده می گردد.(البته منشاء عوامل تخریبی وارد شونده در مساله می تواند ترکیبی از این سه حالت نیز باشد.)منظور از بهبود بخشیدن در تعریف فوق را می توان با اشاره به عملکرد اصلاحی فرآیند بهسازی گفتار درنمونه های کاربردی زیر تشریح نمود:- سیستم های تلفن: در آنها گفتار اصلی به وسیله نویز زمینه یا نویز موجود در مسیر مخابره و نیز در اثر انعکاس صدای طرفین مکالمه، خراب می شود.- تلفن های عمومی: که در محیط های پر سروصدا و شلوغ واقعند.- سیستم های مخابرات هوا به زمین: که در آنها نویز اتاقک خلبان، پیام ارسال شده از سوی خلبان را خراب می کند.- سمعک: که به عنوان تقویت کننده، هم سیگنال گفتار و هم نویز موجود در محیط را تقویت نموده و موجب ناراحتی فرد استفاده کننده می گردد.- سیستم های باز شناسی گفتار یا گوینده: که معمولا برای سیگنال های تمیز(بدون نویز) آموزش یافته و در شرایط نویزی، با افتی شدید در بازدهی و کارایی مواجه می شود.- و موارد کاربردی دیگر...
بهسازی سیگنال گفتار در حوزه زمان-فرکانس Speech Enhancement in time-ferqency domain
فهرست مطالبتقدیر و تشکرچکیدهفهرست شکل هاسفهرست جدول هاصفصلاول:1مقـــــدمه11-1 پیشگفتار. 11-2 بهسازی گفتار نویزی:اهداف،کاربردها،مفاهیم21-3 تعریف مسئله و تقسیم بندی روش ها31-4 نوآوری تحقیق. 41-5 ساختار پایانامه. 4فصل دوم5پیش زمینه های پردازش سیگنال گفتار52-1 نحوه توليد گفتار در انسان. 52-2 معرفی نويز و انواع آن. 102-2-1 نويز سفيد132-2-2 نويز صورتي. 132-2-3 نويز قهوهاي.. 142-2-4 نويز صنعتي. 142-3 تحلیل زمان- فرکانسی سیگنال گفتار. 152-3-1 تبدیل فوریه. 152-3-2 تبديل فوريه زمان-كوتاه172-3-3 آناليز چند دقت زمان فرکانسی. 202-3-4 تبديلموجکيكبعدي.. 202-3-4-1 تبديل موجک پيوسته202-3-4-1-1 دقت های زمانی و فركانسی. 222-3-4-1-2 روابط رياضي تبديل موجک:222-3-4-1-3 عكس تبديل موجک:242-3-4-2 تبدیل موجک گسسته242-4 الگوریتم بهینه سازی ژنتیک... 282-4-1 درباره علم ژنتیک... 282-4-2 تاریخچۀ علم ژنتیک... 292-4-3 تکامل طبیعی (قانون انتخاب طبیعی داروین)و رابطه آن با روش های هوش مصنوعی. 292-4-4 الگوریتم ژنتیک... 322-4-5 مكانيزم الگوريتم ژنتيك.. 342-4-6 عملگرههاي الگوريتم ژنتيك.. 372-4-6-1 کدگذاری. 372-4-6-2 ارزیابی. 372-4-6-3 ترکیب.. 372-4-6-4 جهش.. 372-4-6-5 رمزگشايي. 382-4-7 چارت الگوريتم به همراه شبه كد آن. 382-4-7-1 شبه كد و توضيح آن. 382-4-7-2 چارت الگوریتم ژنتیک... 402-4-8 تابع هدف.. 412-4-9 روشهای کد کردن. 412-4-9-1 کدینگ باینری. 422-4-9-2 کدینگ جایگشتی. 422-4-9-3 کد گذاری مقدار. 432-4-9-4 کدینگ درخت.. 442-4-10 نمایش رشتهها452-4-11 جمعيت.. 462-4-11-1 ايجادجمعيت اوليه462-4-11-2 اندازه جمعيت.. 462-4-12 محاسبه برازندگي (تابع ارزش)472-4-13 انواع روشهای انتخاب.. 482-4-13-1 انتخاب چرخ رولت.. 492-4-13-2 انتخاب حالت پایدار. 512-4-13-3 انتخاب نخبه گرایی. 512-4-13-4 انتخاب رقابتی. 512-4-13-5 انتخاب قطع سر. 522-4-13-6 انتخاب قطعی بریندل. 522-4-13-7 انتخاب جایگزینی نسلی اصلاح شده532-4-13-8 انتخاب مسابقه532-4-13-9 انتخاب مسابقه تصادفی. 532-4-14 انواع روشهای ترکیب.. 532-4-14-1 جابهجایی دودوئی. 542-4-14-2 جابهجایي حقيقي. 562-4-14-3 ترکیب تکنقطهای. 572-4-14-4 ترکیب دو نقطهای. 582-4-14-5 ترکیب n نقطهای. 582-4-14-6 ترکیب یکنواخت.. 582-4-14-7 ترکیب حسابی. 592-4-14-8 ترتیب.. 592-4-14-9 چرخه602-4-15 احتمال تركيب.. 602-4-16 تحليل مكانيزم جابجایي. 612-4-17 جهش.. 612-4-17-1 جهش باينري. 632-4-17-2 جهش حقيقي. 642-4-17-3 وارونه سازی بیت.. 642-4-17-4 تغییر ترتیب قرارگیری. 642-4-17-5 وارون سازی. 642-4-17-6 تغییر مقدار. 652-4-18 محک اختتام اجرای الگوریتم ژنتیک... 652-4-19 نقاط قوّت الگوریتمهای ژنتیک... 662-4-20 محدودیتهای GAها682-5 آنالیز ضرایب پیشگویی خطی (LPC)692-5-1 محاسبه ضرایب LPC. 70فصل سوم73مروری برروش های عمده بهسازی گفتار733-1 مقدمه. 733-2 روش تفریق طیفی. 743-3 روش فیلتر وینر. 763-4 بهسازی گفتار با استفاده از مدل های آماری.. 783-4-1 تخمین زننده لگاریتمی بر مبنایكمينه كردنخطايميانگينمربعات(Log MMSE)783-4-2 استفاده از مدل مخفی مارکف(HMM) برای بهسازی گفتار. 803-5 روش زیر فضای سیگنال. 823-6 بهسازی گفتار با استفاده از تبدیل موجک... 833-7 مقایسه روش ها و بررسی نقاط قوت و ضعف.. 853-7-1 بررسی های مقایسه ای انجام شده بین برخی از روش های بهینه سازی گفتار. 862-3-2 چکیده ای ازویژگی ها ونقاط قوت و ضعف روش های مختلف.. 873-8 نکات و ملاحظاتی مهم درطراحی سیستم بهسازی گفتار. 893-8-1 استفاده از سیستم های ترکیبی. 893-8-2 استفاده از پردازش های زیر باند و مزایای آن. 893-8-3 استفاده از میکروفون دوم90فصل چهارم : روش های پیشنهادی924-1 مقدمه. 924-2 روش های پیشنهادی.. 934-2-1 بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک... 934-2-1-1 روش تفریق طیفی ضرایب موجک (WSS)944-2-1-2 اصلاحروشتفريقطيفيضرايب موجك (IWSS)954-2-1-3 تخميننويز. 964-2-1-4 الگوریتم ژنتیک.. 974-2-1-4-1 عملگرانتخاب.. 974-2-1-4-2 عملگربرش.. 984-2-1-4-3 عملگرجهش.. 984-2-1-4-4 جمعيتاوليه984-2-1-4-5 تابع هدف.. 984-2-2 بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک... 984-2-2-1 تخمین زننده Log MMSE در فضای موجک.. 994-2-2-2 تخمین نویز. 100فصل پنجم: نتایج و آزمایش ها1015-1 مقدمه. 1015-2 جزئیات پیاده سازی.. 1025-3 نتایج بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک... 1035-4 نتایج بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک... 106فصل ششم: نتیجه گیری و پیشنهادها1096-1 نتیجه گیری.. 1096-2 پیشنهاد برای کارهای آتی. 111مراجع112 فهرست شکل هاشکل 2‑1: شکل موج زماني جمله "The wife helped her husband" که به وسيله يک مرد توليد شده است.. 6شکل 2‑2: يک تصوير مقطعي از آناتومي توليد صوت7شکل 2‑3: طرحي از تارهاي صوتي که پايين حنجره وجود دارند.(a) حالت صدادار، (b) حالت بيصدا7شکل 2‑4: شکل موج هواي ناي. دوره پيچ با T نشانه گذاري شده است.8شکل 2‑5: نمودار بالايي شکل موج جريان هوايي ناي است و نمودار پاييني طيف آن را نشان مي دهد.9شکل 2‑6: طيف شکل موج ناي، پاسخ فرکانسي تارهاي صوتي، طيف گفتار خروجي.10شکل 2‑7: شکل موج وطیف نویز خودرو. 12شکل 2‑8: شکل موج و طیف نویز رستوران.12شکل 2‑9: شکل موج و طیف نویز قطار.13شکل 2‑10: طیف نویز سفید.13شکل 2‑11: طيف نويز صورتي.14شکل 2‑12: شکل موج زماني نويز صنعتي.14شکل 2‑13: طیف نویز صنعتی.14شکل 2‑14: دو نمونه سيگنال شامل مخلوطي از فركانس هاي 5، 10، 20، 50 هرتز و تبديل فوريه آن ها. (الف) مخلوط كسينوسي شامل تمام فركانس ها در تمام زمان ها، (ب) مخلوط كسينوسي به نحوي كه هر فركانس فقط در يك بازه زماني به خصوص حضور دارد، (پ) تبديل فوريه سيگنال. 18شکل 2‑15 :نمايشگرافيكينحوهپنجرهكردنسيگنالغيرايستابهمنظورمحاسبهتبديلفوريهزمان-كوتاه19شکل 2‑16: نمايش3 بعديتبديلموجکپيوستهسيگنالهاينشاندادهشده در شکل 2-14 بااستفادهازموجکمادردابیشیز 8 [5] الف (تبديلويولتسيگنالايستا،ب)تبديلويولتسيگنالناايستا.21شکل 2‑17: مقایسه ای بین میزان تفکیک پذیری در صفحات مختلف. (الف) صفحه زمان، (ب) صفحه فرکانس، (پ) صفحه زمان- فرکانس در تبدیل فوریه زمان کوتاه، (ت) صفحه زمان – فرکانس در تبدیل موجک22شکل 2‑18: نمايشنحوهمحاسبهتبديلموجکگسسته3مرحلهايبااستفادهازايدهبانكفيلتربراييكسيگنالدلخواه26شکل 2‑19: تابع موجک کلاه مکزیکی. 26شکل 2‑20: تابع موجک مورلت.. 27شکل 2‑21: تابع موجک دابیچز. 27شکل 2‑22: تابع موجک سیملت.. 28شکل 2‑23: نقاط بهینۀ محلی و بهینۀ کلی. 32شکل 2‑24: چارت الگوریتم ژنتیک... 40شکل 2‑25: ترکیب تک نقطه.43شکل 2‑26: ترکیب جایگشتی.43شکل 2‑27: جهش: کدینگ جایگشتی. 43شکل 2‑28: جهش: کدینگ مقدار.44شکل 2‑29:کدینگ درختی.44شکل 2‑30: نمونه کروموزوم الگوریتم ژنتیکی.45شکل 2‑31: : چرخ رولت.50شکل 2‑32: جابجایی چند نقطه.54شکل 2‑33: ترکیب تک نقطهای.57شکل 2‑34: ترکیب دو نقطهای. 58شکل 2‑35: ترکیب یکنواخت.. 59شکل 2‑36: شبیه سازی جهش به کمک نمودار. 62شکل 2‑37: جهش باینری.63شکل 2‑38: جهش: وارونه سازی بیت.64شکل 2‑39: جهش: تغییر ترتیب قرارگیری.64شکل 2‑40: : جهش: وارون سازی.65شکل 2‑41: جهش: تغییر مقدار.65شکل 2‑42: نمایش پیش بینی نمونه سیگنال با توجه به نمونه های قبل سیگنال. 69شکل 2-43: نمایش بلوک دیاگرام پیشگویی خطی. 71شکل 3- 1: بلوک دیاگرام روش تفریق طیفی. 75شکل 4- 1: بلوک دیاگرام روش پیشنهادی.. 94شکل 4- 2: بلوك دياگرام روش تفريق طيفي ضرايب موجك. 95شکل 4- 3: : بلوک دیاگرام قسمت تخمین نویز. 97شکل 4- 4: بلوک دیاگرام قسمت تخمین نویز و الگوریتم ژنتیک... 97شکل 4- 5: : بلوک دیاگرام روش پیشنهادی.. 99شکل 4- 6: بلوک دیاگرام تخمین نویز. 100شکل 5-1: 1. سیگنال تمیز 2. سیگنال نویزی با(SNR=5db) 3. سیگنال بهبود یافتهاز روش پیشنهادی و4. سیگنال بهبود یافته از روش تفریق طیفی. 104شکل 5-2: نموداراسپکتوگرام 1. سیگنال تمیز 2. سیگنال نویزی با(SNR=5db) 3. سیگنال بهبود یافتهاز روش پیشنهادی و4. سیگنال بهبود یافته از روش تفریق طیفی. 105شکل 5-3: SNR سیگنال بهسازی شده نسبت به تغییرات α در روش تفریق طیفی. 105شکل 5-4: 1. سیگنال تمیز2.سیگنال نویزی با (SNR=5db) 3. سیگنال بهبود یافته از روش پیشنهادی و4.سیگنال بهبود یافته از روش log MMSE. 107شکل 5-5: نموداراسپکتوگرام 1. سیگنال تمیز 2. سیگنال نویزی با(SNR=5db) 3. سیگنال بهبود یافتهاز روش پیشنهادی و4. سیگنال بهبود یافته از روش logMMSE. 108 فهرست جدول هاجدول(5-1) :مقايسه تست شنوایی روشهايروش تخمین زننده لگاریتمی (logmmse) وروش پیشنهادی(wmmse)103جدول(5-2):مقايسهميانگينSNRروشهايتفريقطيفي موجک(wss) وتفریق طیفی موجک پیشنهادی(gwss)103جدول(5-4):مقايسه تست شنوایی روشهايروش تخمین زننده لگاریتمی (logmmse) وروش پیشنهادی(wmmse)106جدول(5-3):مقايسهميانگينSNRروشهايروش تخمین زننده لگاریتمی (logmmse) وروش پیشنهادی(wmmse)106 لیست علائم و اختصارات CWT Continuous Wavelet Transformتبدیل موجک پیوستهDWT Discrete Wavelet Transformتبدیل موجک گسستهFFTFast Fourier Transform تبدیل فوریه سریعFBFeed backپسخورFFFeed forwardپيشخورFIRFinite Impulse Response پاسخ ضربه محدودGAGenetic Argorithmالگوریتم ژنتیکHMM Hide Marcov Modelمدل مخفی مارکوفIFFTInverse Fast Fourier Transform معکوس تبدیل فوریه سریعIIRInfinite Impulse Response پاسخ ضربهنامحدودIWTInverse Wavelet Transformمعکوس تبدیل موجکLPC Linear Prediction coefficientضرایب خطی پیش گوMMSEMinimum Mean Square Eror filterفیلتر میانگین مربعات خطاMOSMean Opinion Scoreمیانگین تست شنواییPDFProbabillty Density Functionتابع چگالی احتمالSSSpectral subtractionتفریق طیفیSHSpeech Enhancementبهسازی سیگنال گفتارSNRSignal-to-Noise Ratioنسبت سیگنال به نویزVADVoice Activity Detectorآشکارساز فعال صداWTWavelet Transformتبدیل موجکWSSWavelet Spectral subtractionتفریق طیفی موجک 1-1 پیشگفتاربا رشد روز افزون استفاده از سیستم های گفتاری درکاربرد های عملی و روزمره، نیاز به حفظ کیفیت گفتار به عنوان امری اجتناب ناپذیر مطرح گردیده است. شرایط ایده ال و عاری از نویزی که در کارها و شبیه سازی های آزمایشگاهی در نظر گرفته می شود، در بسیاری از کاربردهای واقعی، به طور جدی نقض گردیده و برقراری آنها زیر سوال می رود. به عنوان مثال، استفاده ار تلفن همراه، سمعک، سیستم بازشناسی گفتار یا هر وسیله ارتباط گفتاری در یک محیط نویزی، همگی از مواردی است که در آن، حفظ کیفیت گفتار و بالا نگه داشتن کارایی سیستم از اهمیت خاصی برخوردار می باشد؛ بدون استفاده از روش های بهسازی گفتار، عملکرد این سیستم ها به شدت تنزل یافته و چه بسا که غیر قابل قبول خواهد گردید. از این رو، مبحث بهسازی گفتار به عنوان یکی از ضرورت های کاربردی و عملی، از زمینه های فعال تحقیقاتی در سال های اخیر بوده است. در ادامه این فصل به بررسی اجمالی مسايل و مباحث موجود در زمینه بهسازی گفتار می پردازیم.در قالب یک تعریف کلی، موضوع بهسازی گفتار یاspeechenhancement، عبارتست از تلاش برای بهبود عملکرد سیستم های ارتباط گفتاری در مواردی که سیگنال تحت تاثیرنویز، انعکاس ها و سایر عوامل تخریبی گردیده است.نیاز به بهسازی گفتار از آنجا ناشی می شود که سیگنال گفتار:یا: از منبعی تولید می شود که در محیط نویزی قرار دارد،یا: تحت تاثیر کانال انتشار و در اثرنویز یا انعکاس دچار تخریب می شود،یا: در گیرنده به نویز آلوده می گردد.(البته منشاء عوامل تخریبی وارد شونده در مساله می تواند ترکیبی از این سه حالت نیز باشد.)منظور از بهبود بخشیدن در تعریف فوق را می توان با اشاره به عملکرد اصلاحی فرآیند بهسازی گفتار درنمونه های کاربردی زیر تشریح نمود:- سیستم های تلفن: در آنها گفتار اصلی به وسیله نویز زمینه یا نویز موجود در مسیر مخابره و نیز در اثر انعکاس صدای طرفین مکالمه، خراب می شود.- تلفن های عمومی: که در محیط های پر سروصدا و شلوغ واقعند.- سیستم های مخابرات هوا به زمین: که در آنها نویز اتاقک خلبان، پیام ارسال شده از سوی خلبان را خراب می کند.- سمعک: که به عنوان تقویت کننده، هم سیگنال گفتار و هم نویز موجود در محیط را تقویت نموده و موجب ناراحتی فرد استفاده کننده می گردد.- سیستم های باز شناسی گفتار یا گوینده: که معمولا برای سیگنال های تمیز(بدون نویز) آموزش یافته و در شرایط نویزی، با افتی شدید در بازدهی و کارایی مواجه می شود.- و موارد کاربردی دیگر...