👈فول فایل فور یو ff4u.ir 👉

بهسازی سیگنال گفتار در حوزه زمان-فرکانس Speech Enhancement in time-ferqency domain

ارتباط با ما

دانلود


بهسازی سیگنال گفتار در حوزه زمان-فرکانس Speech Enhancement in time-ferqency domain
فهرست مطالب
تقدیر و تشکر
چکیده
فهرست شکل هاس‌
فهرست جدول هاص‌
فصلاول:1
مقـــــدمه1
1-1 پیشگفتار. 1
1-2 بهسازی گفتار نویزی:اهداف،کاربردها،مفاهیم2
1-3 تعریف مسئله و تقسیم بندی روش ها3
1-4 نوآوری تحقیق. 4
1-5 ساختار پایانامه. 4
فصل دوم5
پیش زمینه های پردازش سیگنال گفتار5
2-1 نحوه توليد گفتار در انسان. 5
2-2 معرفی نويز و انواع آن. 10
2-2-1 نويز سفيد13
2-2-2 نويز صورتي. 13
2-2-3 نويز قهوهاي.. 14
2-2-4 نويز صنعتي. 14
2-3 تحلیل زمان- فرکانسی سیگنال گفتار. 15
2-3-1 تبدیل فوریه. 15
2-3-2 تبديل فوريه زمان-كوتاه17
2-3-3 آناليز چند دقت زمان فرکانسی. 20
2-3-4 تبديلموجکيكبعدي.. 20
2-3-4-1 تبديل موجک پيوسته20
2-3-4-1-1 دقت های زمانی و فركانسی. 22
2-3-4-1-2 روابط رياضي تبديل موجک:22
2-3-4-1-3 عكس تبديل موجک:24
2-3-4-2 تبدیل موجک گسسته24
2-4 الگوریتم بهینه سازی ژنتیک... 28
2-4-1 درباره علم ژنتیک... 28
2-4-2 تاریخچۀ علم ژنتیک... 29
2-4-3 تکامل طبیعی (قانون انتخاب طبیعی داروین)و رابطه آن با روش های هوش مصنوعی. 29
2-4-4 الگوریتم ژنتیک... 32
2-4-5 مكانيزم الگوريتم ژنتيك.. 34
2-4-6 عملگرههاي الگوريتم ژنتيك.. 37
2-4-6-1 کدگذاری. 37
2-4-6-2 ارزیابی. 37
2-4-6-3 ترکیب.. 37
2-4-6-4 جهش.. 37
2-4-6-5 رمزگشايي. 38
2-4-7 چارت الگوريتم به همراه شبه كد آن. 38
2-4-7-1 شبه كد و توضيح آن. 38
2-4-7-2 چارت الگوریتم ژنتیک... 40
2-4-8 تابع هدف.. 41
2-4-9 روش‌های کد کردن. 41
2-4-9-1 کدینگ باینری. 42
2-4-9-2 کدینگ جایگشتی. 42
2-4-9-3 کد گذاری مقدار. 43
2-4-9-4 کدینگ درخت.. 44
2-4-10 نمایش رشته‌ها45
2-4-11 جمعيت.. 46
2-4-11-1 ايجادجمعيت اوليه46
2-4-11-2 اندازه جمعيت.. 46
2-4-12 محاسبه برازندگي (تابع ارزش)47
2-4-13 انواع روش‌های انتخاب.. 48
2-4-13-1 انتخاب چرخ رولت.. 49
2-4-13-2 انتخاب حالت پایدار. 51
2-4-13-3 انتخاب نخبه گرایی. 51
2-4-13-4 انتخاب رقابتی. 51
2-4-13-5 انتخاب قطع سر. 52
2-4-13-6 انتخاب قطعی بریندل. 52
2-4-13-7 انتخاب جایگزینی نسلی اصلاح شده53
2-4-13-8 انتخاب مسابقه53
2-4-13-9 انتخاب مسابقه تصادفی. 53
2-4-14 انواع روش‌های ترکیب.. 53
2-4-14-1 جابه‌جایی دودوئی. 54
2-4-14-2 جابه‌جایي حقيقي. 56
2-4-14-3 ترکیب تک‌نقطه‌ای. 57
2-4-14-4 ترکیب دو نقطه‌ای. 58
2-4-14-5 ترکیب n نقطه‌ای. 58
2-4-14-6 ترکیب یکنواخت.. 58
2-4-14-7 ترکیب حسابی. 59
2-4-14-8 ترتیب.. 59
2-4-14-9 چرخه60
2-4-15 احتمال تركيب.. 60
2-4-16 تحليل مكانيزم جابجایي. 61
2-4-17 جهش.. 61
2-4-17-1 جهش باينري. 63
2-4-17-2 جهش حقيقي. 64
2-4-17-3 وارونه سازی بیت.. 64
2-4-17-4 تغییر ترتیب قرارگیری. 64
2-4-17-5 وارون سازی. 64
2-4-17-6 تغییر مقدار. 65
2-4-18 محک اختتام اجرای الگوریتم ژنتیک... 65
2-4-19 نقاط قوّت الگوریتم‌های ژنتیک... 66
2-4-20 محدودیت‌های GAها68
2-5 آنالیز ضرایب پیشگویی خطی (LPC)69
2-5-1 محاسبه ضرایب LPC. 70
فصل سوم73
مروری برروش های عمده بهسازی گفتار73
3-1 مقدمه. 73
3-2 روش تفریق طیفی. 74
3-3 روش فیلتر وینر. 76
3-4 بهسازی گفتار با استفاده از مدل های آماری.. 78
3-4-1 تخمین زننده لگاریتمی بر مبنایكمينه كردنخطايميانگينمربعات(Log MMSE)78
3-4-2 استفاده از مدل مخفی مارکف(HMM) برای بهسازی گفتار. 80
3-5 روش زیر فضای سیگنال. 82
3-6 بهسازی گفتار با استفاده از تبدیل موجک... 83
3-7 مقایسه روش ها و بررسی نقاط قوت و ضعف.. 85
3-7-1 بررسی های مقایسه ای انجام شده بین برخی از روش های بهینه سازی گفتار. 86
2-3-2 چکیده ای ازویژگی ها ونقاط قوت و ضعف روش های مختلف.. 87
3-8 نکات و ملاحظاتی مهم درطراحی سیستم بهسازی گفتار. 89
3-8-1 استفاده از سیستم های ترکیبی. 89
3-8-2 استفاده از پردازش های زیر باند و مزایای آن. 89
3-8-3 استفاده از میکروفون دوم90
فصل چهارم : روش های پیشنهادی92
4-1 مقدمه. 92
4-2 روش های پیشنهادی.. 93
4-2-1 بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک... 93
4-2-1-1 روش تفریق طیفی ضرایب موجک (WSS)94
4-2-1-2 اصلاحروشتفريقطيفيضرايب موجك (IWSS)95
4-2-1-3 تخميننويز. 96
4-2-1-4 الگوریتم ژنتیک.. 97
4-2-1-4-1 عملگرانتخاب.. 97
4-2-1-4-2 عملگربرش.. 98
4-2-1-4-3 عملگرجهش.. 98
4-2-1-4-4 جمعيتاوليه98
4-2-1-4-5 تابع هدف.. 98
4-2-2 بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک... 98
4-2-2-1 تخمین زننده Log MMSE در فضای موجک.. 99
4-2-2-2 تخمین نویز. 100
فصل پنجم: نتایج و آزمایش ها101
5-1 مقدمه. 101
5-2 جزئیات پیاده سازی.. 102
5-3 نتایج بهسازی سیگنال های صوتی با استفاده از الگوریتم ژنتیک و آنالیز LPC در روش تفریق موجک... 103
5-4 نتایج بهسازی سیگنال های صوتی با استفاده از روش میانگین خطای مربعات در فضای موجک... 106
فصل ششم: نتیجه گیری و پیشنهادها109
6-1 نتیجه گیری.. 109
6-2 پیشنهاد برای کارهای آتی. 111
مراجع112
 فهرست شکل ها
شکل 2‑1: شکل موج زماني جمله "The wife helped her husband" که به وسيله يک مرد توليد شده است.. 6
شکل 2‑2: يک تصوير مقطعي از آناتومي توليد صوت7
شکل 2‑3: طرحي از تارهاي صوتي که پايين حنجره وجود دارند.(a) حالت صدادار، (b) حالت بي‌صدا7
شکل 2‑4: شکل موج هواي ناي. دوره پيچ با T نشانه گذاري شده است.8
شکل 2‑5: نمودار بالايي شکل موج جريان هوايي ناي است و نمودار پاييني طيف آن را نشان مي دهد.9
شکل 2‑6: طيف شکل موج ناي، پاسخ فرکانسي تارهاي صوتي، طيف گفتار خروجي.10
شکل 2‑7: شکل موج وطیف نویز خودرو. 12
شکل 2‑8: شکل موج و طیف نویز رستوران.12
شکل 2‑9: شکل موج و طیف نویز قطار.13
شکل 2‑10: طیف نویز سفید.13
شکل 2‑11: طيف نويز صورتي.14
شکل 2‑12: شکل موج زماني نويز صنعتي.14
شکل 2‑13: طیف نویز صنعتی.14
شکل 2‑14: دو نمونه سيگنال شامل مخلوطي از فركانس هاي 5، 10، 20، 50 هرتز و تبديل فوريه آن ها. (الف) مخلوط كسينوسي شامل تمام فركانس ها در تمام زمان ها، (ب) مخلوط كسينوسي به نحوي كه هر فركانس فقط در يك بازه زماني به خصوص حضور دارد، (پ) تبديل فوريه سيگنال. 18
شکل 2‑15 :نمايشگرافيكينحوهپنجرهكردنسيگنالغيرايستابهمنظورمحاسبهتبديلفوريهزمان-كوتاه19
شکل 2‑16: نمايش3 بعديتبديلموجکپيوستهسيگنالهاينشاندادهشده در شکل 2-14 بااستفادهازموجکمادردابیشیز 8 [5] الف (تبديلويولتسيگنالايستا،ب)تبديلويولتسيگنالناايستا.21
شکل 2‑17: مقایسه ای بین میزان تفکیک پذیری در صفحات مختلف. (الف) صفحه زمان، (ب) صفحه فرکانس، (پ) صفحه زمان- فرکانس در تبدیل فوریه زمان کوتاه، (ت) صفحه زمان – فرکانس در تبدیل موجک22
شکل 2‑18: نمايشنحوهمحاسبهتبديلموجکگسسته3مرحلهايبااستفادهازايدهبانكفيلتربراييكسيگنالدلخواه26
شکل 2‑19: تابع موجک کلاه مکزیکی. 26
شکل 2‑20: تابع موجک مورلت.. 27
شکل 2‑21: تابع موجک دابیچز. 27
شکل 2‑22: تابع موجک سیملت.. 28
شکل 2‑23: نقاط بهینۀ محلی و بهینۀ کلی. 32
شکل 2‑24: چارت الگوریتم ژنتیک... 40
شکل 2‑25: ترکیب تک نقطه.43
شکل 2‑26: ترکیب جایگشتی.43
شکل 2‑27: جهش: کدینگ جایگشتی. 43
شکل 2‑28: جهش: کدینگ مقدار.44
شکل 2‑29:کدینگ درختی.44
شکل 2‑30: نمونه کروموزوم الگوریتم ژنتیکی.45
شکل 2‑31: : چرخ رولت.50
شکل 2‑32: جابجایی چند نقطه.54
شکل 2‑33: ترکیب تک ‌نقطه‌ای.57
شکل 2‑34: ترکیب دو نقطه‌ای. 58
شکل 2‑35: ترکیب یکنواخت.. 59
شکل 2‑36: شبیه سازی جهش به کمک نمودار. 62
شکل 2‑37: جهش باینری.63
شکل 2‑38: جهش: وارونه سازی بیت.64
شکل 2‑39: جهش: تغییر ترتیب قرارگیری.64
شکل 2‑40: : جهش: وارون سازی.65
شکل 2‑41: جهش: تغییر مقدار.65
شکل 2‑42: نمایش پیش بینی نمونه سیگنال با توجه به نمونه های قبل سیگنال. 69
شکل 2-43: نمایش بلوک دیاگرام پیشگویی خطی. 71
شکل 3- 1: بلوک دیاگرام روش تفریق طیفی. 75
شکل 4- 1: بلوک دیاگرام روش پیشنهادی.. 94
شکل 4- 2: بلوك دياگرام روش تفريق طيفي ضرايب موجك. 95
شکل 4- 3: : بلوک دیاگرام قسمت تخمین نویز. 97
شکل 4- 4: بلوک دیاگرام قسمت تخمین نویز و الگوریتم ژنتیک... 97
شکل 4- 5: : بلوک دیاگرام روش پیشنهادی.. 99
شکل 4- 6: بلوک دیاگرام تخمین نویز. 100
شکل 5-1: 1. سیگنال تمیز 2. سیگنال نویزی با(SNR=5db) 3. سیگنال بهبود یافتهاز روش پیشنهادی و4. سیگنال بهبود یافته از روش تفریق طیفی. 104
شکل 5-2: نموداراسپکتوگرام 1. سیگنال تمیز 2. سیگنال نویزی با(SNR=5db) 3. سیگنال بهبود یافتهاز روش پیشنهادی و4. سیگنال بهبود یافته از روش تفریق طیفی. 105
شکل 5-3: SNR سیگنال بهسازی شده نسبت به تغییرات α در روش تفریق طیفی. 105
شکل 5-4: 1. سیگنال تمیز2.سیگنال نویزی با (SNR=5db) 3. سیگنال بهبود یافته از روش پیشنهادی و4.سیگنال بهبود یافته از روش log MMSE. 107
شکل 5-5: نموداراسپکتوگرام 1. سیگنال تمیز 2. سیگنال نویزی با(SNR=5db) 3. سیگنال بهبود یافتهاز روش پیشنهادی و4. سیگنال بهبود یافته از روش logMMSE. 108
 فهرست جدول ها
جدول(5-1) :مقايسه تست شنوایی روشهايروش تخمین زننده لگاریتمی (logmmse) وروش پیشنهادی(wmmse)103
جدول(5-2):مقايسهميانگينSNRروشهايتفريقطيفي موجک(wss) وتفریق طیفی موجک پیشنهادی(gwss)103
جدول(5-4):مقايسه تست شنوایی روشهايروش تخمین زننده لگاریتمی (logmmse) وروش پیشنهادی(wmmse)106
جدول(5-3):مقايسهميانگينSNRروشهايروش تخمین زننده لگاریتمی (logmmse) وروش پیشنهادی(wmmse)106
 لیست علائم و اختصارات
 
CWT
 
Continuous Wavelet Transform
تبدیل موجک پیوسته
DWT
 
Discrete Wavelet Transform
تبدیل موجک گسسته
FFT
Fast Fourier Transform
 
تبدیل فوریه سریع
FB
Feed back
پسخور
FF
Feed forward
پيشخور
FIR
Finite Impulse Response
 
پاسخ ضربه محدود
GA
Genetic Argorithm
الگوریتم ژنتیک
HMM
 
Hide Marcov Model
مدل مخفی مارکوف
IFFT
Inverse Fast Fourier Transform
 
معکوس تبدیل فوریه سریع
IIR
Infinite Impulse Response
 
پاسخ ضربهنامحدود
IWT
Inverse Wavelet Transform
معکوس تبدیل موجک
LPC
 
Linear Prediction coefficient
ضرایب خطی پیش گو
MMSE
Minimum Mean Square Eror filter
فیلتر میانگین مربعات خطا
MOS
Mean Opinion Score
میانگین تست شنوایی
PDF
Probabillty Density Function
تابع چگالی احتمال
SS
Spectral subtraction
تفریق طیفی
SH
Speech Enhancement
بهسازی سیگنال گفتار
SNR
Signal-to-Noise Ratio
نسبت سیگنال به نویز
VAD
Voice Activity Detector
آشکارساز فعال صدا
WT
Wavelet Transform
تبدیل موجک
WSS
Wavelet Spectral subtraction
تفریق طیفی موجک
 1-1 پیشگفتار
با رشد روز افزون استفاده از سیستم های گفتاری درکاربرد های عملی و روزمره، نیاز به حفظ کیفیت گفتار به عنوان امری اجتناب ناپذیر مطرح گردیده است. شرایط ایده ال و عاری از نویزی که در کارها و شبیه سازی های آزمایشگاهی در نظر گرفته می شود، در بسیاری از کاربردهای واقعی، به طور جدی نقض گردیده و برقراری آنها زیر سوال می رود. به عنوان مثال، استفاده ار تلفن همراه، سمعک، سیستم بازشناسی گفتار یا هر وسیله ارتباط گفتاری در یک محیط نویزی، همگی از مواردی است که در آن، حفظ کیفیت گفتار و بالا نگه داشتن کارایی سیستم از اهمیت خاصی برخوردار می باشد؛ بدون استفاده از روش های بهسازی گفتار، عملکرد این سیستم ها به شدت تنزل یافته و چه بسا که غیر قابل قبول خواهد گردید. از این رو، مبحث بهسازی گفتار به عنوان یکی از ضرورت های کاربردی و عملی، از زمینه های فعال تحقیقاتی در سال های اخیر بوده است. در ادامه این فصل به بررسی اجمالی مسايل و مباحث موجود در زمینه بهسازی گفتار می پردازیم.
در قالب یک تعریف کلی، موضوع بهسازی گفتار یاspeechenhancement، عبارتست از تلاش برای بهبود عملکرد سیستم های ارتباط گفتاری در مواردی که سیگنال تحت تاثیرنویز، انعکاس ها و سایر عوامل تخریبی گردیده است.
نیاز به بهسازی گفتار از آنجا ناشی می شود که سیگنال گفتار:
یا: از منبعی تولید می شود که در محیط نویزی قرار دارد،
یا: تحت تاثیر کانال انتشار و در اثرنویز یا انعکاس دچار تخریب می شود،
یا: در گیرنده به نویز آلوده می گردد.
(البته منشاء عوامل تخریبی وارد شونده در مساله می تواند ترکیبی از این سه حالت نیز باشد.)
منظور از بهبود بخشیدن در تعریف فوق را می توان با اشاره به عملکرد اصلاحی فرآیند بهسازی گفتار درنمونه های کاربردی زیر تشریح نمود:
- سیستم های تلفن: در آنها گفتار اصلی به وسیله نویز زمینه یا نویز موجود در مسیر مخابره و نیز در اثر انعکاس صدای طرفین مکالمه، خراب می شود.
- تلفن های عمومی: که در محیط های پر سروصدا و شلوغ واقعند.
- سیستم های مخابرات هوا به زمین: که در آنها نویز اتاقک خلبان، پیام ارسال شده از سوی خلبان را خراب می کند.
- سمعک: که به عنوان تقویت کننده، هم سیگنال گفتار و هم نویز موجود در محیط را تقویت نموده و موجب ناراحتی فرد استفاده کننده می گردد.
- سیستم های باز شناسی گفتار یا گوینده: که معمولا برای سیگنال های تمیز(بدون نویز) آموزش یافته و در شرایط نویزی، با افتی شدید در بازدهی و کارایی مواجه می شود.
- و موارد کاربردی دیگر...

👇 تصادفی👇

نمونه سوالات پودمان روانشناسی و سلامت خانواده -روانشناسی رشد2 + پاسخنامهتحلیل روابط متقابل شهر و روستا در توسعه یافتگیگزارش کارآموزی آشنايي با پرسها و نحوه عملكرد آنهاطرح توجيهي توليد ملامين با ظرفيت 2000 تن در سالکتاب الماس نتراشیده238-تحلیل و طراحی اعضا بتن مسلح تحت برش دو محورهگزارش کارآموزی رشته مهندسی پلیمر – علوم رنگ، ساخت کف پوش های پلیمری شرکت آریا سطح تهرانطرح توجيهي ساخت شناور بابري فايبر گلاستحقیق اسطوره شناسي ✅فایل های دیگر✅

#️⃣ برچسب های فایل بهسازی سیگنال گفتار در حوزه زمان-فرکانس Speech Enhancement in time-ferqency domain

بهسازی سیگنال گفتار در حوزه زمان-فرکانس Speech Enhancement in time-ferqency domain

دانلود بهسازی سیگنال گفتار در حوزه زمان-فرکانس Speech Enhancement in time-ferqency domain

خرید اینترنتی بهسازی سیگنال گفتار در حوزه زمان-فرکانس Speech Enhancement in time-ferqency domain

👇🏞 تصاویر 🏞