👈فول فایل فور یو ff4u.ir 👉

تشخیص گوینده در محیط شامل چند گوینده با استفاده از ماشین بردار پشتیبان word

ارتباط با ما

دانلود


تشخیص گوینده در محیط شامل  چند گوینده با استفاده از ماشین بردار پشتیبان word
فهرست مطالب
فصل اول: معرفی سیستم های تشخیص گوینده
1-1 –مقدمه......2
1-2-مراحل مختلف کاری سیستم های تشخیص گوینده........6
1-2-1- قطعه بند آکوستیکی.....7
1-2-2-تشخیص گفتار از غیر گفتار......8
1-2-3-تشخیص جنسیت گوینده......9
1-2-4-تشخیص تغییر گوینده......9
1-3-روش های بخش بندی و خوشه بندی گویندگان....10
1-3-1-روش­های بر اساس فاصله........10
1-3-2-روش­های بر اساس مدل......11
1-3-3-روش­های هیبرید یا ترکیبی........11
1-4-خوشه بندی نمودن......11
1-5- خلاصه.......12
فصل دوم: تشخیص گفتار از نواحی غیرگفتاری
2-1-مقدمه...........................................................................................................................................................................................................14
2-2-ساختار قسمت تشخیص گفتار از غیر گفتار........................................................................................16
2-2-1-پیش پردازش.................................................................................................................................................................................16
2-2-2-استخراج ویژگی............................................................................................................................................................................17
2-2-2-1-انرژی...................................................................................................................................................................................18
2-2-2-2-نرخ عبور از صفر...............................................................................................................................................................19
2-2-2-3- استخراج ویژگی به کمک ضرایب کپسترال فرکانسی در مقیاس مل.................................................................19
2-2-2-4- ضرایب LPC...........................................................................................................23
2-2-2-5- آنتروپی.............................................................................................................................................................................24
2-2-2-6- اندازه متناوب بودن........................................................................................................................................................26
2-2-2-7- اطلاعات زیر باند.............................................................................................................................................................28
2-2-2-8- سایر پارامترها..................................................................................................................................................................28
 2-2-3- محاسبه آستانه.............................................................................................................................................................................29
2-2-4- تصمیمات VAD..............................................................................................................29
2-2-4-1- تصمیم گیری مبتنی بر مدل مخفی مارکوف..........................................................................................................30
2-2-4-2- تصمیم گیری مبتنی بر شبکه های عصبی...............................................................................................................31
2-2-5- تصحیح نتایج VAD..........................................................................................................33
2-3- بلوک دیاگرام چند VAD استاندارد....................................................................................................................................................33
2-3-1-استانداردETSI AMR........................................................................................................33
2-3-2- الگوریتم GSM...............................................................................................................34
2-4-خلاصه.........................................................................................................................................................................................................35
فصل سوم: آشکارسازی تغییر گوینده
3-1-مقدمه...........................................................................................................................................................................................................37
3-2-بخش بندی گوینده..................................................................................................................................................................................38
3-2-1-بخش بندی بر اساس فاصله.......................................................................................................................................................38
3-2-2-بخش بندی بر اساس مدل........................................................................................................................................................40
3-2-3-بخش بندی هیبرید......................................................................................................................................................................40
3-3-مقایسه روش­های بخش بندی................................................................................................................................................................40
3-4-روش­های متداول آشکارسازی گوینده..................................................................................................................................................41
3-4-1- معیار اطلاعات بیزین( (BIC................................................................................................41
3-4-1-2- بخش بندی با استفاده از مدل آماری گوینده..........................................................................................................42
3-4-2- ترکیب آماره T2وBIC.......................................................................................................45
3-4-2-1- سرعت و بهره بیشتر در بخش بندی T2-BIC........................................................................................................47
3-4-3- فاصله نرخ درستنمایی عمومی((GLR...................................................................................................................................49
3-4-4-فاصله KL2.....................................................................................................................49
3-4-5- آشکارسازی تغییر گوینده با استفاده از DSD.............................................................................51
3-4-6-BIC متقاطع(Cross-BIC (XBIC))……............................................................................................................................52
3-4-7-درستنمایی مدل مخلوط گوسی..(GMM-L) ......................................................................................................................53
3-5-خلاصه.........................................................................................................................................................................................................53
فصل چهارم: روش­های دسته­بندی
4-1-مقدمه...........................................................................................................................................................................................................55
4-2-اجزا سیستم خوشه بندی........................................................................................................................................................................56
4-3-روش های خوشه بندی............................................................................................................................................................................57
4-3-1-روش های خوشه بندی سلسله مراتبی....................................................................................................................................58
4-3-1-1-تکنیک­های خوشه­بندی بالارونده.................................................................................................................................59
4-3-1-2-تکنیک­های خوشه­بندیپایین رونده...........................................................................................................................60
4-3-2-روش های خوشه بندی افرازی..................................................................................................................................................61
4-4- روش های خوشه بندی متداول در سیستم های خوشه بندی گوینده........................................................................................61
4-5- دسته­بندی کننده ماشین­ های بردار پشتیبان...................................................................................................................................63
4-5-1- دسته­بندی کننده­ ماشین بردار پشتیبان خطی....................................................................................................................63
4-5-1-1- دسته­بندی کلاس­های جداپذیر...................................................................................................................................63
4-5-1-2- دسته­بندی کلاس­های جدا ناپذیر...............................................................................................................................68
4-6- خلاصه........................................................................................................................................................................................................74
فصل پنجم: پیاده سازی و مشاهدات سیستم ترکیبی پیشنهادی
5-1-مقدمه...........................................................................................................................................................................................................76
5-2-ساختار سیستم پیاده سازی شده..........................................................................................................................................................77
5-3-پایگاه داده...................................................................................................................................................................................................80
5-4-استخراج ویژگی.........................................................................................................................................................................................82
5-5-معیار ارزیابی سیستم های تشخیص گوینده.......................................................................................................................................84
5-6-نتایج آزمایشات..........................................................................................................................................................................................88
5-6-1-اثر اعمال VAD بر روی سیگنال گفتار.........................................................................................................................................88
5-6-2-اثر تغییر طول پنجره VAD بر روی دقت سیستم......................................................................................................................89
5-6-3- اثر تغییر طول پنجره BIC بر روی نتایج بخش بندی................................................................................................................89
5-6-4-دقت.حاصل.از.بخش.بندی.بر.دو.نوع.از.دادگان با استفاده از MFCC.....................................................................................................93
 5-6-5-اثرتغییر.بردار.ویژگی.بر.روی.دقت.مرحله.بخش بندی................................................................................................................93
5-6-6-مقایسه.نتایج.مرحله.بخش­بندی.با.بکارگیری.بردارهای.ویژگی متفاوت..................................................................................95
5-6-7-اثرجنسیت،گویندگان.برتشخیص.درست.مرزهای.بخش بندی.................................................................................................96
5-6-8-دقت مرحله خوشه­بندی بکارگیری ماشین بردار پشتیبان(SVM) با بردار ویژگی MFCC………..…………96
5-6-9-دقتمرحله خوشه بندی ماشین بردار پشتیبان با بکارگیری بردار ویژگی root-MFCC ............................................................97
5-6-10- اثر تغییر نوع تابع کرنل ماشین بردار پشتیبان بر روی دقت مرحله خوشه­بندی...............................................................98
5-7-خلاصه.........................................................................................................................................................................................................98
فصل ششم: جمع بندی و پیشنهادات
6-1-جمع بندی و خلاصه نتایج.................................................................................................................................................................100
6-2-پیشنهادات...............................................................................................................................................................................................101
 منابع..................................................................................................................................................................................................................103
 فهرست شکل ها
شکل (1-1): نمایش بخش بندی و خوشه بندی گویندگان روی گفتار ورودی......................................................................................4
شکل (1-2): ساختار کلی سیستم های بخش بندی و خوشه بندی گوینده............................................................................................6
شکل(2-1): دیاگرام یک VAD ساده............................................................................................................................................................16
شکل (2-2 ): نمایش پنجره همینگ 512 نقطه ای در حوزه زمان........................................................................................................16
شکل (2-3): شمای کلی سیستم استخراج ویژگی....................................................................................................................................18
شکل (2-4 ): مراحل استخراج ویژگی با روش MFCC............................................................................................................20
شکل (2-5 ): اعمال بانک فیلتر Mel scaled و محاسبه انرژی در هر زیر باند.................................................................................22
شکل ( 2-6 ): شبکه ای از HMM ها جهت بررسی دنباله احتمالی گفتار و سکوت..........................................................................31
شکل (2-7): دیاگرام ساده ای از یک VAD مبتنی برشبکه های عصبی.............................................................................................32
شکل (2-8) : دیاگرام ساده ای از الگوریتم AMR2............................................................................................34
شکل (2-9) : دیاگرام الگوریتم GSM.............................................................................................................35
شکل ( 3-1):پنجره های همسایه....................................................................................................................................................................38
شکل) 3-2(: ترکیب گوسین برای یک سیگنال شامل سکوت/گفتار....................................................................................................39
شکل ) 3-3(:منحنی ها با اعمال متریکT2-statistic.........................................................................................................................46
شکل (4-1): انواع دسته بندی.......................................................................................................................................................................55
شکل (4-2): مراحل خوشه بندی....................................................................................................................................................................56
شکل (4-3): روش های خوشه بندی.............................................................................................................................................................57
شکل (4-4):روشهای خوشه­بندی بالا و پایین رونده.................................................................................................................................58
شکل (4-5): مثال ساده ای از خوشه بندی سلسله مراتبی.......................................................................................................................60
شکل (4-6): یک نمونه از مسئله دو کلاسه خطی جداپذیر که نمونه­ها توسط دو دسته­بندی کننده خطی جدا شده.........64
شکل (4-7): حاشیه برای جهت 2 بیشتر از حاشیه در جهت 1 است....................................................................................................65
شکل (4-8): نمونه­ای از داده­هایی که به صورت خطی به طور کامل از همدیگر جدا نمی­شوند......................................................68
 شکل (4-9 ): نمایش ماشین­ بردار پشتیبان غیر خطی..............................................................................................................................74
شکل (5-1) : بلوک دیاگرام سیستم پیاده سازی شده...............................................................................................................................76
شکل (5-2) : انتقال اطلاعات گفتار با استفاده از یک VAD................................................................................77
شکل (5-3) : دیاگرام الگوریتم G.729B.........................................................................................................79
شکل (5- 4):بلوک دیاگرام بردار ویژگی TDC...................................................................................................83 شکل (5-5): تشخیص خطا در سیستم های تشخیص گوینده.................................................................................................................87
شکل (5- 6): جداسازی قسمت های گفتاری از غیر گفتار.......................................................................................................................88
شکل(5-7 ): اثر تغییر طول پنجره VADبر روی دقت سیستم................................................................................................................89
شکل (5- 8): چگونگی قرار دادن یک آستانه و بعد انتخاب نقاط تغییر گوینده را نمایش میدهد...................................................90
شکل (5- 9): سیگنال گفتاری گوسی مدل شده در مرحله بخش بندی...............................................................................................90
شکل(5-10 ): اثر افزایش طول پنجره BIC بر روی نتیجه مرحله بخش بندی برای 8 نفردادگان فارس دات.....................91
شکل(5-11 ): اثر افزایش طول پنجره BIC بر روی نتیجه مرحله بخش بندی برای 12 نفر دادگان فارس دات.................92
شکل(5- 12): اثر افزایش طول پنجره BIC بر روی نتیجه مرحله بخش بندی برای 18 نفر دادگان فارس دات.................92
شکل(5-13 ):مقایسه میزان خطای سیستم با تغییر بردار ویژگی مورد استفاده..................................................................................95
شکل(5- 14):تاثیر جنسیت بر روی خروجی مرحله بخش بندی سیستم.............................................................................................96
شکل(5- 15): مقایسه نتایج خطای حاصل از خوشه­بندی با تغییر نوع تابع کرنل بکارگرفته شده..................................................98
 فهرست جداول
جدول (5-1): مقادیر خطا برای دادگان تهیه شده فارسی آزمایشگاهی................................................................................................93
جدول (5-2): مقادیر خطا برای دادگان AMI...........................................................................................................................93
جدول (5-3): مقادیر خطا برای تعداد 3 نفر گوینده در دادگان فارس دات.......................................................................................93
جدول (5-4): مقادیر خطا برای تعداد 5 نفر گوینده در دادگان فارس دات.........................................................................................94
جدول (5-5): مقادیر خطا برای تعداد 8 نفر گوینده در دادگان فارس دات.........................................................................................94
جدول (5-6): مقادیر خطا برای تعداد 11 نفر گوینده در دادگان فارس دات......................................................................................94
جدول (5-7): مقادیر خطا برای تعداد 14 نفر گوینده در دادگان فارس دات......................................................................................94
جدول(5-8): مقادیر خطا برای تعداد 17 نفر گوینده در دادگان فارس دات.........................................................................................94
جدول(5-9): مقادیر خطا برای تعداد 20 نفر گوینده در دادگان فارس دات.........................................................95
جدول(5-10 ): خطای حاصل از دسته­بندی با استفاده از ماشین بردار پشتیبان با بکارگیری MFCC..........................................97
جدول(5-11 ): خطای حاصل از دسته­بندی با استفاده از ماشین بردار پشتیبان با بکارگیری root-MFCC................................97
 فصل اول :
معرفی سیستم های
تشخیص گوینده
 1-1-مقدمه
امروزه داده های چند رسانه ای بخش قابل توجهی از دانش انسان را در بر می گیرند. حجم پرونده های چند رسانه ای آرشیو شده در موسسه های مختلف در سال های اخیر افزایش چشمگیری داشته است. دسترسی و وضوح بالای این پرونده ها می تواند کمک شایانی به افرادی کند که در جستجوی اطلاعات باشند. بنابراین عملیات جستجو و بازیابی اطلاعات در این حجم بالا کاری است که خود احتیاج به سیستم کامپیوتری دارد. و درنتیجه یکی از حوزه های تحقیقاتی که به تازگی مورد توجه قرار گرفته است، مربوط به ساختاربندی پرونده- های چند رسانه ای است. در میان این داده ها، اطلاعات صوتی اهمیت بالاتری دارد. زیرا بخش اعظم آرشیوها حاوی داده های صوتی از گزارش های تلویزیونی، رادیویی و همچنین مکالمات تلفنی می باشد. در سالهای اخیر تحقیقات وسیعی در این حوزه آغاز شده و نتایج قابل قبولی نیز حاصل شده است. از دیگر کاربردهای این حوزه در تشخیص مجرم، جدا کردن صحبت های مهم یک شاهد یا متهم در دادگاه و ... میتوان اشاره نمود.
در کاربرد صوتی، عمده اطلاعات موجود در پرونده ها، صحبت های تعدادی گوینده است و هدف از سیستم نهایی، پاسخ به این سوال است که چه کسی در چه زمانهایی صحبت کرده است؟ بخش های مختلف این حوزه تحقیقاتی به نامهای مختلفی مانند: قطعه بند گوینده ای[1]، تشخیص گوینده[2] ،رونویسی قوی[3]، و اندیس گذاری گوینده ای[4] نامیده شده اند. از چنین سیستم هایی برای جابجایی راحت در داده های صوتی، در فایل های صوتی طولانی (مانند: اخبار و ملاقات ها و جلسات یک شرکت و ...) که متعلق به چند گوینده باشند بهره- برداری می شود. مکالمات و محاسبات رادیویی طولانی از محیط هایی هستند که در آنها چند گوینده حضور داشته و با هم صحبت می کنند. هدف نهایی چنین سیستم هایی، پیاده سازی روش هایی مناسب برای افراز پرونده صوتی به نواحی است که در آنها گوینده ای خاص صحبت کرده باشد. دسترسی راحت به بخش هایی از صحبت یک گوینده توسط این سیستم فراهم می گردد. با داشتن حجم بالایی از داده های صوتی اهمیت این سیستم ها بیشتر می گردد.
با افزایش تعداد مدارک متنی موجود در اینترنت، نیاز به تکنیک هایی نظیر فهرست نگاری متن به منظور تسهیل دسترسی و جستجو در این مدارک افزایش پیدا کرد. نظیر همین نیاز نیز با افزایش تعداد مدارک صوتی نظیر سخنرانی ها، مصاحبه ها و گردهمایی ها و ... ایجاد شد. بطور مشخص دسترسی به مدارک صوتی بسیار سخت تر از دسترسی به متن است و گوش دادن به یک فایل صوتی ضبط شده بیشتر از خواندن متن زمان بر است و فهرست نگاری دستی مدارک صوتی در مقایسه با فهرست نگاری متن، مشکل است. راه حل پیشنهادی جهت رفع این مشکل، فهرست نگاری خودکار مدارک صوتی[5] است.

👇 تصادفی👇

تئاتر سیاسیترجمه فارسی مقاله "Study of Diffusion Models in an Academic Social Network"(مطالعه و بررسي مدل هاي انتشار در شبكه اجتماعي آكادميك)دانلود پاورپوینت ارزش گذاریتحقیق تاثیر صاعقه بر خط انتقال و اضافه ولتاژ آنطرح لایه باز (PSD) بنر خیر مقدم کربلا شماره 12تحقیق درباره انواع هورمونهاطرح توجیهی بازیافت آلیاژاسکنر PDF اندروید ✅فایل های دیگر✅

#️⃣ برچسب های فایل تشخیص گوینده در محیط شامل چند گوینده با استفاده از ماشین بردار پشتیبان word

تشخیص گوینده در محیط شامل چند گوینده با استفاده از ماشین بردار پشتیبان word

دانلود تشخیص گوینده در محیط شامل چند گوینده با استفاده از ماشین بردار پشتیبان word

خرید اینترنتی تشخیص گوینده در محیط شامل چند گوینده با استفاده از ماشین بردار پشتیبان word

👇🏞 تصاویر 🏞