فهرست مطالب عنوانصفحهمقدمه1فصل اول- مروری بر روش هاي عمده بهسازي گفتار1-1- مباني توليد سيگنال گفتار.........31-2- مفاهيم بهسازي گفتار.........71-3- کاربردهاي عمده بهسازي گفتار.......81-4- طبقه بندي روش هاي بهسازی گفتار.........91-4-1- کاهش نويز با استفاده از خاصيت تناوبي گفتار.......111-4-2- بهسازي گفتار بر اساس مدل.......121-4-3- تکنيک هاي مبتنی بر دامنه طيفي زمان-کوتاه......131-4-4- روش هاي مبتني بر آستانه گذاري روي ضرايب موجک..........151-4-5- حذف وفقی نويز................16فصل دوم- مروری بر روش هاي تفريق طيفي2-2-1- تفريق طيفي.............................................................................................................192-2- تعميم روش هاي تفريق طيفي.................................................................................212-3- مقادير طيفي منفي....................................................................................................232-4- اطلاحات روي تفريق طيفي.....................................................................................242-4-1- متوسط گيري اندازه.............................................................................................242-4-2- تعميم تفريق طيفي...............................................................................................252-4-3- تفريق طيفي با استفاده از كف طيفي و تفريق بيش از حد...................................252-4-4- تفريق طيفي با تخمين گر MMSE STSA..........................................................272-4-5- تفريق طيفي بر مبناي ويژگي هاي ادراكي...........................................................282-4-6- روش هاي تفريق طيفي وابسته به فركانس..........................................................292-4-7- تفريق طيفي چند باند..........................................................................................302-4-7-1- پيش پردازش..................................................................................................322-4-7-2- شرح تفريق طيفي چند باند.............................................................................34فصل سوم- آشنائی با تجزيه مقادير منفرد و الگوريتم های VAD3-3-1- تجزيه مقادير منفرد..................................................................................................383-2- رابطه بين تجزيه مقادير منفرد و تجزيه مقادير ويژه.................................................393-3- مقادير ويژه و بردارهای ويژه...................................................................................403-3-1- روش يافتن مقادير ويژه.................................................... .................................403-3-2- مقادير ويژه مختلط..............................................................................................423-3-3- مقادير ويژه ماتريس های مثلثی و قطری.............................................................433-3-4- مقادير ويژه ماتريس های هم خانواده با A ........................................................443-3-5- رابطه بين مقادير ويژه ماتريس های AB و BA................................................453-3-6- تعيين چند جمله ای مشخصه يک ماتريس.........................................................473-3-6-1- روش کريلف .............................................................................................473-3-6-2- روش لوريير....................................................................................................493-3-6-3- روش ضرايب نامعين......................................................................................503-3-7- روش های تبديلی در يافتن مقادير ويژه..............................................................523-3-7-1- روش ژاکوبی..................................................................................................523-3-7-2- روش گيونز.....................................................................................................543-3-7-3- روش هاوس هلدر..........................................................................................553-3-8- روش های مبتنی بر تجزيه ماتريس برای يافتن مقادير ويژه................................573-3-8-1- روش LR برای يافتن مقادير ويژه.................................................................573-3-8-2- روش QR برای يافتن مقادير ويژه.................................................................603-4- کاربرد های تجزيه مقادير منفرد...............................................................................623-4-1- کاربرد تجزيه مقادير منفرد در پردازش سيگنال...................................................633-5- الگوريتمهايتشخيصنواحيسكوتو صدادار و بي صدا..................................643-5-1- تشخيص قسمت هاي سكوت با استفاده از قدرمطلق اندازه................................653-5-2- روش نرخ عبور از صفر......................................................................................663-5-3- روش های حوزه ی فرکانس...............................................................................673-5-4- روش کدينگ پيشگويی خطی(LPC).................................................................683-5-5- استفاده از تبديل بسته موجك باز در تشخيص فريم هاي سكوت......................70فصل چهارم- استفاده از تجزيه مقادير منفرد در روش تفريق طيفي4-4-1- استفاده از تجزيه مقادير منفرد در روش تفريق طيفي (روش SVSS)....................744-1-1- قسمت تخمين نويز.............................................................................................754-1-2- فيلترکردنمقاديرمنفرد.......................................................................................764-1-2-1- تعيينآستانهدرفريمسکوت..........................................................................804-1-2-2- تعيينآستانهدرفريمبي صدا و صدا دار........................................................804-1-3- قسمت تفريق طيفي.............................................................................................854-2- تفريق طيفي با استفاده از SVD و الگوريتم هاي VADو V/UV detector.....854-3- تفريق طيفي چند بانده با استفاده از SVD و الگوريتم هايVADوV/UV detector(SVMBSS)................................................................................................86فصل پنجم- نتايج پياده سازي و ارزيابي5-5-1- معيار هاي سنجش...................................................................................................895-1-1- نسبت سيگنال به نويز..........................................................................................895-1-2- اسپكتروگرام (طيف نگاره)..................................................................................895-1-2-1- طراحي اسپكتروگرام.......................................................................................925-1-2-2- نحوه توزيع مقادير در اسپكتروگرام................................................................955-1-3- تست شنوائي.......................................................................................................975-2- بررسي و مقايسه نتايج حاصله.................................................................................975-2-1- تست شنوائي.......................................................................................................104فصل ششم- جمعبندي و نتيجهگيري6-6-1- جمعبندي و نتيجهگيري .........................................................................................108 فهرست جداول عنوانصفحهجدول 1-1- تکنيکهايمختلفغنیسازيگفتار.....................................................................10جدول 4-1-مقادير بهينه درصد انرژی ...................................................................................83جدول 5-1- نتايج غني سازي سيگنال گفتار آلوده به نويز سفيد گوسي توسط روش هاي PSS، SVPSS، MBSS وSVMBSS...................................................................................... 103جدول 5-2- نمره کيفيت شنيدن نويز...........................................................................................105جدول 5-3- نتايج تست شنوائي غني سازي سيگنال گفتار آلوده به نويز سفيد گوسي توسط چهار روش PSS، SVPSS، MBSS وSVMBSS.................................................................... 107 فهرست اشکال عنوانصفحهشکل 1-1- برشعرضیسيستمصوتیانسان..............................................................................4شکل 1-2- مدلزمانگسستهعمومیبرايتوليدسيگنالگفتار..................................................5شکل 1-3- حرفبیصدا s.........................................................................................................6شکل 1-4- حروفصدادار e.......................................................................................................6شکل 1-5- تبديلفوريهحرفبیصداي s.................................................................................6شکل 1-6- تبديلفوريهحرفصدادار e....................................................................................7شکل 1-7- بلوكدياگراميکسيستمبهسازيمبتنیبرخاصيتتناوبیگفتار.............................11شکل 1-8- بلوكدياگراميکسيستمغنیسازمبتنیبردامنهطيفیزمان - کوتاه.......................13شکل 1-9- بلوكدياگرامالگوريتمحذفنويزدرحوزهموجک.................................................15شکل 1-10- دياگرامکلیسيستمحذفکنندهوفقینويز............................................................17شکل 2-1-بلوكدياگرامتفريقطيفیتوان (PSS).....................................................................23شکل 2-2- بلوكدياگرامتفريقطيفیتعميميافته (GSS)..........................................................23شکل 2-3- نمودار تعيين از روي SNR (با فرض )................................................26شکل 2-4- SNR هاي مقطعي براي 4 باند فركانسي گفتار نويزي...............................................32شکل 3-1- نمودار اندازه يك سيگنال صوتي بر حسب زمان.......................................................66شکل 3-2- بلوكدياگرامآناليزكپسترال.......................................................................................68شکل 3-3- ميزانخطايخروجيفيلترمعكوسLPC بهازايحروفصداداروبيصدا........69شکل 3-4- مرزتصميم برای جداسازی قسمت های صدادار سيگنال..........................................72شکل 4-1- بلوك دياگرام کلی روش ارائه شده SVD-Spectral Subtraction(SVSS).......75شکل 4-2- فريم بی صدا در حوزه زمان.......................................................................................77شکل 4-3- فريم صدا دار در حوزه زمان......................................................................................78شکل 4-4- خود همبستگی در فريم سکوت آغشته به نويز........................................................78شکل 4-5- خود همبستگی در فريم بی صدا................................................................................79شکل 4-6- خود همبستگی در فريم صدا دار...............................................................................79شکل 4-7- مقايسه مقادير منفرد فريم های بی صدا و صدا دار ...................................................79شکل 4-8- مقادير منفرد فريم سكوت نويزي...............................................................................81شکل 4-9- مقادير منفرد فريم صدا دار (الف) تميز (ب) نويزي با SNR=10 db.................82شکل 4-10- مقادير منفرد فريم بي صدا (الف) تميز (ب) نويزي با SNR=10 db.................82شکل 4-11- بلوك دياگرام روش بدست آوردن مقادير بهينه آستانه.............................................83شکل 5-1- هيستوگرام مقادير فرکانسي........................................................................................96شکل 5-2- نتايج غني سازي سيگنال گفتار آغشته به نويز سفيد گوسي بصورت حالت گذرا......99شکل 5-3- نتايج غني سازي سيگنال گفتار آغشته به نويز سفيد گوسي بصورت طيف نگاره......100شکل 5-4- نتايج غني سازي سيگنال گفتار آغشته به نويز سفيد گوسي بصورت حالت گذرا......101شکل 5-5- نتايج غني سازي سيگنال گفتار آغشته به نويز سفيد گوسي بصورت طيف نگاره......102شکل 5-6- متوسط غني سازي ده سيگنال گفتار مختلف آلوده به نويز سفيد گوسي توسط چهار روش PSS، SVPSS، MBSS وSVMBSS............................................................................. 104شکل 5-7- نتايج تست شنوائي غني سازي سيگنال گفتار آلوده به نويز سفيد گوسي توسط چهار روش PSS، SVPSS، MBSS وSVMBSS.................................................................... 106 مقدمه:با رشد روز افزون استفاده از سيستم هاي گفتاري در كاربردهاي عملي روزمره، نياز به حفظ كيفيت گفتار به عنوان امري اجتناب ناپذير مطرح شده است. شرايط ايده آل و عاري از نويز كه در كارها و شبيه سازي هاي آزمايشگاهي در نظر گرفته مي شود، در بسياري از كاربردهاي واقعي به طور جدي نقض گرديده و برقراري آنها زير سئوال رفته است. به عنوان مثال استفاده از تلفن همراه، سمعك، سيستم بازشناسي گفتار[1] و يا هر وسيله ارتباط گفتاري در يك محيط نويزي ، همگي از مواردي است كه در آن حفظ كيفيت گفتار و بالا نگه داشتن کارايي سيستم، از اهميت خاصي برخوردار است. بدون استفاده از روش هاي بهسازي گفتار[2]، عملکرد اين سيستم ها به شدت تنزل يافته و چه بسا كه غير قابل قبول مي شود. از اين رو، مبحث بهسازي گفتار به عنوان يكي از ضرورت هاي كاربردي و عملي، از زمينه هاي فعال تحقيقاتي در سال هاي اخير بوده است. فرضیات پایان نامه:كليه روش هاي شرح داده شده در پاياننامه و نيز كليه روابط حاكم بر آنها، برمبناي سه فرض اساسي ذيل استوار ميباشند.- نويز به سيگنال اضافه مي شود.
غنی سازی سیگنال گفتار مبتنی بر روش تفریق طیفی و تجزیه مقادیر منفرد word
فهرست مطالب عنوانصفحهمقدمه1فصل اول- مروری بر روش هاي عمده بهسازي گفتار1-1- مباني توليد سيگنال گفتار.........31-2- مفاهيم بهسازي گفتار.........71-3- کاربردهاي عمده بهسازي گفتار.......81-4- طبقه بندي روش هاي بهسازی گفتار.........91-4-1- کاهش نويز با استفاده از خاصيت تناوبي گفتار.......111-4-2- بهسازي گفتار بر اساس مدل.......121-4-3- تکنيک هاي مبتنی بر دامنه طيفي زمان-کوتاه......131-4-4- روش هاي مبتني بر آستانه گذاري روي ضرايب موجک..........151-4-5- حذف وفقی نويز................16فصل دوم- مروری بر روش هاي تفريق طيفي2-2-1- تفريق طيفي.............................................................................................................192-2- تعميم روش هاي تفريق طيفي.................................................................................212-3- مقادير طيفي منفي....................................................................................................232-4- اطلاحات روي تفريق طيفي.....................................................................................242-4-1- متوسط گيري اندازه.............................................................................................242-4-2- تعميم تفريق طيفي...............................................................................................252-4-3- تفريق طيفي با استفاده از كف طيفي و تفريق بيش از حد...................................252-4-4- تفريق طيفي با تخمين گر MMSE STSA..........................................................272-4-5- تفريق طيفي بر مبناي ويژگي هاي ادراكي...........................................................282-4-6- روش هاي تفريق طيفي وابسته به فركانس..........................................................292-4-7- تفريق طيفي چند باند..........................................................................................302-4-7-1- پيش پردازش..................................................................................................322-4-7-2- شرح تفريق طيفي چند باند.............................................................................34فصل سوم- آشنائی با تجزيه مقادير منفرد و الگوريتم های VAD3-3-1- تجزيه مقادير منفرد..................................................................................................383-2- رابطه بين تجزيه مقادير منفرد و تجزيه مقادير ويژه.................................................393-3- مقادير ويژه و بردارهای ويژه...................................................................................403-3-1- روش يافتن مقادير ويژه.................................................... .................................403-3-2- مقادير ويژه مختلط..............................................................................................423-3-3- مقادير ويژه ماتريس های مثلثی و قطری.............................................................433-3-4- مقادير ويژه ماتريس های هم خانواده با A ........................................................443-3-5- رابطه بين مقادير ويژه ماتريس های AB و BA................................................453-3-6- تعيين چند جمله ای مشخصه يک ماتريس.........................................................473-3-6-1- روش کريلف .............................................................................................473-3-6-2- روش لوريير....................................................................................................493-3-6-3- روش ضرايب نامعين......................................................................................503-3-7- روش های تبديلی در يافتن مقادير ويژه..............................................................523-3-7-1- روش ژاکوبی..................................................................................................523-3-7-2- روش گيونز.....................................................................................................543-3-7-3- روش هاوس هلدر..........................................................................................553-3-8- روش های مبتنی بر تجزيه ماتريس برای يافتن مقادير ويژه................................573-3-8-1- روش LR برای يافتن مقادير ويژه.................................................................573-3-8-2- روش QR برای يافتن مقادير ويژه.................................................................603-4- کاربرد های تجزيه مقادير منفرد...............................................................................623-4-1- کاربرد تجزيه مقادير منفرد در پردازش سيگنال...................................................633-5- الگوريتمهايتشخيصنواحيسكوتو صدادار و بي صدا..................................643-5-1- تشخيص قسمت هاي سكوت با استفاده از قدرمطلق اندازه................................653-5-2- روش نرخ عبور از صفر......................................................................................663-5-3- روش های حوزه ی فرکانس...............................................................................673-5-4- روش کدينگ پيشگويی خطی(LPC).................................................................683-5-5- استفاده از تبديل بسته موجك باز در تشخيص فريم هاي سكوت......................70فصل چهارم- استفاده از تجزيه مقادير منفرد در روش تفريق طيفي4-4-1- استفاده از تجزيه مقادير منفرد در روش تفريق طيفي (روش SVSS)....................744-1-1- قسمت تخمين نويز.............................................................................................754-1-2- فيلترکردنمقاديرمنفرد.......................................................................................764-1-2-1- تعيينآستانهدرفريمسکوت..........................................................................804-1-2-2- تعيينآستانهدرفريمبي صدا و صدا دار........................................................804-1-3- قسمت تفريق طيفي.............................................................................................854-2- تفريق طيفي با استفاده از SVD و الگوريتم هاي VADو V/UV detector.....854-3- تفريق طيفي چند بانده با استفاده از SVD و الگوريتم هايVADوV/UV detector(SVMBSS)................................................................................................86فصل پنجم- نتايج پياده سازي و ارزيابي5-5-1- معيار هاي سنجش...................................................................................................895-1-1- نسبت سيگنال به نويز..........................................................................................895-1-2- اسپكتروگرام (طيف نگاره)..................................................................................895-1-2-1- طراحي اسپكتروگرام.......................................................................................925-1-2-2- نحوه توزيع مقادير در اسپكتروگرام................................................................955-1-3- تست شنوائي.......................................................................................................975-2- بررسي و مقايسه نتايج حاصله.................................................................................975-2-1- تست شنوائي.......................................................................................................104فصل ششم- جمعبندي و نتيجهگيري6-6-1- جمعبندي و نتيجهگيري .........................................................................................108 فهرست جداول عنوانصفحهجدول 1-1- تکنيکهايمختلفغنیسازيگفتار.....................................................................10جدول 4-1-مقادير بهينه درصد انرژی ...................................................................................83جدول 5-1- نتايج غني سازي سيگنال گفتار آلوده به نويز سفيد گوسي توسط روش هاي PSS، SVPSS، MBSS وSVMBSS...................................................................................... 103جدول 5-2- نمره کيفيت شنيدن نويز...........................................................................................105جدول 5-3- نتايج تست شنوائي غني سازي سيگنال گفتار آلوده به نويز سفيد گوسي توسط چهار روش PSS، SVPSS، MBSS وSVMBSS.................................................................... 107 فهرست اشکال عنوانصفحهشکل 1-1- برشعرضیسيستمصوتیانسان..............................................................................4شکل 1-2- مدلزمانگسستهعمومیبرايتوليدسيگنالگفتار..................................................5شکل 1-3- حرفبیصدا s.........................................................................................................6شکل 1-4- حروفصدادار e.......................................................................................................6شکل 1-5- تبديلفوريهحرفبیصداي s.................................................................................6شکل 1-6- تبديلفوريهحرفصدادار e....................................................................................7شکل 1-7- بلوكدياگراميکسيستمبهسازيمبتنیبرخاصيتتناوبیگفتار.............................11شکل 1-8- بلوكدياگراميکسيستمغنیسازمبتنیبردامنهطيفیزمان - کوتاه.......................13شکل 1-9- بلوكدياگرامالگوريتمحذفنويزدرحوزهموجک.................................................15شکل 1-10- دياگرامکلیسيستمحذفکنندهوفقینويز............................................................17شکل 2-1-بلوكدياگرامتفريقطيفیتوان (PSS).....................................................................23شکل 2-2- بلوكدياگرامتفريقطيفیتعميميافته (GSS)..........................................................23شکل 2-3- نمودار تعيين از روي SNR (با فرض )................................................26شکل 2-4- SNR هاي مقطعي براي 4 باند فركانسي گفتار نويزي...............................................32شکل 3-1- نمودار اندازه يك سيگنال صوتي بر حسب زمان.......................................................66شکل 3-2- بلوكدياگرامآناليزكپسترال.......................................................................................68شکل 3-3- ميزانخطايخروجيفيلترمعكوسLPC بهازايحروفصداداروبيصدا........69شکل 3-4- مرزتصميم برای جداسازی قسمت های صدادار سيگنال..........................................72شکل 4-1- بلوك دياگرام کلی روش ارائه شده SVD-Spectral Subtraction(SVSS).......75شکل 4-2- فريم بی صدا در حوزه زمان.......................................................................................77شکل 4-3- فريم صدا دار در حوزه زمان......................................................................................78شکل 4-4- خود همبستگی در فريم سکوت آغشته به نويز........................................................78شکل 4-5- خود همبستگی در فريم بی صدا................................................................................79شکل 4-6- خود همبستگی در فريم صدا دار...............................................................................79شکل 4-7- مقايسه مقادير منفرد فريم های بی صدا و صدا دار ...................................................79شکل 4-8- مقادير منفرد فريم سكوت نويزي...............................................................................81شکل 4-9- مقادير منفرد فريم صدا دار (الف) تميز (ب) نويزي با SNR=10 db.................82شکل 4-10- مقادير منفرد فريم بي صدا (الف) تميز (ب) نويزي با SNR=10 db.................82شکل 4-11- بلوك دياگرام روش بدست آوردن مقادير بهينه آستانه.............................................83شکل 5-1- هيستوگرام مقادير فرکانسي........................................................................................96شکل 5-2- نتايج غني سازي سيگنال گفتار آغشته به نويز سفيد گوسي بصورت حالت گذرا......99شکل 5-3- نتايج غني سازي سيگنال گفتار آغشته به نويز سفيد گوسي بصورت طيف نگاره......100شکل 5-4- نتايج غني سازي سيگنال گفتار آغشته به نويز سفيد گوسي بصورت حالت گذرا......101شکل 5-5- نتايج غني سازي سيگنال گفتار آغشته به نويز سفيد گوسي بصورت طيف نگاره......102شکل 5-6- متوسط غني سازي ده سيگنال گفتار مختلف آلوده به نويز سفيد گوسي توسط چهار روش PSS، SVPSS، MBSS وSVMBSS............................................................................. 104شکل 5-7- نتايج تست شنوائي غني سازي سيگنال گفتار آلوده به نويز سفيد گوسي توسط چهار روش PSS، SVPSS، MBSS وSVMBSS.................................................................... 106 مقدمه:با رشد روز افزون استفاده از سيستم هاي گفتاري در كاربردهاي عملي روزمره، نياز به حفظ كيفيت گفتار به عنوان امري اجتناب ناپذير مطرح شده است. شرايط ايده آل و عاري از نويز كه در كارها و شبيه سازي هاي آزمايشگاهي در نظر گرفته مي شود، در بسياري از كاربردهاي واقعي به طور جدي نقض گرديده و برقراري آنها زير سئوال رفته است. به عنوان مثال استفاده از تلفن همراه، سمعك، سيستم بازشناسي گفتار[1] و يا هر وسيله ارتباط گفتاري در يك محيط نويزي ، همگي از مواردي است كه در آن حفظ كيفيت گفتار و بالا نگه داشتن کارايي سيستم، از اهميت خاصي برخوردار است. بدون استفاده از روش هاي بهسازي گفتار[2]، عملکرد اين سيستم ها به شدت تنزل يافته و چه بسا كه غير قابل قبول مي شود. از اين رو، مبحث بهسازي گفتار به عنوان يكي از ضرورت هاي كاربردي و عملي، از زمينه هاي فعال تحقيقاتي در سال هاي اخير بوده است. فرضیات پایان نامه:كليه روش هاي شرح داده شده در پاياننامه و نيز كليه روابط حاكم بر آنها، برمبناي سه فرض اساسي ذيل استوار ميباشند.- نويز به سيگنال اضافه مي شود.