چکیده
در بیشتر محیط های زندگی نویزهای مختلفی حضور دارد که داده های صوتی را تخریب می کند. یکی از مباحث مهم در پردازش سیگنال، حذف سیگنال های ناخواسته و یا نویز از سیگنال اصلی است. روش های بسیاری برای حذف نویز از سیگنال گفتار پیشنهاد شده است. حذف نویز از سیگنال گفتار از اهمیت بالایی برخوردار است زیرا اولا قابلیت فهم سیگنال گفتار را بالا می برد و ثانیا باعث افزایش راندمان سیستم های شناسایی گفتار و گوینده خواهد شد. در این پروژه از روش تفاضل طیفی یا تفریق طیفی استفاده می کنیم و با استفاده از این روش نویز را کاهش می دهیم تا سیگنال شنیداری گفتار بازسازی شده بهبود یابد. در واقع الگوریتم تفاضل طیف یکی از قدیمی ترین و مشهورترین روش های بهسازی سیگنال گفتار است که برای بازیابی طیف توان سیگنال آلوده به نویز استفاده می شود. این روش طیف توان نویز تخمین زده شده را از طیف توان سیگنال نویزی کم کرده و سیگنال بهسازی شده را تولید می کند. در روش تفاضل طیفی، تخمین اندازه طیف توان نویز با استفاده از نواحی سکوت و از طریق میانگین گیری اندازه طیف توان نویز در پنجره های مختلف این نواحی انجام می شود. اساسی ترین مشکل این روش وجود نویزی آزار دهنده بنام نویز موزیکال در سیگنال بهسازی شده است که دلیل اصلی آن عدم دقت در تخمین طیف نویز است.
می دانیم که عواملی مانند طول فریم و... روی دقت تخمین طیف نویز موثر هستند و به طور خاص اثر آن بر روی نویز موزیکال ایجاد شده مورد مطالعه قرار می گیرد. بررسی آزمایشات انجام شده در مقالات که در مراجع نیز آورده شده اند نشان می دهند که هر چقدر طول فریم کمتر باشد و به عبارتی پنجره کوتاه تر باشد به علت کانوالو شدن طیف گفتار و طیف پنجره، طیف سیگنال گفتار نیز به این طریق خراب خواهد شد. همه عوامل فوق ما را به این سمت سوق می دهند که طول فریم را بزرگ انتخاب کنیم. بزرگتر گرفتن طول فریم دقت تخمین طیف نویز را افزایش داده و بنابراین موجب کاهش نویز موزیکال و افزایش کیفیت سیگنال شنیداری بهسازی شده می گردد و ثانیأ اگر دقت تخمین طیف بیشتر باشد می توان در روش تفریق طیفی،ضریب تفریق را بزرگتر انتخاب کرده و مقدار بهبود SNR را افزایش داد.
در الگوریتم تفریق طیفی اگر تخمین ما از طیف نویز درست نباشد، با افزایش ضریب تفریق مقدار نویز موزیکال به شدت افزایش می یابد. در این پروژه برای سادگی کار و عدم نیاز به VAD از فایل های گفتاری استفاده می کنیم که حدودا یک ثانیه سکوت در ابتدای خود داشته باشند و از این یک ثانیه سکوت همان طور که در بالا توضیح داده شد برای تخمین طیف نویز استفاده می کنیم.
نتایج پیاده سازی این پروژه بر روی سیگنال های مختلف با نسبت سیگنال به نویز های (SNR) متفاوت بیان خواهد شد و در ادامه کارایی ضعیف روش تفاصل طیفی در حضور سیگنال های نویزی با نویز غیر ایستان (همهمه) نیز بیان می شود.
فهرست مطالب:
فصل اول: مقدمه
1-1- مقدمه ای بر حذف نویز سیگنال گفتار
2-1- حذف نویز سیگنال گفتار با استفاده از روش تفاضل طیفی
3-1- معرفی فصل ها و ساختار کلی پروژه
فصل دوم: مفاهیم و روابط مربوط به پردازش گفتار
1-2- مقدمه
2-2- ویژگی ها و مفاهیم اصلی گفتار
3-2- معرفی نویزهای محیط
4-2- معیارهای ارزیابی کیفیت و بهبود گفتار
فصل سوم: مفاهیم اصلی در رابطه با سیگنال های دیجیتال
1-3- مقدمه
2-3- فیلترهای دیجیتال و پنجره ها
3-3- توابع پنجره ای
4-3- معرفی بعضی از تبدیل های فوریه گسسته
فصل چهارم: بهسازی گفتار و روس های آن
1-4- مقدمه
2-4- روش های تک کاناله
فصل پنجم: پیاده سازی
1-5- مقدمه
2-5- آزمایش اول
3-5- آزمایش دوم
4-5- آزمیش سوم
ضمیمه الف: M-File آزمایش اول
ضمیمه ب: M-File آزمایش دوم
ضمیمه ج: M-File آزمایش سوم
ضمیمه د: M-File تخمین طیف نویز
ضميمه ه: M-file استفاده از روش تفریق طیفی برای کاهش نویز از سیگنال نویزی
ضميمه و: M-fileمحاسبه SNR سیگنال بعد از عملیات بهسازی
ضميمه ز: M-fileتولید سیگنال نویزی
فهرست مراجع
واژه نامه انگلیسی به فارسی
واژه نامه فارسی بب انگلیسی