Abstract
Difference between Hausdorff fractal dimensions of phonemes gave us a motivation to use this feature as input of a statistical Bayesian classification system and a nearest neighborhood (NN) classifier for speech waveform recognition. We divide phoneme waveforms to adjacent segments and calculate Hausdorff fractal dimension of each segment and using them as the input of a Bayesian/Nearest Neighborhood classifier. The power point of algorithm is in consideration of order of samples information in contrast of other non-supervised feature extraction algorithms
چکیده
تفاوتی که بین ابعاد فرکتال هاسدوروف در یک واج وجود دارد، ما را بر آن داشت که از این ویژگی به عنوان یک سیستم دسته بندی بایسان آماری و دسته بند نزدیک ترین همسایه(NN) استفاده کرده تا بتوانیم شکل موج در یک گفتار را تشخیص دهیم. ما شکل های موج یک واج را به بخش های مجاوری تقسیم کرده و بعد فرکتال هاسدوروفِ مربوط به هر بخش را محاسبه کرده و از آن به عنوان یک ورودی برای دسته بند نزدیک ترین/بایسان همسایه استفاده میکینم. نقطه ی مثبت این الگوریتم این بوده که بر خلاف سایر الگوریتم های استخراج ویژگی غیر نظارت یافته ، از اطلاعات نمونه استفاده میکند.
1-مقدمه
دسته بندی سیگنال های صوتی از کاربرد های بسیار زیادی در حوزه های پژوهشی مختلف اعم از کاوش همه پخشی، تحلیل محتوای صوتی و بازیابی اطلاعات برخوردار است. اگرچه پردازش گفتار در سال های زیادی است که مورد توسعه قرار گرفته است، ولی هنوز مسائلی اعم از فاکتور های انسانی و محیطی در آن وجود داشته که باید حل و فصل گردد. امروزه از مدل های گفتاری متنوعی در دامنه های مختلفی مانند تشخیص گوینده، تشخیص واج، رمز گذاری گفتار و ... به منظور بدست آوردن پارامتر های مورد نیاز برای تحلیل سیگنال صوتی استفاده میشود...