آموزش پردازش دیجیتال گفتار با MATLAB
در این بخش دانلود رایگان کتاب آموزش پردازش دیجیتال گفتار با نرم افزار متلب را به صورت فایل PDF با عنوان انگلیسی Digital Speech Processing Using MATLAB آماده کردیم که در قالب 188 صفحه و 4 فصل در سال 2014 به زبان انگلیسی تهیه شده است. در ادامه به چیکیده و فهرست مطالب این کتاب پردازش گفتار پرداخته و لینک دانلود رایگان آن قرار داده شده است.
پردازش دیجیتالی صوت و گفتار
بکارگیری گفتار یا تشخیص الگوی گوینده، امروزه در اکثر کاربرد های پردازش دیجیتالی صوت دیده می شود. به منظور درک چگونگی پیاده سازی عملی تکنیک های تشخیص الگوی گفتار، افراد نیازمند آشنایی با مفاهیم پردازش دیجیتال گفتار و همینطور مفاهیم تشخیص الگو هستند. در این کتاب آموزش پردازش دیجیتال گفتار ، علاقمندان با مفاهیم فوق به خوبی آشنا خواهند شد.
مباحث مطرح شده در این کتاب
مباحثی مثل مدل تولید گفتار، استخراج ویژگی گفتار، فشرده سازی گفتار و همینطور تکنیک های تشخیص الگویی همچون روش PCA ، روش LDA ، روش ICA ، روش SVM ، روش HMM و غیره در این کتاب پردازش گفتار تشریح شده اند. همینطور همه مباحث پوشش داده شده به کمک نرم افزار متلب به تصویر کشیده شده اند تا علاقمندان در این زمینه عمیقا مطالب را درک کرده و یاد بگیرند.
فهرست سرفصل های کتاب آموزش پردازش دیجیتال گفتار با متلب
فصل اول: تشخیص الگو برای تشخیص گفتار
- مقدمه
- شبکه عصبی پس انتشار خطا (back propagation – BP)
- الگوریتم پس انتشار خطا
- تصویر سازی از شبکه عصبی مصنوعی (ANN)
- الگوریتم ماشین بردار پشتیبان (SVM)
- حل مشکل دوگانه
- ترفند جداسازی غیرخطی در الگوریتم SVM
- تصویر سازی برای الگوریتم SVM
- الگوریتم مدل مخفی مارکوف (HMM)
- روش Baum-Welch برای به دست آوردن پارامترهای ناشناخته در الگوریتم HMM
- مراحل محاسبه پارامترهای ناشناخته در HMM با استفاده از الگوریتم به حداکثر رساندن انتظار
- الگوریتم ویتربی (Viterbi) برای محاسبه احتمال تولید بخش صوتی خودسرانه
- شناسایی جداگانه با استفاده از HMM
- روش تطبیق برای مدل HMM
- تصویر سازی از مدل مخفی مارکوف (HMM)
- مدل ترکیبی گاوسین (Gaussian)
- مراحل مربوط به مدل GMM با استفاده از الگوریتم به حداکثر رساندن انتظار
- شناسایی جداگانه با استفاده از روش GMM
- تصویر سازی از روش GMM
- سیستم یادگیری بدون نظارت
- نیازمندی به سیستم یادگیری بدون نظارت
- الگوریتم k-Means
- تصویر سازی از الگوریتم k-Means
- الگوریتم فازی k-Means
- مراحل خوشه بندی در الگوریتم k-Means
- الگوریتم شبکه عصبی خودسازمانده SOM یا نقشه های خودسازمان دهنده
- تصویر سازی از الگوریتم KSOM
- روش های کاهش ابعاد
- روش تحلیل مؤلفه های اصلی (PCA)
- تصویر سازی از روش PCA با استفاده از تبدیل دو بعدی به یک بعدی
- مشکل کوچک اندازه نمونه در LDA
- فضایی خالی LDA (Null-Space LDA)
- کرنل LDA
- کرنل ترفند برای اجرای LDA در فضاهای بزرگتر
- تصویر سازی از کاهش ابعاد با استفاده از LDA
- تجزیه و تحلیل کامپوننت مستقل
- حل پایگاه های ICA با استفاده از اندازه گیری کورتوز
- مراحل کسب پایگاه های ICA
- تصویر سازی از کاهش ابعاد با استفاده از ICA
فصل دوم: مدل تولید گفتار
- مقدمه
- امواج صوتی
- فیزیک در صدای موج حرکت از طریق لوله صوتی با مساحت مسطح یکنواخت
- مدل Tract Vocal به عنوان کانال های آبشاری با استفاده از لوله های صوتی یکسان با مقاطع مختلف
- مدل سازی مسیر صوتی از سیگنال گفتار
- روش همبستگی خودکار
- روش کوواریانس خودکار
- ساختار شبکه برای دستیابی به منبع تحریک
- ساختار شبکه برای به دست آوردن منبع تحریک برای سیگنال گفتاری معمولی
- محاسبه ضریب مشبک (Lattice) از ضرایب LPC
فصل سوم: استخراج ویژگی سیگنال گفتار
- شناسایی نقطه پایانی
- تکان دادن زمان پویا
- ضرایب پیشگوئی خطی (LPC)
- قطب های صوتی
- ضرایب بازتاب
- نسبت مساحت ورود
- خط طیف فرکانسی
- ضریب نفوذ ملودی فرکانس
- پدیده گیبس (Gibbs)
- تبدیل کسینوس گسسته
- طیف سنج
- دقت یا رزولوشن زمان در مقابل فرکانس در طیف سنج
- تبدیل موجک گسسته (DWT)
- تخمین فرکانس نواک (زیرایی (زیروبمی) یا ارتفاع صوت)
- روش همبستگی خودکار
- رویکرد فیلتر هومومورفیک
- ارزیابی فرکانس فرماند (Formant)
- استخراج فرمونت با استفاده از مدل Tract Vocal
- استخراج فرمونت با استفاده از فیلتر هومورفیک
فصل چهارم: فشرده سازی گفتار
- کوانتيزاسيون یکنواخت
- کوانتيزاسيون غیر یکنواخت
- کوانتيزاسيون سازگار
- مدولاسیون کد پالس دیفرانسیل
- تصویر سازی از پیش بینی سیگنال گفتار با استفاده از LPC
- پیش بینی خطی متقاعد کننده کد
- برآورد پایداری تاخیر
- افزایش برآورد G1 و G2 ثابت
- ارزیابی کیفیت سیگنال گفتار فشرده شده
سلام یه پروژه تو متلب می خوام که سیگنال های آنالوگ رو به دیجیتال تبدیل کنه شما می تونید این کارو قبول کنید ؟