مشخصات

زبان

بانک اطلاعاتی

فایل ها

توضیحات

m فایل متلب ، دیتای صوتی ، گزارش کار و توضیح کدها در فایل ورد و فیلم نحوه اجرا دارد

۷۵,۰۰۰ تـــــومان

مطالب مرتبط

تشخیص و تفکیک کلمات مبتنی بر اطلاعات فرکانسی در متلب

تشخیص و تفکیک کلمات مبتنی بر اطلاعات فرکانسی در متلب

تشخیص و تفکیک کلمات با روش PSD در متلب

در این بخش پروژه تشخیص و تفکیک کلمات مبتنی بر اطلاعات فرکانسی در نرم افزار MATLAB به همراه گزارش کار آماده کرده ایم که در ادامه توضیحاتی از پروژه ارائه شده و فیلم و تصاویر خروجی این پروژه درس DSP قرار داده شده است.

معرفی پروژه

برای تبیین کاربردهای FFT یک پروژه در مورد تشخیص صحبت در نظر گرفته شده که هدف آن نشان دادن طیف سیگنال و اطلاعات مفید موجود در طیف فرکانسی یک سیگنال و نیز محاسبه بازه های FFT مرتبط با یک سیگنال آنالوگ می باشد. در این پروژه سیستم تشخیص کلمه (Speech Recognition) از روشی مبتنی بر اطلاعات فرکانسی به منظور تشخیص و تفکیک دو کلمه Yes و No استفاده شده است. بدین منظور تعداد ۱۰۰ داده صوتی از کلمه Yes و ۱۰۰ داده از کلمه No تهیه شده است. در این داده ها افراد مختلف با تنوع لحن و بیان و قدرت، این دو کلمه را بیان می کنند. برای ارائه راه حلی جهت تشخیص این دو کلمه از یکدیگر، به تعداد ۵۰ داده از هر کلمه را به عنوان داده های آموزشی در نظر می گیرم. روش مورد نظر بدین صورت است که در هر دو گروه Yes و No از هر ۵۰ سیگنال صوتی، از هر ۵۰ سیگنال صوتی FFT گرفته می شود تا اطلاعات فرکانسی  این سیگنال صوتی برای هر دو گروه مشخص شود. کلمه Yes به دلیل تلفظ کلمه S دارای اطلاعات فرکانس بالا نیز می باشد.

بنابراین معیار شناخت این دو کلمه از یکدیگر داشتن اطلاعات فرکانس بالا در کلمه Yes می باشد. در این راه حل از چگالی طیف توان یا PSD استفاده می کنیم.  میزان این طیف در فرکانس های بالا برای کلمه Yes بیشتر از کلمه No است. فقط کافیست که یک آستانه برای میزان حضور فرکانس های بالا تعیین کنیم. اما موضوعی که اینجا مهم است، اینجاست که قدرت سیگنال های صوتی Yes و NO برای افراد مختلف برابر نیست و این ممکن است به طور مثال میزان قدرت نسبی فرکانس های بالا در کلمه No را بالا ببرد. بنابراین ابتدا یک معیار تعریف می کنیم. این معیار برابر است با: جمع مقادیر طیف توان در فرکانس های بالا نسبت به جمع این مقادیر برای کل سیگنال. فرکانس های بالا را  از نمونه ۲۷۵۰ به بعد برای FFT در نظر می گیریم. در فاز آموزش مقدار این معیار را برای سیگنال های صوتی گروه Yes و No جداگانه محاسبه می کنیم. حال باید به دنبال آستانه ای برای این معیار باشیم. نمودار زیر مقادیر این معیار را برای هر ۵۰ نمونه آموزشی دو گروه نشان می دهد. این معیار ها توسط اعمال چگالی طیف توان در متلب به دست آمده است.

تشخیص و تفکیک کلمات مبتنی بر اطلاعات فرکانسی در متلب

شکل یک سیگنال حوزه زمان همراه با سه تابع پنجره برای هر سگمنت

چگالی طیف توان سیگنال (PSD)

چگالی طیف توان یا PSD یک نمودار در حوزه فرکانس است که توان سیگنال را بر حسب مقادیر مختلف فرکانس آن رسم می کند. میانگین گرفتن از پریودگرام های بخش های (Segment) مختلف سیگنال های طولانی به صورت بسیار دقیق تر توان را به فرکانس های صحیح اختصاص می دهد و همچنین باعث کاهش نوسانات شامل نویز در دامنه توان می گردد. البته در عوض رزولوشن فرکانسی نیز کاهش پیدا می کند که دلیل آن در اینجاست که در این حالت تعداد نقاط داده بسیار کمتری برای محاسبه هر FFT در اختیار ما قرار می گیرد.

تشخیص و تفکیک کلمات مبتنی بر اطلاعات فرکانسی در متلب

در این شکل، نمودار آبی اندازه معیار برای گروه Yes و نمودار قرمر، میزان این معیار را برای گروه No نشان می دهد. همانطور که مشخص است مقدار معیار برای گروه Yes در اکثر موارد بیشتر از گروه No است. اگر بخواهیم یک آستانه برای این معیار تعریف کنیم، خط مشکی رنگ می تواند مقدار مناسبی باشد. این مقدار آستانه ۴ می باشد. در یکی از موارد برای گروه Yes نمودار زیر خط مشکی و در یکی از موارد برای گروه No نمودار قرمز بالای خط مشکی است که این به دلیل تلفیق فرکانس ها در صوت یک شخص است و اکثریت سیگنال ها هستند که آستانه را تعیین می کنند. توضیحات بیشتر و جزئیات کد نویسی ها به همراه پروژه ارائه می گردد.

 


تصویر 1
تصویر 2
تصویر 3
تصویر 4
تصویر 5
تصویر 6
تصویر 7
باکس دانلود
شناسه:
۵۳۸۲
توضیحات:
m فایل متلب ، دیتای صوتی ، گزارش کار و توضیح کدها در فایل ورد و فیلم نحوه اجرا دارد
قیمت:
۷۵,۰۰۰ تـــــومان
ثبت نظر
ریفریش کنید!
نظرات کاربران (۰ مورد)

هیچ نظری ثبت نشده است