این پروژه در سال 1389 پیاده سازی شده و بنا به درخواست دوستان برخی اصلاحات مهم اعمال شده و اکنون داخل گیت هاب قرار داده شده
هدف اصلي اين ارائه آشنايي دانشجوياني که به اين بحث علاقه بسياري دارند ولي دانش پايه ندارند و يا نمي دانند از کجا شروع کنند مي باشد. گرچه در اين ارائه هيچ نو آوري ديده نميشود ولي فکر ميکنم براي باز شدن ذهن دانشجويان در زمينه پردازش زبان طبيعي انشالله موثر خواهد بود. تا جاي ممکن سعي شده تا مطالب با بياني ساده آماده شوند و از همه مهمتر از عنوان مطالب رياضي و آمار اجتناب شده است.
• اين ارائه شامل مطالبي جهت شناخت اصطلاحات و اطلاعات پيش نياز اصوات و روش هاي دريافت صوت و همچنين پردازش و تشخيص آن مي باشد.
• پياده سازي پروژه نيز در بستر دات نت و به زبان c# سی شارپ بدون استفاده از هيچ گونه ابزار جانبي انجام شده است.
• لطفا قبل به اجرا در آوردن فايلهاي اجرايي نگاهي به مستندات بيندازيد.
این ارائه متشکل از چهار پروژه به شرح زیر می باشد :
1 - پروژه آزمایشگاه - LabApp : این پروژه ابزارهایی مانند ابزار طیف نگاری اصوات در اختیار کاربران قرار میدهد تا کابران بتوانند از طریق میکروفون اصوات را مورد بررسی قرار دهند
2 - پروژه تشخیص حروف - RecognizerApp : این پروژه چند حروف بخصوص (آ، اَ، اِ، س، ش، ز، ژ) که کاربر از طریق میکروفون بیان میکند را تشخیص داده و بر روی صفحه، نمایش میدهد
3 - پروژه تحلیل حروف - SoundAnalysis : تشخیص حروف (آ، اَ، اِ، س، ش، ز، ژ) و یک سری فیلتر مانند حذف نویز، تشیص سرعت، نرمال سازی و سایر تحلیل ها نیز در پروژه قرار گرفته شده است
4 - پروژه دریافت نمونه صوتی - SoundCapture : دریافت نمونه های صوتی از طریق میکروفون توسط این پروژه انجام میشود. در نسخه پیشین این عمل بوسیله ی DirectX انجام میشد که جهت سادگی و سازگاری بیشتر دریافت نمونه های صوتی در ورژن جدید توسط کتابخانه NAudio انجام می شود
📖 دانلود فایل راهنمای پروژه (PDF)
فایل راهنما شامل توضیحاتی پیرامون مباحث زیر نیز میباشد :
• انواع نمودار هاي ترسيم صدا (دامنه زمان، دامنه فرکانس يا اسپکتروم و اسپکتروگرام)
• صداهاي هنچار و ناهنجار
• انواع موج ها
• دستگاه شنواييي و تکلم انسان
• نمونه گيري صوتي
• تبديل سريع فوريه (FFT)
• طول پنجره در تبديل فوريه
• توابع پنجره (Window Function)
• باند پهن و باند باريک (Wide Band و Narrow Band)
• فرکانس پايه و سازنده (Fundamental Frequency و Formants)
• fft bin
• تشخيص صدا، تشخيص حروف، حروف صدا دار و بي صدا
• تشخيص زيري و بمي صدا
• جداسازي (Segmentation)
• تشخيص صحبت و سکوت
• نرخ عبور از صفر (ZCR)
شما میتواید سورس کد کامل این پروژه را از طریق گیت هاب دریافت و کامپایل کنید
شما میتوانید بدون نیاز به کامپایل این پروژه فایل های اجرایی از پیش کامپایل شده را از آدرس زیر دریافت کنید
در صورتی که به مشکلی برخوردید لطفا آن را در قسمت Issues بیان کنید

