سیستمهای پردازش گفتار که با عنوان پردازش گفتار رایانهایComputer Speech Recognition نیز نامیده میشوند، توانایی تبدیل گفتار به متن و پردازش آن را دارند. بواسطه این فناوری، انسانها قادر به تعامل و گفتار با ماشینهای هوشمند خواهند بود.
گفتار با یک مفهوم و یا یک ایده در ذهن گوینده آغاز میشود. این ایده، لازم است به کدهای زبانی تبدیل شود. سپس سیگنالهای الکتروشیمیایی ایجاد شده از طریق اعصاب حرکتی، عضلات صوتی دهان را فعال کرده و گفتار تولید میشود.
کار سیستمهای پردازش گفتار
سیستمهای پردازش گفتار به طور معمول دارای یک فرایند چند مرحلهای هستند. ابتدا، ویژگیهای مربوطه از سیگنال گفتار استخراج میشوند. سپس، مدلهای مرجع با استفاده از این ویژگیها طراحی مییابند. در مرحله سوم، بردارهای ویژگی استخراج شده از گفتار به مدلهای مرجع ارسال میشوند.
اهداف پردازش گفتار
یکی از اولین اهداف پردازش گفتار، کدگذاری گفتار برای انتقال کارآمد بود. این مورد مترادف با کاهش پهنای باند مورد نیاز برای انتقال گفتار میباشد که لازم است جهت دستیابی به آن، پیشنیازهایی اجرا گردد. البته، نظریه اطلاعات که در اواخر دهه ۱۹۴۰ و ۱۹۵۰ مطرح شد، هدف را کاهش نرخ اطلاعات به جای پهنای باند مطرح نمود.
همچنین، سختافزاری که بتواند سیگنالهای پیوسته با پهنای باند محدود را به توالیای از نمونههای گسسته تبدیل کند، مورد نیاز است. کمیسازی نمونهها امکان دیجیتالی شدن سیگنال گفتاری را فراهم میکند و پردازش دیجیتال را میسر میسازد. در نهایت، توصیف سیگنال گفتار در قالب ضرایب پیشبینی خطی (LPC) یک نمایش بسیار مناسب ارائه میدهد.
بیشتر بخوانید: لیست ۹ شرکت فعال در حوزه پردازش گفتار در ایران
کاربرد پردازش گفتار در حملونقل
سیستمهای پردازش گفتار داخل خودرو به یک ویژگی استاندارد برای اکثر خودروهای مدرن تبدیل شده است. هدف این سیستمها، حذف حواسپرتی حاصل از نگاه کردن به تلفن همراه در حین رانندگی است. به کمک این سیستمها، رانندگان میتوانند از دستورات صوتی ساده برای شروع تماسهای تلفنی، اخذ راهنمایی جهت یافتن مسیر مناسب، انتخاب کانال رادیویی مورد نظر و یا پخش موسیقی استفاده کنند.
همچنین میتوان با استفاده از قابلیتهای بیومتریک صدا، تمایزی بین افرادی که در داخل وسیله نقلیه صحبت میکنند، قائل شد.
آینده پردازش گفتار
اینطور به نظر میرسد که فیلمهای علمی- تخیلی در حال تبدیل شدن به واقعیت هستند. چه کسی تصور میکرد روزی بتوان با دستگاههای الکترونیکی صحبت کرد. با این وجود، همچنان پیشرفتهای بزرگتری در پردازش گفتار در راستای پشتیبانی از سرعتهای سریعتر فناوری بیسیم و یا رشد خارقالعادهای رایانش ابری در راه است.
به لطف این موارد، دادههای گفتاری بیشتری جهت بهبود این نوع از محصولات نیز به وجود آمده و باعث گشته که توانایی این سیستمها برای شنیدن انواع بیشتری از کلمات، زبانها و لهجهها ارتقا یابد.
با توجه به اینکه گفتار یکی از سریعترین و کارآمدترین روشهای ارتباطی است، بنابراین، میتوان انتظار داشت که در آیندهای نزدیک، دستیاران مجازی و سیستمها مجهز به پردازش گفتار که تمرکزشان بیشتر بر انجام امور توسط گفتار و یا صوت است، تسلط بیشتری بر زندگی روزمره انسانها خواهند گذاشت.