فناوری پردازش گفتار

ainews11
3 min readMar 5, 2022

سیستم‌‏های پردازش گفتار که با عنوان پردازش گفتار رایانه‌‏ایComputer Speech Recognition نیز نامیده می‌‏شوند، توانایی تبدیل گفتار به متن و پردازش آن را دارند. بواسطه این فناوری، انسان‌ها قادر به تعامل و گفتار با ماشین‌های هوشمند خواهند بود.

گفتار با یک مفهوم و یا یک ایده در ذهن گوینده آغاز می‌شود. این ایده، لازم است به کدهای زبانی تبدیل شود. سپس سیگنال‌های الکتروشیمیایی ایجاد شده از طریق اعصاب حرکتی، عضلات صوتی دهان را فعال کرده و گفتار تولید می‌شود.

کار سیستم‌های پردازش گفتار

سیستم‌های پردازش گفتار به طور معمول دارای یک فرایند چند مرحله‌ای هستند. ابتدا، ویژگی‌های مربوطه از سیگنال گفتار استخراج می‌شوند. سپس، مدل‌های مرجع با استفاده از این ویژگی‌ها طراحی می‌یابند. در مرحله سوم، بردارهای ویژگی استخراج شده از گفتار به مدل‌های مرجع ارسال می‌شوند.

اهداف پردازش گفتار

یکی از اولین اهداف پردازش گفتار، کدگذاری گفتار برای انتقال کارآمد بود. این مورد مترادف با کاهش پهنای باند مورد نیاز برای انتقال گفتار می‌باشد که لازم است جهت دستیابی به آن، پیش‌نیازهایی اجرا گردد. البته، نظریه اطلاعات که در اواخر دهه ۱۹۴۰ و ۱۹۵۰ مطرح شد، هدف را کاهش نرخ اطلاعات به جای پهنای باند مطرح نمود.

همچنین، سخت‌افزاری که بتواند سیگنال‌های پیوسته با پهنای باند محدود را به توالی‌ای از نمونه‌های گسسته تبدیل کند، مورد نیاز است. کمی‌‍‌سازی نمونه‌ها امکان دیجیتالی شدن سیگنال گفتاری را فراهم می‌کند و پردازش دیجیتال را میسر می‌سازد. در نهایت، توصیف سیگنال گفتار در قالب ضرایب پیش‌بینی خطی (LPC) یک نمایش بسیار مناسب ارائه می‌دهد.

بیشتر بخوانید: لیست ۹ شرکت‌ فعال در حوزه پردازش گفتار در ایران

کاربرد پردازش گفتار در حمل‌و‌نقل

سیستم‌های پردازش گفتار داخل خودرو به یک ویژگی استاندارد برای اکثر خودروهای مدرن تبدیل شده است. هدف این سیستم‌ها، حذف حواس‌پرتی حاصل از نگاه کردن به تلفن همراه در حین رانندگی است. به کمک این سیستم‌ها، رانندگان می‌توانند از دستورات صوتی ساده برای شروع تماس‌های تلفنی‌، اخذ راهنمایی جهت یافتن مسیر مناسب، انتخاب کانال رادیویی مورد نظر و یا پخش موسیقی استفاده کنند.

همچنین می‌توان با استفاده از قابلیت‌های بیومتریک صدا، تمایزی بین افرادی که در داخل وسیله نقلیه صحبت می‌کنند، قائل شد.

آینده پردازش گفتار

این‌طور به نظر می‌رسد که فیلم‌های علمی- تخیلی در حال تبدیل شدن به واقعیت هستند. چه کسی تصور می‌کرد روزی بتوان با دستگاه‌های الکترونیکی صحبت کرد. با این وجود، همچنان پیشرفت‌های بزرگتری در پردازش گفتار در راستای پشتیبانی از سرعت‌های سریع‌تر فناوری بی‌سیم و یا رشد خارق‌العاده‌ای رایانش ابری در راه است.

به لطف این موارد، داده‌های گفتاری بیشتری جهت بهبود این نوع از محصولات نیز به وجود آمده و باعث گشته که توانایی این سیستم‌ها برای شنیدن انواع بیشتری از کلمات، زبان‌ها و لهجه‌ها ارتقا یابد.

با توجه به اینکه گفتار یکی از سریع‌ترین و کارآمدترین روش‌های ارتباطی است، بنابراین، می‌توان انتظار داشت که در آینده‌ای نزدیک، دستیاران مجازی و سیستم‌ها مجهز به پردازش گفتار که تمرکزشان بیشتر بر انجام امور توسط گفتار و یا صوت است، تسلط بیشتری بر زندگی روزمره انسان‌ها خواهند گذاشت.

مطالعه مطلب کامل: پردازش گفتار چیست؟

--

--