تشخیص گفتار (VAD) فرایندی است که میتواند بخشهای گفتاری و غیرگفتاری را از یک سیگنال گفتار جدا کند. یک گفتار مکالمهای معمولی دارای نسبت گفتار به غیرگفتار چهل به شصت است. لذا، استفاده از تشخیص گفتار میتواند ظرفیت کانال و نیز مصرف توان سیستمهای مخابره صدا را بهبود بخشد. همچنین تشخیص گفتار به کاربردهای مختلف مربوط به گفتار مثل رمزگذاری گفتار، بازشناسی خودکار گفتار و سیستمهای بهبود گفتار کمک میکند.
در این مقاله تشخیص گفتار (VAD) به کمک ماشین بردار پشتیبان (SVM) به صورت یک مساله دستهبندی دو کلاسه فرموله شده است. روش ارائه شده، برای دستهبندی گفتار/غیرگفتار، یک فرایند استخراج ویژگی پردازش گفتار مقاوم به نویز را با مدلهای ماشین بردار پشتیبان آموزش دیده در انواع نویز زمینهها ترکیب میکند.