|
Поиск | Личный кабинет | Авторизация |
Технология представления речевых сигналов на основе декомпозиции на эмпирические моды
Аннотация:
Речевой сигнал - это акустическое колебание, возникающее в результате речевой деятельности человека, преобразованное в электрическую форму. К основным характеристикам речевого сигнала относят: временные параметры: длительность, распределение энергии во времени; частотные параметры: форманты (резонансные частоты речевого тракта), частота основного тона, спектральные компоненты; амплитудные параметры: интенсивность, динамический диапазон и др. Среди существующего многообразия известных методов, способов, алгоритмов и средств обработки речевых сигналов, выделяют подходы, основанные на преобразовании Гильберта-Хуанга. B последнее время наибольшую практическую популярность получили подходы на основе метода декомпозиции на эмпирические моды (ДЭМ) [Empirical Mode Decomposition, EMD) и его модификаций . Целью настоящей статьи является повышение эффективности обработки речевых сигналов на основе применения метода ДЭМ и его модификаций. Статья является продолжением ранее опубликованной работы авторов . Научная работа финансируется в рамках проекта № FSGE-2023-0006 за счет средств федерального бюджета РФ. Предложена технология представления речевых сигналов, основанная на адаптивном методе декомпозиции на эмпирические моды и его модификациях. Принцип технологии заключается в том, что каждый новый комбинированный речевой сигнал отражает скрытые структурные особенности исходных данных. Результаты исследования технологии демонстрируют потенциал для повышения эффективности обработки речевых сигналов в задачах фильтрации, сегментации и выделения информативных параметров. Внедрение технологии может стать основой для систем фильтрации, сегментации речь/пауза и медицинской диагностики речевых патологий.
Авторы:
Алимурадов А.К.
Издание:
Медицинская техника
Год издания: 2025
Объем: 3с.
Дополнительная информация: 2025.-N 5.-С.26-28. Библ. 11 назв.
Просмотров: 4