|
Поиск | Личный кабинет | Авторизация |
Технология сегментации речевых сигналов на тональные компоненты для мониторинга послеоперационной дисфункции голоса
Аннотация:
Хирургические вмешательства на органах шеи (гортани, щитовидной железе, трахее, пищеводе) сопряжены с риском повреждения возвратного гортанного нерва, что может приводить к парезу голосовых связок и дисфонии. По данным исследований, до 30 % пациентов после хирургического вмешательства отмечают изменения голоса, а у 1...5 % развивается его стойкое нарушение. Мониторинг послеоперационной голосовой функции является критически важной задачей для своевременной диагностики осложнений и оценки эффективности реабилитации. Как отмечается в работе , объективный анализ динамики частоты основного тона (ЧОТ) до и после операции служит высокочувствительным маркером дисфункции голосообразующего аппарата. Однако точность такого анализа напрямую зависит от корректного выделения тональных компонентов речевого сигнала - фрагментов, генерируемых периодическими колебаниями голосовых связок и несущих ключевую информацию об их функциональном состоянии. Сегментация речевых сигналов на тональные и нетональные компоненты представляет собой фундаментальный этап предварительной обработки в системах медицинской голосовой диагностики. B отличие от задач распознавания речи, голосового управления и прочих, где сегментация ориентирована на фонемы или слова, в клинической практике критически важно выделить именно тональные компоненты, соответствующие звонким звукам (гласные, сонорные согласные). Именно эти компоненты отражают работу голосовых связок как источника квазипериодических возбуждений. Механизм их образования (фонация) связан с вибрацией голосовых связок под действием воздушного потока, создающей гармоническую структуру сигнала. B противоположность этому нетональные компоненты (глухие фрикативные, взрывные согласные) формируются за счет турбулентного шума или импульсных источников и не несут прямой информации о функции связок . Целью настоящего исследования является разработка и валидация технологии сегментации речевых сигналов, оптимизированной для выделения тональных компонентов в условиях послеоперационной дисфункции голоса. Технология создается как критический модуль системы мониторинга, описанной в [4], и направлена на повышение достоверности последующего анализа ЧОТ. Работа продолжает цикл научных исследований в рамках проекта № FSGE-2023-0006 и базируется на клинических данных, полученных при обследовании пациентов OOO «СМ-Клиника» (г. Москва). Предложена технология сегментации речевых сигналов на тональные компоненты для мониторинга послеоперационной дисфункции голоса. Технология основана на применении энергетического оператора Тигера, повышающего чувствительность к изменениям амплитуды и частоты при дисфонии. Валидация на клинических данных (1 OOO сигналов от 21 пациента) продемонстрировала низкие ошибки сегментации: 1,9 (1 рода) и 1,7 % (II рода), что на 3,1...21,3 % точнее существующих способов. Это позволит эффективно идентифицировать тональные компоненты даже при снижении амплитуды вибрации связок на 40...60 %, обеспечивая раннюю диагностику пареза возвратного нерва. Технология может быть интегрирована в системы послеоперационного мониторинга и открывает новые возможности для объективной оценки реабилитации.
Авторы:
Алимурадов А.К.
Издание:
Медицинская техника
Год издания: 2025
Объем: 3с.
Дополнительная информация: 2025.-N 5.-С.17-19. Библ. 11 назв.
Просмотров: 5