Design and Implementation of a Digital Signal Processing Algorithm to Improve Esophageal Speech Excitation Signal

Mejor Proyecto Fin de Grado en Ingeniería de Telecomunicación

JON ZARRAJERIA GONZÁLEZ DE ASPURU

BEGOÑA GARCÍA ZAPIRAIN. Directora del proyecto

Figura 1. Linear Source Filter Model
Figura 1. Linear Source Filter Model

El origen del proyecto, según su autor

Durante mis estudios de grado he ido obteniendo conocimientos en diferentes áreas de la ingeniería de telecomunicación. Aún así, esta carrera tiene una estrecha relación con el sonido ya que éste no deja de ser una onda más a estudiar. Cuando empecé a trabajar en uno de los departamentos de investigación de la universidad  (DeustoTech-Life). A finales de mi segundo curso de carrera, me di cuenta de que quería aprender más sobre cómo se procesa la voz humana y por eso no dejé escapar esta oportunidad.
El proyecto presentado se enmarca en el contexto de la mejora de la voz esofágica. Los laringectomizados son personas que por diversos problemas médicos se han visto obligadas a someterse a una cirugía para extirpar la laringe, cuerdas vocales, epiglotis y cartílagos que rodean la laringe. Debido a que estos elementos son una parte vital del aparato fonador, la eliminación de estas partes afecta en gran medida la calidad de la voz, y consecuentemente puede llegar a acarrear problemas psicológicos ya que hay personas que prefieren dejar de hablar antes de hacerlo con su nueva voz.

Figura 2. Esquema general del algoritmo
Figura 2. Esquema general del algoritmo

Un verdadero proyecto científico

El algoritmo propuesto trata de descomponer la voz de los pacientes siguiendo el modelo «Linear Source Model» presentado en la Figura 1 y a posteriori modificar la señal excitación para así poder reconstruir una nueva señal con mayor calidad. A continuación se referirá cada punto del esquema general del algoritmo representado en la Figura 2.

  1. Para la adquisición de la señal excitación primero hay que obtener los coeficientes (polos) del tracto vocal que actúan como un filtro. Además, dichos coeficientes son modificados eliminado los situados en las frecuencias más bajas y consiguiendo así una mejor base  donde trabajar en el punto 2.
  2. Para la modificación de la señal fuente se ha generado un pulso de señal excitación de forma artificial y se ha combinado con el original para crear uno con mejores características. Una de las razones por las que se han combinado ambas señales (pulso original y pulso modificado) es que se quiere mantener la «personalidad» de cada persona, es decir, si sólo se usara la señal excitación generada de forma artificial el sonido resultante sería muy robótico y sería complicado saber distinguir entre dos personas que estén usando este algoritmo.
  3. Finalmente, se ha reconstruido una nueva señalde voz a partir de las modificaciones hechas anteriormenteconsiguiendo un habla de mayor calidad.
Figura 3. Herramienta para el procesado de voces esofágicas
Figura 3. Herramienta para el procesado de voces esofágicas

¿Un producto comercializable?

Además de diseñar el algoritmo, también se ha implementado en una herramienta para procesar este tipo de señales (Figura 3). En ella es posible cargar bases de datos con diferentes sonidos y poder
ajustar los parámetros deseados para un correcto funcionamiento del algoritmo, además de añadir un bloque de post-procesado para aplicar filtros a la nueva señal de voz. Este software podría ser preparado para ser comercializado en base a licencias.

Mejorando la calidad de vida de las personas

Jon y Begoña comparten satisfacción por el logro alzanzado. «Con la realización de este proyecto ha sido posible mejorar significativamente el «NHR» (Noise to Harmonic Ratio) y «jitter» en la voz de estas personas. Además, también se realizó una prueba más subjetiva (Mean Opinion Score) en la que diferentes personas tenían que escuchar sonidos, tanto procesados como no procesados por el algoritmo, para ver si resultaba mejor el modificado por la herramienta. Para este caso, también se demostró ser mejor la nueva voz propuesta por este proyecto».
«Finalmente, nos gustaría destacar que aunque hay muchos centros de investigación trabajando en temas de sonido y voz, son pocos aquellos que se centran en ayudar a personas con esta patología,
y por lo que a nosotros respecta, es de gran importancia poder aplicar nuestros conocimientos en un área en la que estemos ayudando en mejorar la calidad de vida de otras personas».

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.