Exposiciones realizadas en el SRAA 2009

Clusterización para la inicialización de HMM en un ASR

Mg. Jorge Guevara Díaz


En el presente trabajo se presenta una propuesta que utiliza la técnica de clusterización más conocida, llamada K-means para realizar el trabajo de inicialización de un modelo oculto de Markov (HMM) para aplicarla en un Sistema de Reconocimiento Automático del Habla. [descargar]



Extracción de características de palabras aisladas usando MFCC y MFCC con pesos

BSc. Nils Murrugara Llerena


En el presente trabajo se desea saber cómo se comporta el extractor de caracteristicas MFCC con la mejora de agregar ciertos pesos y que tan buenos resultados dan ambos casos en el recoconocimiento de palabras aisladas. En este caso se usaron palabras de digitos. [descargar]



Reconocimiento automático de palabras aisladas mediante el uso de los extractores de características: MFCC y MODGDF

BSc. Jorge Valverde Rebaza


Uno de los métodos más robustos para la extracción de características de señales de habla que goza de gran aceptación debido a los buenos resultados que obtiene es el MFCC(Coeficientes Cepstrales en Escala de Mel), el cual se basa en el uso de la transformada de Fourier para obtener las frecuencias de la señal, sin embargo, este método no toma en cuenta la fase de la señal de habla, el cual es un factor que la audición humana toma muy en cuenta. Para el cálculo de este factor se hace uso de la Función de Retraso de Grupo Modificado, MODGDF (Modified Group Delay Function). De esta manera, juntando el MFCC y el MODGDF surge la propuesta de un extractor de características más completo. [descargar]



Uso del método de extracción de características MFCC con formas arbitrarias a nivel de filtros para el reconocimiento de palabras aisladas

BSc. Pedro Shiguihara Juárez


En este trabajo se muestra una variación realizada sobre el algoritmo de extracción de caracteristicas MFCC(Coeficientes Cepstrales en Escala de Mel) con el objetivo de minimizar la tasa de error relativa en el reconocimiento de palabras aisladas. Esta variación se realiza aplicando un rectificador de picos con formas arbitrarias para suavizar la convolución de la señal mediante un filtro. [descargar]



Algoritmo N-Best: Eficiente procedimiento para la búsqueda de las N hipotesis de frases más probables

BSc. Luis Mostacero Zárate


Uno de los problemas de los Sistemas de Lenguajes del Habla es la gran cantidad de información que se obtiene al procesarlos, obligando a usar métodos que ayuden a controlar este problema, reduciendo asi el trabajo de dicho procesamiento.En este trabajo se presenta al algoritmo N-Best como alternativa para obtener los parámetros necesarios para la inicialización de nuestro modelo oculto de Markov (HMM) para aplicarla en un Sistema de Reconocimiento Automático del Habla. [descargar]



Predicción y Entropia de Textos en Inglés

BSc. Juan Grados Vásquez


En el presente trabajo se muestra la aplicación del conocimiento estadístico para poder generar un modelo de lenguaje. De esta manera se muestra la aplicación del estudio de Claude Shannon(Prediction and Entropy of Printed English) basados en la utilización de la entropía y redundancia de los caracteres y/o palabras contenidos en un texto escrito en un determinado lenguaje natural (idioma inglés), en el contexto de uno de los componentes de un Sistema de Reconocimiento del Habla. [descargar]



Aplicación del algoritmo MFCC-DTW en el reconocimiento de comandos activados por voz

BSc. Pedro Linares Kcomt


En el presente trabajo se muestra una aplicación real de un Sistema de Reconocimiento Automático del Habla, el cual se basa en el uso de MFCC con filtros gaussianos para la extracción de características, y el algoritmo DTW para el reconocimiento de palabras aisladas. El sistema logra reconocer hasta 100 comandos de voz, los cuales, son ejecutados inmediatamente sobre el sistema operativo, pudiendo realizar tareas, como por ejemplo, de abrir y/o cerrar aplicaciones de escritorio y/o web. [descargar]



Domótica con Speech Recognition

Roger Castañeda y Diego Castañeda


En el presente trabajo se muestra una aplicación domótica de un sistema de reconocimiento automático del habla, el cual permite, mediante el reconocimiento de comandos de voz, la ejecución automática de órdenes que permiten la comodidad en el hogar así como, la seguridad y el uso óptimo de los recursos eléctricos. La aplicación de un sistema RAH encuentra una aplicación real y factible que ya esta siendo implementada en muchas sociedades y que ahora es posible hacerlo en la nuestra. [descargar]

 

(c) SRAA 2009.