Evaluación para disminuir la pérdida en la transcripción de audios de un centro de comando y control

By: Contributor(s): Material type: TextTextLanguage: Spanish Publisher: Ecuador : Universidad del Azuay-Facultad de Ciencias de la Administración-Escuela de Ingeniería de Sistemas, 2024Description: 20 páginas; DigitalContent type:
  • texto
Media type:
  • computadora
Carrier type:
  • recurso en línea
Subject(s): Other classification:
  • UDA-BG T20829
Online resources: Dissertation note: Ingeniero en Ciencias de la Computación Abstract: Los avances en el procesamiento de lenguaje natural (NLP) y en los modelos de reconocimiento de voz (ASR) han mejorado la transcripción automática, pero siguen enfrentando limitaciones en entornos desafiantes como los centros de comando y control, donde la calidad del audio y las particularidades del lenguaje afectan a la precisión. Este estudio se enfoca en reducir la tasa de error de palabras (WER) en las transcripciones de audios del Servicio Integrado de Seguridad ECU 911, provenientes de la zona austral de Ecuador, principalmente de la ciudad de Cuenca. Se evaluaron tres escenarios: la versión original del modelo, el modelo con ajuste-fino y el modelo con ajuste-fino acompañado de un filtro paso-bajo. Dependiendo del contexto de ruido y del tamaño del modelo, se lograron mejoras en la precisión de las transcripciones, con reducciones de WER entre un 1% y un 22%. Estos resultados demuestran que la combinación de ajuste-fino y tratamiento de señales es efectiva para mejorar la calidad de las transcripciones, especialmente en ambientes con ruido y características acústicas complejas.
Tags from this library: No tags from this library for this title. Log in to add tags.
Star ratings
    Average rating: 0.0 (0 votes)
Holdings
Item type Current library Shelving location Call number Status Barcode
Tesis Biblioteca Hernán Malo González Digital UDA-BG T20829 (Browse shelf(Opens below)) Available T20829

Ingeniero en Ciencias de la Computación

Los avances en el procesamiento de lenguaje natural (NLP) y en los modelos de reconocimiento de voz (ASR) han mejorado la transcripción automática, pero siguen enfrentando limitaciones en entornos desafiantes como los centros de comando y control, donde la calidad del audio y las particularidades del lenguaje afectan a la precisión. Este estudio se enfoca en reducir la tasa de error de palabras (WER) en las transcripciones de audios del Servicio Integrado de Seguridad ECU 911, provenientes de la zona austral de Ecuador, principalmente de la ciudad de Cuenca. Se evaluaron tres escenarios: la versión original del modelo, el modelo con ajuste-fino y el modelo con ajuste-fino acompañado de un filtro paso-bajo. Dependiendo del contexto de ruido y del tamaño del modelo, se lograron mejoras en la precisión de las transcripciones, con reducciones de WER entre un 1% y un 22%. Estos resultados demuestran que la combinación de ajuste-fino y tratamiento de señales es efectiva para mejorar la calidad de las transcripciones, especialmente en ambientes con ruido y características acústicas complejas.

There are no comments on this title.

to post a comment.

Catálogo
Digital