Normal view MARC view ISBD view

Evaluación para disminuir la pérdida en la transcripción de audios de un centro de comando y control

By:

Márquez Castillo, Luis Daniel [autor]

Contributor(s):

Orellana Cordero, Marcos Patricio [director de Tesis]

Material type: Text

TextLanguage: Spanish Publisher: Ecuador : Universidad del Azuay-Facultad de Ciencias de la Administración-Escuela de Ingeniería de Sistemas, 2024Description: 20 páginas; DigitalContent type:

texto

Media type:

computadora

Carrier type:

recurso en línea

Subject(s):

Other classification:

UDA-BG T20829

Online resources:

Ver documento en línea

Dissertation note: Ingeniero en Ciencias de la Computación Abstract: Los avances en el procesamiento de lenguaje natural (NLP) y en los modelos de reconocimiento de voz (ASR) han mejorado la transcripción automática, pero siguen enfrentando limitaciones en entornos desafiantes como los centros de comando y control, donde la calidad del audio y las particularidades del lenguaje afectan a la precisión. Este estudio se enfoca en reducir la tasa de error de palabras (WER) en las transcripciones de audios del Servicio Integrado de Seguridad ECU 911, provenientes de la zona austral de Ecuador, principalmente de la ciudad de Cuenca. Se evaluaron tres escenarios: la versión original del modelo, el modelo con ajuste-fino y el modelo con ajuste-fino acompañado de un filtro paso-bajo. Dependiendo del contexto de ruido y del tamaño del modelo, se lograron mejoras en la precisión de las transcripciones, con reducciones de WER entre un 1% y un 22%. Estos resultados demuestran que la combinación de ajuste-fino y tratamiento de señales es efectiva para mejorar la calidad de las transcripciones, especialmente en ambientes con ruido y características acústicas complejas.

Tags from this library: No tags from this library for this title. Log in to add tags.

Average rating: 0.0 (0 votes)

Holdings
Item type	Current library	Shelving location	Call number	Status	Barcode
Tesis	Biblioteca Hernán Malo González	Digital	UDA-BG T20829 (Browse shelf(Opens below))	Available	T20829

Ingeniero en Ciencias de la Computación

Los avances en el procesamiento de lenguaje natural (NLP) y en los modelos de reconocimiento de voz (ASR) han mejorado la transcripción automática, pero siguen enfrentando limitaciones en entornos desafiantes como los centros de comando y control, donde la calidad del audio y las particularidades del lenguaje afectan a la precisión. Este estudio se enfoca en reducir la tasa de error de palabras (WER) en las transcripciones de audios del Servicio Integrado de Seguridad ECU 911, provenientes de la zona austral de Ecuador, principalmente de la ciudad de Cuenca. Se evaluaron tres escenarios: la versión original del modelo, el modelo con ajuste-fino y el modelo con ajuste-fino acompañado de un filtro paso-bajo. Dependiendo del contexto de ruido y del tamaño del modelo, se lograron mejoras en la precisión de las transcripciones, con reducciones de WER entre un 1% y un 22%. Estos resultados demuestran que la combinación de ajuste-fino y tratamiento de señales es efectiva para mejorar la calidad de las transcripciones, especialmente en ambientes con ruido y características acústicas complejas.

There are no comments on this title.

to post a comment.