Normal view MARC view ISBD view

Comparativa de precisión/tiempo entre modelos de speech-to-text basado en audios de Centros de comando y control

By:

Sangolquí Guallpa, Jacqueline Estefanía [autor]

Contributor(s):

Aguilera Muñoz, Juan Fernando [director de Tesis]

Material type: Text

TextLanguage: Spanish Publisher: Ecuador : Universidad del Azuay-Facultad de Ciencias de la Administración-Escuela de Ingeniería de Sistemas, 2024Description: 36 páginas; DigitalContent type:

texto

Media type:

computadora

Carrier type:

recurso en línea

Subject(s):

Other classification:

UDA-BG T20779

Online resources:

Ver documento en línea

Dissertation note: Ingeniero en Ciencias de la Computación Abstract: La investigación examina el desempeño de los modelos de reconocimiento de voz (speech-to-text) Whisper y Chirp en audios de emergencia del sistema ECU 911, analizando su precisión y velocidad en condiciones desafiantes, con profundos factores como la duración de los audios, niveles de decibelios, género de los alertantes, e incluso autore, el estudio revela los matices de cada modelo en situaciones reales a través de métricas de WER (Tasa de errores de palabra) y CER (Tasa de errores de caracteres), se compararon los modelos para descubrir cómo los parámetros avanzados de Whisper, como best of y best size, impulsan su rendimiento a nuevos niveles, los resultados son excelentes: el modelo Whisper LARGE optimizado con parámetros específicos y el modelo Chirp TELEPHONY alcanzaron un equilibrio entre precisión y velocidad, demostrando que una selección precisa de parámetros puede transformar los resultados de manera espectacular. Las pruebas, realizadas en un entorno que simula las condiciones operativas de emergencias con valores menores de WER de 0.2 y CER menores de 0.09, confirman que ambos modelos son altamente efectivos para mejorar la respuesta en emergencias, este estudio concluye que la combinación de precisión y velocidad en estos modelos de inteligencia artificial tiene un impacto real y positivo en la eficiencia de los sistemas de respuesta.

Tags from this library: No tags from this library for this title. Log in to add tags.

Average rating: 0.0 (0 votes)

Holdings
Item type	Current library	Shelving location	Call number	Status	Barcode
Tesis	Biblioteca Hernán Malo González	Digital	UDA-BG T20779 (Browse shelf(Opens below))	Available	T20779

Ingeniero en Ciencias de la Computación

La investigación examina el desempeño de los modelos de reconocimiento de voz (speech-to-text) Whisper y Chirp en audios de emergencia del sistema ECU 911, analizando su precisión y velocidad en condiciones desafiantes, con profundos factores como la duración de los audios, niveles de decibelios, género de los alertantes, e incluso autore, el estudio revela los matices de cada modelo en situaciones reales a través de métricas de WER (Tasa de errores de palabra) y CER (Tasa de errores de caracteres), se compararon los modelos para descubrir cómo los parámetros avanzados de Whisper, como best of y best size, impulsan su rendimiento a nuevos niveles, los resultados son excelentes: el modelo Whisper LARGE optimizado con parámetros específicos y el modelo Chirp TELEPHONY alcanzaron un equilibrio entre precisión y velocidad, demostrando que una selección precisa de parámetros puede transformar los resultados de manera espectacular. Las pruebas, realizadas en un entorno que simula las condiciones operativas de emergencias con valores menores de WER de 0.2 y CER menores de 0.09, confirman que ambos modelos son altamente efectivos para mejorar la respuesta en emergencias, este estudio concluye que la combinación de precisión y velocidad en estos modelos de inteligencia artificial tiene un impacto real y positivo en la eficiencia de los sistemas de respuesta.

There are no comments on this title.

to post a comment.