Comparativa de precisión/tiempo entre modelos de speech-to-text basado en audios de Centros de comando y control

By: Contributor(s): Material type: TextTextLanguage: Spanish Publisher: Ecuador : Universidad del Azuay-Facultad de Ciencias de la Administración-Escuela de Ingeniería de Sistemas, 2024Description: 36 páginas; DigitalContent type:
  • texto
Media type:
  • computadora
Carrier type:
  • recurso en línea
Subject(s): Other classification:
  • UDA-BG T20779
Online resources: Dissertation note: Ingeniero en Ciencias de la Computación Abstract: La investigación examina el desempeño de los modelos de reconocimiento de voz (speech-to-text) Whisper y Chirp en audios de emergencia del sistema ECU 911, analizando su precisión y velocidad en condiciones desafiantes, con profundos factores como la duración de los audios, niveles de decibelios, género de los alertantes, e incluso autore, el estudio revela los matices de cada modelo en situaciones reales a través de métricas de WER (Tasa de errores de palabra) y CER (Tasa de errores de caracteres), se compararon los modelos para descubrir cómo los parámetros avanzados de Whisper, como best of y best size, impulsan su rendimiento a nuevos niveles, los resultados son excelentes: el modelo Whisper LARGE optimizado con parámetros específicos y el modelo Chirp TELEPHONY alcanzaron un equilibrio entre precisión y velocidad, demostrando que una selección precisa de parámetros puede transformar los resultados de manera espectacular. Las pruebas, realizadas en un entorno que simula las condiciones operativas de emergencias con valores menores de WER de 0.2 y CER menores de 0.09, confirman que ambos modelos son altamente efectivos para mejorar la respuesta en emergencias, este estudio concluye que la combinación de precisión y velocidad en estos modelos de inteligencia artificial tiene un impacto real y positivo en la eficiencia de los sistemas de respuesta.
Tags from this library: No tags from this library for this title. Log in to add tags.
Star ratings
    Average rating: 0.0 (0 votes)
Holdings
Item type Current library Shelving location Call number Status Barcode
Tesis Biblioteca Hernán Malo González Digital UDA-BG T20779 (Browse shelf(Opens below)) Available T20779

Ingeniero en Ciencias de la Computación

La investigación examina el desempeño de los modelos de reconocimiento de voz (speech-to-text) Whisper y Chirp en audios de emergencia del sistema ECU 911, analizando su precisión y velocidad en condiciones desafiantes, con profundos factores como la duración de los audios, niveles de decibelios, género de los alertantes, e incluso autore, el estudio revela los matices de cada modelo en situaciones reales a través de métricas de WER (Tasa de errores de palabra) y CER (Tasa de errores de caracteres), se compararon los modelos para descubrir cómo los parámetros avanzados de Whisper, como best of y best size, impulsan su rendimiento a nuevos niveles, los resultados son excelentes: el modelo Whisper LARGE optimizado con parámetros específicos y el modelo Chirp TELEPHONY alcanzaron un equilibrio entre precisión y velocidad, demostrando que una selección precisa de parámetros puede transformar los resultados de manera espectacular. Las pruebas, realizadas en un entorno que simula las condiciones operativas de emergencias con valores menores de WER de 0.2 y CER menores de 0.09, confirman que ambos modelos son altamente efectivos para mejorar la respuesta en emergencias, este estudio concluye que la combinación de precisión y velocidad en estos modelos de inteligencia artificial tiene un impacto real y positivo en la eficiencia de los sistemas de respuesta.

There are no comments on this title.

to post a comment.

Catálogo
Digital