Clasificación jerárquica de los textos de las conversaciones del ECU911 utilizando modelos de lenguaje largos
Flores Sánchez, Juan Gabriel,
Clasificación jerárquica de los textos de las conversaciones del ECU911 utilizando modelos de lenguaje largos - 31 páginas Digital
Ingeniero en Sistemas y Telemática
El estudio desarrolló un método de clasificación jerárquica para analizar las conversaciones del ECU 911, integrando modelos de lenguaje con arquitectura LLaMA (ej. LLaMa 3.1 8B Instruct), utilizando la librería BERTopic y técnicas de clustering aglomerativo. El método organizó los textos en categorías y subcategorías, capturando relaciones semánticas complejas y ofreciendo un análisis temático claro en el dominio de seguridad ciudadana. El uso de métricas de coherencia y diversidad temática aseguró asignaciones confiables, mientras que las etiquetas generadas automáticamente facilitaron la interpretación de los tópicos. El principal aporte del estudio se basa en la adaptación de estas técnicas al idioma español, proponiendo una solución innovadora para gestionar grandes volúmenes de datos textuales en los textos de las llamadas de emergencias. Aunque se evidencian limitaciones, como el solapamiento temático y la necesidad de representaciones vectoriales específicas, los resultados demuestran la viabilidad y robustez del modelo. Este trabajo establece una base sólida para futuras investigaciones y aplicaciones en clasificación jerárquica en otros contextos.
CLASIFICACIÓN JERÁRQUICA
ECU 911
EMBEDDINGS
INTELIGENCIA ARTIFICIAL-IA
PROCESAMIENTO DE LENGUAJE NATURAL-PLN
SEGURIDAD CIUDADANA
Clasificación jerárquica de los textos de las conversaciones del ECU911 utilizando modelos de lenguaje largos - 31 páginas Digital
Ingeniero en Sistemas y Telemática
El estudio desarrolló un método de clasificación jerárquica para analizar las conversaciones del ECU 911, integrando modelos de lenguaje con arquitectura LLaMA (ej. LLaMa 3.1 8B Instruct), utilizando la librería BERTopic y técnicas de clustering aglomerativo. El método organizó los textos en categorías y subcategorías, capturando relaciones semánticas complejas y ofreciendo un análisis temático claro en el dominio de seguridad ciudadana. El uso de métricas de coherencia y diversidad temática aseguró asignaciones confiables, mientras que las etiquetas generadas automáticamente facilitaron la interpretación de los tópicos. El principal aporte del estudio se basa en la adaptación de estas técnicas al idioma español, proponiendo una solución innovadora para gestionar grandes volúmenes de datos textuales en los textos de las llamadas de emergencias. Aunque se evidencian limitaciones, como el solapamiento temático y la necesidad de representaciones vectoriales específicas, los resultados demuestran la viabilidad y robustez del modelo. Este trabajo establece una base sólida para futuras investigaciones y aplicaciones en clasificación jerárquica en otros contextos.
CLASIFICACIÓN JERÁRQUICA
ECU 911
EMBEDDINGS
INTELIGENCIA ARTIFICIAL-IA
PROCESAMIENTO DE LENGUAJE NATURAL-PLN
SEGURIDAD CIUDADANA