Trabajando fine-tuning con el proyecto LARA

El alumnado del Curso de Especialización en Inteligencia Artificial y Big Data del IES Polígono Sur continúa avanzando en su formación práctica mediante el desarrollo de proyectos reales vinculados al análisis de datos y al entrenamiento de modelos de aprendizaje automático.

En esta ocasión, organizado en grupos de dos y tres personas, el alumnado ha llevado a cabo una tarea de análisis de datos utilizando la base de datos del proyecto LARA. A partir de este trabajo previo de selección y preparación de datos, cada grupo ha realizado un proceso de fine-tuning del modelo de reconocimiento de voz Whisper.

El objetivo principal de la actividad ha sido doble: por un lado, comprender el comportamiento del modelo ante distintos conjuntos de datos y, por otro, evaluar si el ajuste fino realizado permitía mejorar su rendimiento en tareas específicas de transcripción.

Este enfoque práctico ha permitido al alumnado enfrentarse a retos reales del ámbito de la inteligencia artificial, como la calidad de los datos, la especialización de modelos y la evaluación de resultados, desarrollando así competencias clave para su futuro profesional.

Un aspecto especialmente interesante del trabajo ha sido el enfoque adoptado por cada grupo. Mientras algunos equipos han centrado su análisis en datos relacionados con problemas en el habla, otros han trabajado con subconjuntos organizados por género o por rangos de edad. Esta diversidad de enfoques ha permitido comparar cómo influyen estas variables en el rendimiento del modelo, evidenciando la importancia del contexto y de la representatividad de los datos en sistemas de inteligencia artificial.

Conclusiones del proyecto

Tras el desarrollo de la actividad, el alumnado ha podido extraer una conclusión común: uno de los principales retos en el entrenamiento y mejora de modelos de inteligencia artificial no es únicamente el modelo en sí, sino la disponibilidad de datos adecuados.

En muchos de los casos analizados, la falta de volumen de datos específico —ya sea de personas con determinados problemas en el habla, de ciertos rangos de edad o de perfiles concretos— ha limitado la capacidad de los modelos para mejorar de forma significativa tras el fine-tuning. Esta situación pone de manifiesto la necesidad de contar con conjuntos de datos más amplios, variados y equilibrados.

Asimismo, también se ha identificado como limitación relevante la disponibilidad de recursos necesarios para entrenar estos modelos, especialmente en lo que respecta a capacidad de cómputo y tiempo de procesamiento, factores clave en proyectos reales de inteligencia artificial.

Proyecto de Investigación Aplicada – LARA

Deja una respuesta Cancelar la respuesta