Contribuir a construir el ecosistema de recursos abiertos del proyecto Aina para ayudar a escalar, adaptar y hacer más robusta la IA/TL en catalán.
Número máximo de concursantes: 3
Buscamos ideas para contribuir a construir el ecosistema de recursos abiertos de Aina para ayudar a escalar, adaptar y hacer más robusta la IA/TL en catalán.
Algunas ideas que pueden encajar en este reto son:
- Adaptación de modelos fundacionales de Aina (genéricos) a tareas o dominios específicos, utilizando datos propietarios o públicos.
- Operativización de modelos en entornos abiertos: desarrollo de recursos y/o módulos que permitan utilizar el catalán en aplicaciones y marcos de IA/TL donde el catalán no está incluido o está escasamente cubierto (por ejemplo: Mycroft, Rasa, SparkNLP, Spacy, etc.).
- Elaboración de instrucciones para la alineación de modelos generativos a tareas concretas o sectores específicos.
- Desarrollos y protocolos que faciliten y garanticen el suministro continuo de datos a los corpus de entrenamiento de Aina. Por ejemplo: herramientas de recopilación y compartición de datos; herramientas y protocolos asociados que permitan el uso secundario de datos; implementación de protocolos y/o APIs que permitan el acceso programático a datos de interés (públicos o privados) con licencias permisivas, etc.
Los productos resultantes en este reto (sean modelos adaptados a tarea o sector, código fuente e integraciones de sistemas que permitan la operativización de modelos en entornos abiertos y/o el suministro continuo de datos a los corpus, o bien conjuntos de datos para la alineación de modelos generativos) una vez evaluados y documentados se publicarán en abierto en el repositorio de referencia del proyecto Aina (Aina Kit). Toda propuesta deberá incluir también una prueba de concepto o un pequeño demostrador de su uso.
El reto no se limita a ningún campo de actividad específico, pero se valorará positivamente el impacto social de las propuestas.
Se fomenta la creatividad y la innovación en el diseño de soluciones que mejoren significativamente el ecosistema de recursos abiertos de Aina para ayudar a escalar, adaptar y hacer más robusta la IA/TL en catalán.
| Título | Descripción | Empresa |
|---|---|---|
| IA4KIT_JurAIcat | Modelo de lenguaje especializado en el dominio legal y administrativo | Asociación para el desarrollo de la Ingeniería del Conocimiento |
| TraduIA i CompartIA Hospitalaria | Solución para anonimizar y compartir información clínica en catalán | Fundació Privada Hospital Asil de Granollers |
| Transcripción, resumen y etiquetado automático de contenido audiovisual en catalán | Herramienta para generar y clasificar contenidos audiovisuales en catalán | Etiqmedia Soluciones Audiovisuales |