Santiago, Chile.- Se presentó el martes Latam-GPT, el primer gran modelo lingüístico de inteligencia artificial entrenado con datos que representan las diversas culturas y dialectos de América Latina. Desarrollado por el Centro Nacional de Inteligencia Artificial (CENIA) durante dos años, el proyecto de código abierto busca reflejar las realidades regionales y fortalecer la presencia latinoamericana en la carrera global por la IA.
El modelo surgió de una colaboración con más de 30 instituciones de Argentina, Brasil, Chile, Colombia, Ecuador, México, Perú y Uruguay. Utiliza un conjunto masivo de datos regionales —más de ocho terabytes, equivalentes a millones de libros— que hasta ahora habían quedado fuera de los grandes modelos globales, mayoritariamente entrenados en inglés.
El presidente Gabriel Boric celebró el lanzamiento y subrayó su relevancia estratégica. “La inteligencia artificial es la mayor revolución tecnológica del último tiempo y desde Latinoamérica y el Caribe es estratégico y urgente que tengamos un rol”, afirmó. Agregó que incorporar datos e identidad latinoamericanas es clave para avanzar hacia una soberanía tecnológica y cultural.
Rodrigo Durán, director ejecutivo de CENIA, explicó que Latam-GPT ofrece un desempeño más preciso y eficiente en temas latinoamericanos gracias a una proporción inédita de datos regionales. El entrenamiento combinó información de fuentes privadas, obtenida mediante alianzas, con datos sintéticos para cubrir áreas subrepresentadas. Gabriela Arriagada, investigadora y jefa del equipo de ética del proyecto, destacó que el enfoque permitió identificar fallas en modelos previos y mejorar la representación cultural de la región.
Por ahora, el modelo opera principalmente en español y portugués, con planes de incorporar lenguas indígenas en etapas posteriores. No pretende competir directamente con herramientas como ChatGPT o Gemini, sino servir como base para aplicaciones futuras más adaptadas a las necesidades locales.
Con un presupuesto modesto de 550,000 dólares —aportados por CENIA y el Banco de Desarrollo de América Latina (CAF)—, la primera versión se desarrolló en la nube de Amazon Web Services y se lanzará a fines de febrero. Las siguientes iteraciones se entrenarán en una supercomputadora de la Universidad de Tarapacá, en el norte de Chile, cuyo costo ronda los 4.5 millones de dólares, a partir del primer semestre de 2026.
Luis Chiruzzo, profesor de la Universidad de la República en Uruguay, calificó el avance como un hito importante. “Es un avance significativo que permitirá a la región posicionarse con una voz propia”, señaló, aunque reconoció las limitaciones frente a las grandes corporaciones tecnológicas por la diferencia de recursos.
La unión colaborativa de países latinoamericanos demuestra capacidad técnica para desarrollar y comprender esta tecnología, un paso esencial también para participar en debates regulatorios con conocimiento propio.