- Latam-GPT usará dados culturais locais no treinamento.
- Modelo será aberto, público e adaptável por desenvolvedores.
- Consórcio usará energia limpa para reduzir impacto ambiental.
A América Latina deu um passo ousado na corrida global da inteligência artificial. Um consórcio de países anunciou o desenvolvimento do Latam-GPT, um modelo de linguagem generativa inspirado no ChatGPT, mas com uma proposta clara: refletir melhor a diversidade cultural, linguística e social da América Latina e do Caribe.
A iniciativa começou no Chile, após pesquisadores do Centro Nacional de Inteligência Artificial (CENIA) se decepcionarem com uma resposta do ChatGPT à pergunta: “Descreva a cultura latino-americana em 500 caracteres.” Embora tecnicamente correta, a resposta soou genérica demais. O CENIA concluiu que a compreensão do contexto latino-americano precisava de mais riqueza e refinamento.
A proposta do Latam-GPT vai além de responder melhor a perguntas culturais e busca fortalecer também a soberania tecnológica da região. Além disso, o projeto busca reduzir a dependência de modelos estrangeiros e oferecer uma ferramenta pública, aberta e adaptável a contextos locais em áreas como educação, meio ambiente, economia e política.
Latam-GPT será treinado com dados locais e energia limpa
O modelo Latam-GPT usará mais de 8 terabytes de dados provenientes de bibliotecas públicas e privadas. A Universidade de Tarapacá, no norte do Chile, fornecerá a infraestrutura para o treinamento, que utilizará energia renovável da região de Arica. Segundo o CENIA, o consumo na primeira fase será de 135 kWh, sem uso de água para resfriamento, e com emissão de CO₂ estimada em 0,96 tonelada.
O supercomputador dedicado ao projeto contará com 12 nós equipados com GPUs NVIDIA H200, suficientes para treinar um modelo com 50 trilhões de parâmetros, próximo ao GPT-3.5. A expectativa é que a primeira versão esteja acessível no ainda em 2025, com atualizações contínuas ao longo do tempo.
Com financiamento compartilhado entre governos, universidades e instituições da América Latina, Espanha e EUA, o projeto já conta com apoio de países como México, Argentina, Colômbia, Peru, Uruguai, Costa Rica e Equador.
Rodrigo Durán, gerente do CENIA, destaca que o objetivo não é competir com gigantes como OpenAI:
Queremos nosso próprio modelo para a América Latina e o Caribe, com os requisitos culturais e desafios que isso implica, ou seja, entender os diferentes dialetos, história e aspectos culturais. Para conseguir isso, estamos gerando nossas próprias métricas que podem avaliar esse conhecimento, bem como coletar dados relevantes.
O México, por exemplo, já incluiu o projeto em sua agenda de soberania tecnológica dentro do chamado Plano México.
Apesar do otimismo, especialistas como Ulises Mejías, da Universidade Estadual de Nova York, fazem ressalvas. Ele afirma que o Latam-GPT vai precisar provar que oferece uma alternativa real aos modelos que priorizam lucro e redução de custos.
Por enquanto, o projeto avança. E, mesmo com dúvidas no ar, uma coisa é certa: a América Latina decidiu escrever seu próprio código na era da IA.