Mercury Coder revoluciona IA com geração de texto ultrarrápida

Mercury Coder é 19x mais rápido que modelos convencionais.
Nova abordagem promete mais eficiência sem perder qualidade.
Inovação pode impactar produtividade e IA conversacional.

A Inception Labs anunciou, na última quinta-feira (27), o Mercury Coder, um modelo de IA que usa técnicas de difusão para gerar texto de forma mais rápida e eficiente.

Diferente dos modelos tradicionais que criam texto palavra por palavra, o Mercury gera respostas completas simultaneamente, refinando-as de um estado inicialmente mascarado para um texto coerente. Essa abordagem inspirada em modelos de geração de imagem, como Stable Diffusion e DALL-E, permite um processamento mais veloz e fluido.

Mercury Coder promete velocidade e desempenho inigualáveis

Os modelos tradicionais, como o GPT-4o, geram texto de forma autoregressiva, construindo frases um token por vez. Isso gera latência, pois cada palavra depende da anterior. O Mercury Coder elimina essa limitação ao trabalhar com um sistema de redução de ruído, revelando todo o texto de uma vez.

Segundo a Inception Labs, o Mercury Coder alcança uma velocidade de 1.109 tokens por segundo em GPUs Nvidia H100, tornando-o 19 vezes mais rápido que o GPT-4o Mini. Esse desempenho superior também supera modelos otimizados para velocidade, como o Gemini 2.0 Flash-Lite, que atinge apenas 201 tokens por segundo.

O modelo Mercury ainda demonstrou excelente desempenho em benchmarks de codificação, atingindo 88,0% no HumanEval e 77,1% no MBPP, resultados comparáveis ao GPT-4o Mini, mas com velocidade muito superior. Essas melhorias podem revolucionar aplicações como ferramentas de autocompletar código, chatbots e agentes de IA.

CONTINUA APÓS A PUBLICIDADE

A abordagem baseada em difusão envolve múltiplas passagens pela rede neural, mas o processamento paralelo compensa essa demanda. A possibilidade de respostas rápidas pode impactar positivamente a produtividade de desenvolvedores e otimizar interações com IA.

Especialistas do setor vêm essa inovação como uma nova direção promissora para a IA generativa. O ex-pesquisador da OpenAI, Andrej Karpathy, destacou que a abordagem do Mercury Coder pode trazer novos pontos fortes para o desenvolvimento de LLMs.

Este modelo tem o potencial de ser diferente e possivelmente mostrar uma psicologia nova e única, ou novos pontos fortes e fracos. Eu encorajo as pessoas a experimentá-lo!

Atualmente, o modelo Mercury Coder pode ser testado no site de demonstração da Inception Labs, enquanto o código do LLaDA, um modelo semelhante, está disponível no Hugging Face para experimentação aberta.

Mercury Coder promete velocidade e desempenho inigualáveis

Leia Também

Conteúdo de IA não consensual explode com apps da China

Microsoft cria IA própria para competir com OpenAI

X expande acesso ao Grok e integra IA a respostas na plataforma

OpenAI quer cobrar mais de R$ 115 mil por mês em agente de IA

Google expande IA na pesquisa e Apple implementa na App Store