IA da Anthropic supera 80% de precisão em teste de programação e redefine mercado

A Anthropic lançou em 24 de novembro de 2025 o Claude Opus 4.5, uma versão avançada de seu modelo de inteligência artificial voltado para programação. Este lançamento representa um marco significativo, pois é o primeiro sistema a ultrapassar 80% de precisão no teste SWE-bench Verified, alcançando 80,9% em tarefas de programação. Este modelo foi otimizado para executar tarefas de forma autônoma, identificando problemas em códigos e propondo soluções sem supervisão humana constante.

O teste SWE-bench Verified é crucial para avaliar a capacidade de modelos de IA em resolver problemas reais de engenharia de software. Utilizando questões reais do GitHub, o teste exige que o modelo compreenda o contexto do código e ofereça soluções funcionais. O Claude Opus 4.5, com 80,9% de acurácia, aproxima-se do desempenho de engenheiros humanos, que alcançam cerca de 90%.

Em 2025, a disputa entre Anthropic, OpenAI e Google intensificou-se. A OpenAI, com seu GPT-5.1-Codex-Max, liderava em programação até o lançamento do Claude Opus 4.5, que superou os 78,3% do modelo da OpenAI. O Google, com o Gemini 3 Pro, atingiu 76,5%, destacando-se por integrar suas capacidades de IA com seu ecossistema de produtos.

O Claude Opus 4.5 abre novas possibilidades para o marketing digital, permitindo a automação de tarefas complexas e a adaptação contínua de estratégias. Empresas que adotaram agentes baseados nesse modelo relataram uma redução de até 40% no tempo de desenvolvimento de campanhas e um aumento de 25% nas taxas de conversão.

A funcionalidade de conversas infinitas do modelo permite manter o contexto em interações prolongadas, gerando resumos contextuais automáticos. Integrações com ferramentas como Chrome e Excel facilitam a adoção empresarial, permitindo automação inteligente e análise de dados avançada.

O lançamento do Claude Opus 4.5 estabelece novos parâmetros para ferramentas de IA, combinando desempenho técnico superior com aplicações práticas. A Anthropic relatou um aumento de 40% em consultas empresariais logo após o lançamento, e analistas preveem um crescimento de 200% na adoção de agentes de IA em marketing nos próximos 18 meses. A competição promete se intensificar, com OpenAI e Google planejando novos lançamentos em 2026.

Seu concorrente já está no Google. E você?

Comece agora com 7 dias grátis e 5 artigos bônus. Sem cartão de crédito. Mais de 800 empresas já confiam na Airticles

Seu site na primeira página do Google.

SEO Automatizado para empresas que querem crescer sem depender de anúncios.

Airticles Tecnologia Ltda | 59.780.182/0001-03. © Todos os direitos reservados.