IA da Anthropic supera 80% de precisão em teste de programação e redefine mercado

A Anthropic lançou em 24 de novembro de 2025 o Claude Opus 4.5, uma versão avançada de seu modelo de inteligência artificial voltado para programação. Este lançamento representa um marco significativo, pois é o primeiro sistema a ultrapassar 80% de precisão no teste SWE-bench Verified, alcançando 80,9% em tarefas de programação. Este modelo foi otimizado para executar tarefas de forma autônoma, identificando problemas em códigos e propondo soluções sem supervisão humana constante.

O teste SWE-bench Verified é crucial para avaliar a capacidade de modelos de IA em resolver problemas reais de engenharia de software. Utilizando questões reais do GitHub, o teste exige que o modelo compreenda o contexto do código e ofereça soluções funcionais. O Claude Opus 4.5, com 80,9% de acurácia, aproxima-se do desempenho de engenheiros humanos, que alcançam cerca de 90%.

Em 2025, a disputa entre Anthropic, OpenAI e Google intensificou-se. A OpenAI, com seu GPT-5.1-Codex-Max, liderava em programação até o lançamento do Claude Opus 4.5, que superou os 78,3% do modelo da OpenAI. O Google, com o Gemini 3 Pro, atingiu 76,5%, destacando-se por integrar suas capacidades de IA com seu ecossistema de produtos.

O Claude Opus 4.5 abre novas possibilidades para o marketing digital, permitindo a automação de tarefas complexas e a adaptação contínua de estratégias. Empresas que adotaram agentes baseados nesse modelo relataram uma redução de até 40% no tempo de desenvolvimento de campanhas e um aumento de 25% nas taxas de conversão.

A funcionalidade de conversas infinitas do modelo permite manter o contexto em interações prolongadas, gerando resumos contextuais automáticos. Integrações com ferramentas como Chrome e Excel facilitam a adoção empresarial, permitindo automação inteligente e análise de dados avançada.

O lançamento do Claude Opus 4.5 estabelece novos parâmetros para ferramentas de IA, combinando desempenho técnico superior com aplicações práticas. A Anthropic relatou um aumento de 40% em consultas empresariais logo após o lançamento, e analistas preveem um crescimento de 200% na adoção de agentes de IA em marketing nos próximos 18 meses. A competição promete se intensificar, com OpenAI e Google planejando novos lançamentos em 2026.