Mestre do Claude
Voltar pro blog
6 min de leitura

O Claude ficou mais burro? O que acontece de verdade

A sensação de que o Claude piorou é real e comum — mas quase nunca é o que você imagina. Veja as causas reais e como recuperar a qualidade na prática. Em pt-BR.

O Claude ficou mais burro? O que acontece de verdade

Você lembra da primeira semana: pedia uma função inteira e o Claude entregava certinho, de primeira, com testes. Hoje você pede a mesma coisa e parece que está falando com um estagiário no primeiro dia — ele esquece o que você disse duas mensagens atrás, inventa um detalhe, erra o óbvio. A conclusão bate na hora: "o Claude ficou mais burro".

Essa sensação é real e é uma das reclamações mais comuns de quem usa IA todo dia. Mas depois de investigar isso dezenas de vezes, a resposta quase nunca é a que parece. Raramente o modelo "piorou". O que mudou, na esmagadora maioria das vezes, foi o contexto, o tamanho da sessão e o jeito que você está pedindo. A boa notícia: tudo isso você controla. Vamos por partes.

O mito do "nerf secreto"

A explicação preferida da internet é a teoria da conspiração: "a Anthropic deixou o modelo mais burro pra economizar processamento". É a versão mais reconfortante, porque tira a culpa de quem pergunta. O problema é que ela não se sustenta.

O modelo que atende uma versão — digamos, o Opus 4.8 — é o mesmo de uma semana pra outra. Não existe um botão que "abaixa a inteligência" em silêncio sem trocar a versão. O que existe é variação natural: o mesmo prompt, rodado duas vezes, pode dar respostas de qualidade diferente. Uma resposta ruim no meio de dez boas não é prova de que o modelo decaiu — é só a aleatoriedade que sempre esteve lá. Você só reparou agora porque criou expectativa.

Isso não quer dizer que nunca muda nada. Às vezes muda — e quando muda, costuma ser um destes três motivos reais.

Causa nº 1: o contexto encheu (a mais comum de longe)

Esta é a verdadeira culpada na maioria dos casos, principalmente no Claude Code. Toda conversa tem uma janela de contexto: o espaço de memória que o modelo enxerga de uma vez. No começo da sessão, ela está vazia e limpa — o Claude vê só o seu pedido e responde afiado. Depois de uma hora de trabalho, dezenas de arquivos lidos e cinquenta idas e voltas, essa janela está abarrotada.

E aí acontece o que parece burrice: o pedido atual disputa atenção com milhares de tokens de coisa velha. O modelo tem mais dificuldade de achar o que importa no meio da bagunça, repete coisas, perde o fio. Não é cansaço — é diluição. Quanto mais entulho no contexto, pior a mira.

A cura é simples e quase ninguém faz: limpe o contexto ao trocar de assunto.

/clear     # zera o contexto — comece a próxima tarefa do zero
/compact   # resume a conversa atual antes de seguir, sem perder o fio

Regra prática: terminou uma tarefa e vai começar outra que não tem nada a ver? /clear. Tarefa longa que precisa continuar mas a sessão está pesada? /compact. Se você trabalha horas seguidas na mesma sessão sem nunca limpar, a queda de qualidade é garantida — e não tem nada a ver com o modelo. Pra sessões longas que precisam manter o fio, vale a técnica do handoff document.

Causa nº 2: o seu prompt emagreceu

Repare no que você fazia no começo. Você escrevia com capricho: explicava o objetivo, dava exemplo, dizia o que não queria. O Claude era novidade, então você caprichava. Hoje, semanas depois, você joga um "arruma isso aí" e espera a mesma mágica.

Não é o Claude que ficou preguiçoso. Foi o seu prompt. Com menos informação na mão, ele tem que adivinhar mais — e adivinhação é exatamente o que produz alucinação e resposta meia-boca. A qualidade da saída acompanha a qualidade da entrada, sempre.

O teste é honesto e leva dois minutos: pegue um pedido que "saiu ruim", reescreva ele com o capricho da primeira semana — objetivo claro, contexto, o que evitar — e rode de novo. Na maioria das vezes a "burrice" some. Se isso te incomoda repetir, é exatamente pra isso que serve o CLAUDE.md: você escreve uma vez as suas regras e convenções, e o Claude as carrega em toda sessão.

Causa nº 3: trocaram o modelo (e você não viu)

Esta é real e acontece. Quando sai uma versão nova, ela pode virar o padrão da sua conta. E aqui mora uma sutileza: um modelo novo pode ir melhor nos benchmarks e ainda assim parecer pior pra você — porque mudou o estilo, ficou mais conciso, mais cauteloso, ou resolve as coisas de um jeito diferente do que você acostumou. Não é menos capaz; é diferente, e diferente do que funcionava no seu fluxo dói.

Some a isso os modos de esforço de raciocínio: em alguns contextos você pode estar num modo mais rápido e leve, que pensa menos antes de responder. Resultado mais raso, mesma "marca" de modelo.

Antes de decretar que o Claude piorou, confira o que está rodando:

/model     # mostra e troca o modelo ativo no Claude Code

Muitas vezes a pessoa está comparando dois modelos diferentes sem perceber, e culpando "o Claude" pela diferença.

Causa nº 4: você está comparando tarefas diferentes

Um detalhe psicológico que pega todo mundo. A tarefa mágica da primeira semana provavelmente era simples — um CRUD, um script, algo bem dentro do que o modelo faz de olhos fechados. Conforme você ganha confiança, os pedidos ficam mais difíceis: arquiteturas maiores, bugs sutis, código legado torto. Aí a taxa de acerto cai — não porque o Claude regrediu, mas porque você subiu o nível do jogo.

É o mesmo erro de achar que um funcionário "rendia mais no começo": no começo você dava tarefas fáceis. A régua mudou junto com a sua ambição.

O checklist de 1 minuto quando "o Claude ficou burro"

Antes de reclamar (ou trocar de ferramenta), rode isto na ordem:

  1. /clear e refaz. Contexto limpo resolve a maioria dos casos. Se a qualidade voltar, era diluição.
  2. Capricha no prompt. Reescreve com objetivo, contexto e o que evitar — como na primeira semana.
  3. /model pra conferir. Garanta que está no modelo que você acha que está.
  4. Pergunta se a tarefa é mais difícil do que as que te impressionaram no começo. Quase sempre é.
  5. Roda de novo uma vez. Variação existe; uma amostra ruim não é tendência.

Na prática, 90% das vezes o problema morre no passo 1 ou 2. E, de quebra, contexto enxuto e prompt afiado também gastam menos tokens — você conserta a qualidade e a conta no mesmo movimento.

Resumindo

  • A sensação de que "o Claude ficou mais burro" é comum, mas a causa quase nunca é um nerf secreto — não há evidência disso.
  • A culpada nº 1 é o contexto cheio: sessão longa dilui a atenção do modelo. Use /clear e /compact.
  • A nº 2 é o seu prompt ter emagrecido com o tempo — capriche como na primeira semana e deixe as regras no CLAUDE.md.
  • Às vezes trocaram o modelo ou você está num modo mais leve — confira com /model.
  • E parte é ilusão: você está dando tarefas mais difíceis do que as que te encantaram no começo.
  • O reflexo certo: limpar contexto, caprichar no pedido e rodar de novo antes de culpar a máquina.

Quer evitar esses tropeços desde o começo? Vale a leitura de 7 erros comuns no Claude Code — vários nascem exatamente de confiar demais e caprichar de menos.

Fonte/inspiração: este post nasce de uma dor recorrente da comunidade que usa Claude e Claude Code no dia a dia; os conceitos de janela de contexto, variação de resposta e modos de raciocínio seguem o funcionamento documentado pela Anthropic em code.claude.com/docs. A redação, os exemplos e o checklist são deste blog.

Perguntas frequentes

A Anthropic deixa o Claude mais burro de propósito pra economizar?

Não há evidência disso, e a Anthropic nega que reduza a qualidade de um modelo já lançado em silêncio. O modelo que atende uma versão (por exemplo, Opus 4.8) é o mesmo ao longo do tempo. O que muda de verdade é o seu contexto, o tamanho da sessão e como você está pedindo. A teoria do 'nerf secreto' é a explicação mais popular justamente porque tira a responsabilidade de quem pergunta — mas raramente é a causa real da queda que você sentiu.

Por que o Claude piora ao longo de uma sessão longa?

Porque a janela de contexto vai enchendo. Quanto mais conversa, arquivos e idas e voltas acumulam, mais difícil fica pro modelo achar o que importa no meio de tudo — e a qualidade cai. Não é cansaço, é diluição: o pedido atual disputa atenção com milhares de tokens antigos. A solução é limpar o contexto com /clear quando trocar de assunto, ou /compact pra resumir antes de seguir.

Como sei se o problema é o modelo ou o meu prompt?

Faça o teste do contexto limpo: abra uma sessão nova (/clear), refaça o mesmo pedido com instruções claras e veja se a qualidade volta. Se voltar, o problema era contexto ou prompt — não o modelo. Se você reduziu o pedido a um one-liner vago depois de semanas de uso, quase sempre é isso: você ficou preguiçoso no prompt sem perceber, e a resposta acompanhou.

Trocaram o modelo sem me avisar?

Pode acontecer quando sai uma versão nova e ela vira o padrão, ou quando você está num modo de menor esforço de raciocínio. Um modelo novo pode ir melhor nos benchmarks e mesmo assim se comportar diferente no SEU fluxo, porque mudou o estilo de resposta. Confira qual modelo está ativo (no Claude Code, com /model) antes de concluir que 'o Claude piorou' — às vezes você está comparando dois modelos diferentes sem saber.


Curtiu? Receba os próximos por email.

Sem spam, sem newsletter chata. Só o que vale.

Cadastrar email