O que realmente faz uma IA funcionar de verdade (não é o modelo)

Existe uma crença popular que domina as conversas sobre inteligência artificial: o que importa é o modelo. GPT-5, Claude Opus, Gemini Ultra — as pessoas falam sobre esses nomes como se fossem a resposta para tudo. Escolha o modelo certo e a mágica acontece.

Essa crença está errada. Ou pelo menos, está incompleta de um jeito que custa caro para quem está tentando usar IA de verdade no trabalho.

O que realmente determina a qualidade do resultado não é o modelo. É o harness.

O que é um harness

Harness é uma palavra em inglês que não tem tradução perfeita para o português. Literalmente significa “arnês” — aquele conjunto de correias que prende um cavalo à carruagem, ou que segura um alpinista na parede. A ideia é essa: algo que conecta uma força bruta a um trabalho específico, de forma controlada.

No mundo da IA, o harness é tudo que existe ao redor do modelo. É o sistema que:

entrega o contexto certo antes de o modelo começar a trabalhar
define quais ferramentas o modelo pode usar
controla o que fica em memória e o que é descartado
gerencia o histórico da conversa sem deixar ele crescer infinitamente
determina quando pedir aprovação humana e quando agir sozinho

Sem harness, você tem um modelo recebendo uma pergunta no vácuo e tentando adivinhar o que fazer. Com um bom harness, você tem um sistema que funciona.

A analogia que vai ficar na sua cabeça

Pensa assim: o modelo de linguagem é um funcionário extraordinariamente talentoso. Ele sabe de quase tudo, consegue escrever, analisar, resolver problemas complexos, criar estratégias.

Mas esse funcionário chega todo dia com amnésia total. Não lembra do que foi combinado ontem. Não sabe onde estão os arquivos. Não tem acesso a nenhuma ferramenta. Só consegue se comunicar através de mensagens de texto.

O harness é o ambiente de trabalho que você monta para esse funcionário:

a mesa organizada com os documentos relevantes já abertos
as ferramentas disponíveis no lugar certo
o resumo do que foi feito ontem colado na parede
as regras da empresa escritas e visíveis
o histórico das últimas decisões à mão

Sem esse ambiente, o gênio é inútil. Com ele, é um colaborador de alto nível.

Por que isso importa mais do que o modelo

Sebastian Raschka, pesquisador de machine learning e autor de livros técnicos sobre LLMs, publicou recentemente um artigo desmontando a arquitetura de ferramentas como Claude Code e Codex. A conclusão dele foi direta:

“Much of the recent progress in practical LLM systems is not just about better models, but about how we use them.”

Ele vai além: como os modelos top de linha estão convergindo em capacidade bruta, o harness se torna o principal diferencial. Um modelo mediano com harness excelente pode superar um modelo superior rodando num chat simples.

Isso explica uma coisa que muita gente já percebeu mas não conseguia nomear: por que o mesmo Claude que você usa no chat parece muito mais poderoso dentro do Claude Code? Não é porque o modelo mudou. É porque o harness ao redor é completamente diferente.

Os seis componentes de um harness que funciona

Raschka identificou seis blocos fundamentais. Vale entender cada um.

1. Contexto vivo do ambiente

Antes de qualquer trabalho, o harness coleta informações sobre o ambiente atual: qual é o estado do projeto, quais arquivos existem, quais regras se aplicam, o que está em andamento. Sem isso, uma instrução como “ajuste o relatório de vendas” é ambígua demais. Com contexto, o modelo sabe exatamente o que fazer.

2. Prompt estável com cache inteligente

O harness divide o que é enviado ao modelo em duas partes: uma parte estável (as regras gerais, a descrição das ferramentas, o contexto do projeto — que muda pouco) e uma parte dinâmica (o pedido atual, as memórias recentes). A parte estável é reutilizada entre turnos, reduzindo custo e tempo. Você não precisa repetir “você é um assistente de e-commerce brasileiro” a cada mensagem quando isso está fixado no harness.

3. Ferramentas estruturadas com validação

Em vez de deixar o modelo improvisar comandos em linguagem natural, o harness oferece uma lista pré-definida de ações possíveis: ler arquivo, escrever, executar comando, buscar informação. Cada ação tem entradas claras e passa por validação antes de executar. O modelo não pode fazer nada fora do que foi definido — o que parece limitação mas é na verdade controle e previsibilidade.

4. Gerenciamento de contexto (anti-inchaço)

Sessões longas acumulam lixo: leituras antigas de arquivo, outputs extensos de ferramentas, histórico irrelevante. Um harness bem feito comprime o que é velho, mantém o que é recente em alta fidelidade, e deduplica o que apareceu mais de uma vez. A frase do Raschka aqui é precisa: “muito do que parece qualidade do modelo é na verdade qualidade do contexto.”

5. Memória estruturada em dois níveis

O harness mantém dois tipos de memória em disco. O transcript completo — tudo que aconteceu na sessão, para ser possível retomar depois. E a working memory — um resumo destilado do que importa agora: qual é a tarefa, quais arquivos são relevantes, quais decisões foram tomadas. São complementares e têm funções diferentes.

6. Subagentes com escopo controlado

Para tarefas complexas, o agente principal pode delegar subtarefas a agentes menores. O desafio aqui não é a delegação — é a limitação. Um subagente bem feito herda contexto suficiente para ser útil, mas opera dentro de restrições claras de escopo e permissões. Sem isso, você tem múltiplos agentes fazendo trabalho duplicado ou interferindo uns nos outros.

O que isso significa na prática para você

Se você usa IA no seu trabalho — seja para escrever, para analisar dados, para atender clientes, para gerenciar operações — há três níveis de harness que você pode implementar hoje:

Nível 1: o prompt de sistema. Parece simples, mas é um harness. Quando você define uma vez “você é um assistente para e-commerce brasileiro, responda em português informal, nunca use bullet points, foque em Mercado Livre e Shopee” — você criou contexto permanente. Você parou de repetir instrução a cada conversa.

Nível 2: o arquivo de contexto. Se você usa Claude Code ou qualquer ferramenta com suporte a arquivos de configuração, crie um CLAUDE.md ou similar com as regras do seu negócio, o estilo que você quer, os processos que devem ser seguidos. Todo agente que abrir aquele ambiente vai ler antes de começar. Isso é harness de repositório.

Nível 3: o harness customizado. Para processos repetitivos e específicos do seu negócio, você pode construir um sistema que monta o contexto automaticamente — busca os dados relevantes, formata como instrução, passa para o modelo e entrega o output processado. O modelo faz a parte cognitiva. O harness faz toda a plomagem.

A virada de chave

A mudança de mentalidade que separa quem usa IA de forma mediana de quem usa de forma excelente é simples: parar de pensar em “qual modelo escolher” e começar a pensar em “qual contexto estou entregando”.

O modelo é o motor. Mas motor sem carroceria, sem volante, sem combustível certo, sem estrada — não vai a lugar nenhum.

O harness é tudo isso junto.

E a boa notícia: você não precisa ser engenheiro para começar a construir o seu. Você precisa entender o princípio — e o princípio é esse: quanto melhor o ambiente que você monta ao redor do modelo, melhor o trabalho que ele faz para você.

Patrick Cardoso é empreendedor, CEO de um grupo de e-commerce com quatro marcas no mercado brasileiro, e escreve sobre o uso prático de inteligência artificial nos negócios.