Backtest de uma estratégia: como fazer corretamente?

Última verificação: · Conteúdo atemporal
Aviso de risco · YMYL Este artigo tem fins exclusivamente educacionais e não constitui aconselhamento de investimento. Operar no mercado Forex envolve alto risco de perda de capital — a ESMA informa que entre 74% e 89% das contas de investidores de varejo perdem dinheiro.

Quando um leitor me conta que a estratégia dele entregou noventa e cinco por cento de operações vencedoras, eu já sei que a história não termina bem. Um backtest não é um oráculo nem uma promessa de dinheiro futuro. É uma ferramenta para falsear a sua ideia — para descobrir se as suas regras aguentaram diferentes regimes de mercado ou apenas descreveram um único episódio feliz. A seguir: como conduzir o teste com honestidade, onde estão as piores armadilhas e por que mesmo um backtest bem feito não garante uma conta real lucrativa.

Por que testar uma estratégia em dados históricos?

Antes de arriscar dinheiro de verdade, você verifica se as suas regras teriam dado lucro ao longo dos últimos anos. Se produziram expectativa positiva ao longo de cinco anos de condições variadas, provavelmente carregam alguma vantagem. Frágil — os mercados evoluem, os bancos centrais mudam de política, a liquidez migra —, mas é o melhor que temos. Um backtest filtra ideias inviáveis e deixa passar aquelas que merecem teste em conta demo e, mais tarde, uma pequena posição real. Nada além disso.

As regras precisam ser inequívocas, ou você está testando ficção

O primeiro passo derruba a maioria dos iniciantes. A estratégia precisa estar escrita de modo que um estranho, lendo as regras, abrisse operações idênticas. Uma entrada como "compro quando vejo uma tendência" não é uma estratégia; é um sentimento. Uma versão testável: "comprar no fechamento diário quando a EMA de cinquenta períodos estiver acima da EMA de duzentos períodos, o RSI de catorze períodos estiver abaixo de setenta e o preço tocar a média de vinte períodos vindo de cima; stop a 1.5 ATR(14) abaixo da entrada; alvo a 2.5 ATR acima; risco de um por cento do capital por operação." Só regras assim podem ser testadas com honestidade.

Um tema relacionado é como você descobre a sua vantagem operacional: se você não conhece a sua vantagem, o backtest vai lhe dizer isso de forma brutal e rápida. Vale a pena explorar as estratégias de trading e como identificar uma vantagem real. Para um contexto mais amplo sobre o teste dentro da rotina do trader em atividade, veja a oficina do trader na ForexMechanics.com.

Onde conseguir dados históricos e quantas amostras bastam?

Os dados são a segunda grande fonte de erro. O histórico de ticks de uma corretora nunca vai coincidir tick a tick com o de outra — modelo de execução diferente, fonte de liquidez diferente. Para uma estratégia de stop curto, essa diferença dita o resultado. Para o trabalho intradiário, busque dados de futuros da CME — centralizados e auditáveis. Para swing em candles diários, o histórico da corretora costuma ser adequado. A escolha da ferramenta também importa: aplicativos dedicados de teste podem dar vantagem sobre o simulador embutido na própria plataforma quando você precisa revisar a estratégia candle a candle.

A segunda questão é o tamanho da amostra. Uma regra consagrada diz pelo menos cem operações, caso contrário o resultado é facilmente um presente da sorte. Trinta operações maravilhosas em seis meses não lhe dizem nada. Cem é o limiar de significância estatística; profissionais miram em trezentas ou mais. Swing em D1 precisa de cinco anos, day trading de dois, scalping de um ano de histórico de ticks.

Cinco anos têm outra virtude: cobrem vários regimes. A última década nos deu tendências (DXY 2014–2017), um choque de volatilidade (março de 2020), um ciclo de aperto monetário (2022–2023) e consolidação ao longo de 2024. Uma estratégia que funciona apenas em um regime não é uma estratégia — é uma ilusão ajustada a uma só época.

Spread, comissão e slippage — sem eles o backtest mente

O backtest "milagroso" mais comum esqueceu de subtrair os custos. Para swing em H4 com alvo de 200 pips, um spread de 0,8 pip é quase invisível. Para um scalper que faz 30 operações por dia com alvo de cinco pips, o mesmo spread devora a maior parte da vantagem. Um backtest realista precisa incluir o spread da corretora, a comissão por lote e, para estratégias sensíveis à execução, o slippage (derrapagem de preço) — a diferença entre o preço que você vê ao clicar e o preço que de fato consegue.

Meu limite: se o lucro médio por operação for menor que o dobro do custo médio (spread, comissão e slippage presumido somados), a estratégia não tem margem de segurança. Duro, mas poupa meses de autoengano. Uma armadilha à parte para vigiar: indicadores que redesenham (repaint) os seus valores históricos vão parecer perfeitos em qualquer backtest, mas se comportam de forma completamente diferente no trading em tempo real.

Uma curva ajustada à história não é uma estratégia — é um museu

A armadilha em que a maioria dos traders autodidatas cai é o sobreajuste (over-fitting). Você testa trinta valores de um parâmetro, escolhe o melhor resultado e anuncia que o sistema rende quarenta por cento ao ano. O que você de fato fez foi otimizar para o ruído, não para o sinal. Quanto mais parâmetros o otimizador toca, maior a chance de o resultado ser coincidência. Robert Pardo, autor do clássico sobre avaliação de sistemas, é direto:

"O teste fora da amostra é a única medida honesta da qualidade de uma estratégia. Se um sistema não consegue manter a sua vantagem em dados que não viu durante a otimização, o sistema foi ajustado à história, não ao mercado." — Robert Pardo, The Evaluation and Optimization of Trading Strategies, Wiley, 2008.

Daí a divisão entre o ajuste dentro da amostra (in-sample) e a confirmação fora da amostra (out-of-sample), tipicamente setenta / trinta. Se o out-of-sample for materialmente pior, você tem sobreajuste — a estratégia não está pronta para uma conta real. Uma abordagem mais rigorosa é a análise walk-forward, que alterna uma janela de otimização com uma janela de verificação, rolando através da história. É a melhor proteção que temos contra a falsa confiança num backtest, e conecta diretamente a disciplina de gestão de risco que sustenta qualquer sistema viável.

Um exemplo hipotético — como ler os números com honestidade

Imagine uma estratégia swing em EUR/USD D1 testada entre 2019 e 2024 com o fluxo de trabalho típico de backtesting no MetaTrader. Resultado ilustrativo: 147 operações, 54 por cento de vencedoras, relação média retorno-risco de 2,3 para 1, profit factor 1,78, drawdown (rebaixamento da conta) de 14,5 por cento, retorno líquido de mais 87 por cento ao longo de cinco anos (cerca de 13,3 por cento compostos ao ano). Pouco espetacular, mas realista — um modelo, não uma conta real. Um próximo passo útil é uma simulação de Monte Carlo, que reembaralha a ordem das operações para mostrar como o capital poderia ter evoluído sob sequências diferentes.

O que fazer agora

O conhecimento sobre backtesting só começa a funcionar quando você roda um e compara o resultado com o seu diário de trading e a sua rotina de prática. Os cinco passos abaixo levam algumas tardes e poupam os erros mais comuns de um trader em formação.

  1. Escreva a estratégia num único arquivo de texto, de forma mecânica. Cada entrada, saída, stop loss e filtro precisa estar escrito de modo que outra pessoa, lendo as regras, abrisse operações idênticas. Se você tiver de acrescentar "depende da situação" em algum ponto, aperte a regra — um backtest não lê nas entrelinhas.
  2. Reúna cinco anos de dados para swing ou dois para day trading, divididos de antemão. Reserve os primeiros setenta por cento para o ajuste e tranque os últimos trinta até a estratégia estar congelada. Só então rode o teste na porção reservada — o seu exame de verdade.
  3. Injete custos realistas em cada simulação. Some o spread da corretora, a comissão por lote e um slippage presumido, com valores separados para janelas calmas e para sessões em torno de grandes divulgações. Se a estratégia perder mais de vinte por cento do lucro depois de incluídos os custos, a resposta é clara: não há margem de segurança.
  4. Imponha um piso rígido de cem operações. Se a janela produzir menos, estenda o histórico, acrescente instrumentos da mesma família ou aceite que o resultado é hipótese, não evidência. Anote o número de operações, o drawdown médio e a taxa de acerto — esses três números dizem mais do que o retorno de manchete.
  5. Após um backtest bem-sucedido, rode demo por pelo menos três meses antes de ir ao real. Compare a demo com o backtest — se a demo for nitidamente pior, desconfie de sobreajuste, custos subestimados ou um erro de programação. Volte às regras, não à esperança de que as coisas melhorem numa conta real. Um bom backtest nunca garante um bom resultado ao vivo — ele apenas conquista o direito de tentar.
Jarosław Wasiński
Sobre o autor

Jarosław Wasiński

Editor-chefe do MyBank.pl · Analista financeiro e de mercados

Analista e profissional independente com mais de 20 anos de experiência no setor financeiro. Fundador e editor-chefe do portal MyBank.pl, em atividade desde 2004. Análise fundamentalista dos mercados de câmbio e macroeconômicos desde 2007. Escreve a partir da perspectiva dos mercados globais, com atenção ao quadro regulatório europeu (ESMA) e brasileiro (CVM).

Fontes e bibliografia

  1. MetaQuotes Strategy Testing in MetaTrader 5 · oficjalna dokumentacja testera strategii (testowanie i optymalizacja na danych historycznych) www.metatrader5.com ↗
  2. MQL5 Reference Testing Trading Strategies · dokumentacja deweloperska MQL5: tryby generowania tików, symulacja spreadu, testy wielowalutowe www.mql5.com ↗
  3. Bank for International Settlements OTC foreign exchange turnover in April 2022 · Triennial Central Bank Survey — dane o strukturze rynku FX (kontekst dla backtestu instrumentów detalicznych) www.bis.org ↗

Perguntas frequentes

O que é o sobreajuste de uma estratégia?

O sobreajuste (curve-fitting, ajuste à curva) é a situação em que os parâmetros de uma estratégia foram afinados tão estreitamente às cotações passadas que não conseguem lidar com dados novos. O sintoma clássico é um backtest com noventa e cinco por cento de acerto e uma conta real com trinta. A razão é simples: uma taxa de acerto de noventa e cinco por cento não é sustentável no forex no longo prazo — estratégias reais ficam na faixa de cinquenta a sessenta por cento. Se o seu backtest mostra mais de setenta por cento de operações vencedoras, trate isso como um sinal de alerta e suspeite de sobreajuste até que se prove o contrário.

Qual software usar para o backtesting?

Para iniciantes, a escolha mais forte é o Strategy Tester embutido no MetaTrader 5: é gratuito e suporta testes multimoeda, dados de tick reais e otimização genética. O MetaTrader 4 ainda é usado, mas se limita a um único instrumento e um único intervalo de tempo. O Forex Tester 5 custa cerca de trezentos dólares e oferece teste manual candle a candle — uma boa ferramenta para traders que querem desenvolver a intuição visual das regras antes de automatizá-las. O Pine Script no TradingView basta para testes simples em um único instrumento. Na prática, a maioria dos testes sérios pertence ao MT5 ou a um ambiente de programação em Python com bibliotecas de backtesting dedicadas.

Quantos dados históricos preciso para um teste honesto?

Para estratégias swing e de posição, a regra prática é de pelo menos cinco anos de dados, para day trading dois anos e para scalping um ano de histórico de ticks genuíno. Essas janelas não são escolhidas por magia de calendário — elas existem para que o teste cubra diferentes regimes: tendência, lateralização e alta volatilidade. Independentemente do intervalo de tempo, há uma condição estatística: pelo menos cem operações no teste, para que o resultado não seja um golpe de sorte. Profissionais miram em trezentas ou mais. Se o seu histórico produzir menos operações, estenda a janela ou acrescente instrumentos da mesma família — caso contrário você está testando uma hipótese, não uma estratégia.

Como são os resultados realistas de um bom backtest?

Números realistas são uma taxa de acerto de cinquenta a sessenta por cento, uma relação média retorno-risco de pelo menos 2 para 1, um profit factor na faixa de 1,5 a 3,0 e um drawdown máximo abaixo de vinte por cento — com pelo menos cem operações e o número confirmado numa janela fora da amostra (out-of-sample). Um índice de Sharpe acima de um indica um retorno razoável em relação à volatilidade. Bandeiras vermelhas são uma taxa de acerto acima de oitenta por cento, um profit factor acima de cinco e um drawdown abaixo de cinco por cento — essa combinação quase sempre sinaliza sobreajuste, não vantagem real.

Aprofunde-se · o guia completo