Walk-forward analysis — teste de robustez para estratégias

Última verificação: · Conteúdo atemporal
Aviso de risco · YMYL Este artigo tem fins exclusivamente educacionais e não constitui aconselhamento de investimento. Operar no mercado Forex envolve alto risco de perda de capital — a ESMA informa que entre 74% e 89% das contas de investidores de varejo perdem dinheiro.

A walk-forward analysis é o teste de robustez que Robert Pardo formalizou em The Evaluation and Optimization of Trading Strategies, publicado pela Wiley em 2008, e desde então os fundos sistemáticos a tratam como o filtro padrão antes de deixar uma estratégia chegar perto do capital real. A ideia é simples: em vez de otimizar os parâmetros uma única vez sobre toda a história disponível, você corta a história em pares repetidos de janelas in-sample e out-of-sample, e a estratégia só merece o deployment se mantiver a sua vantagem em dados contra os quais nunca foi calibrada.

Por que o curve-fitting é o problema que a walk-forward resolve

Um backtest comum, no qual o trader varre mil combinações de parâmetros e escolhe a melhor, quase sempre produz uma curva de capital mais bonita do que qualquer coisa que a realidade vá entregar. O otimizador vê ruído na história e o trata como sinal — uma média móvel de 14 períodos venceu a de 12 não porque seja mais sábia, mas porque foi assim que o ruído se alinhou naqueles meses específicos. Os sinais de alerta dessa doença, e como detectá-los no seu próprio trabalho, estão catalogados na nossa seção sobre prática e backtest de estratégias: uma curva impossivelmente suave, uma taxa de acerto acima de 75 por cento em 200 trades, um profit factor acima de 3,5 e sensibilidade aguda a pequenas mudanças de parâmetro. A walk-forward retira do otimizador a capacidade de aprender os dados sobre os quais a estratégia será finalmente julgada.

A mecânica da janela móvel — passo a passo

Primeiro você divide a história — tipicamente dez anos de dados limpos sobre os majors em M30 ou superior — em uma sequência de blocos. A primeira janela in-sample pode cobrir 2018 a 2021, com a janela out-of-sample correspondente em 2022. No bloco in-sample você roda uma otimização completa: deixe o tester varrer centenas de combinações de parâmetros e devolver aquela com o melhor retorno a um drawdown aceitável. Depois você congela o conjunto vencedor e roda a estratégia com esses parâmetros exatos sobre o out-of-sample de 2022 — sem editar código, sem reajustar. O terceiro passo é deslocar a janela pelo comprimento do bloco out-of-sample: novo in-sample 2019 a 2022, novo out-of-sample 2023. Otimizar de novo, congelar, testar, deslocar. Depois de cinco a sete iterações desse tipo você tem cinco a sete resultados out-of-sample independentes, e a média deles é o proxy mais honesto do que uma conta real vai entregar. A disciplina de gerenciamento de risco exige justamente esse tipo de evidência antes de arriscar capital. Se você ainda está escolhendo o ambiente de teste, vale conhecer as plataformas de trading e seus testadores integrados para casar a ferramenta com o seu fluxo de trabalho.

Móvel contra ancorada — as duas variantes

Na variante móvel (rolling) a janela in-sample tem comprimento fixo e avança como uma lagarta: sempre quatro anos, só que com início e fim diferentes. A estratégia esquece naturalmente o que aconteceu há muito tempo e se concentra nos anos mais recentes — o que na prática significa que reage mais rápido a uma mudança de regime. Depois do choque de volatilidade de 2020 ou do ciclo de alta de juros de 2022, uma estratégia walk-forward móvel já está, na iteração seguinte, operando com parâmetros calibrados para o novo mundo. A variante ancorada (anchored) mantém um ponto de partida fixo e deixa a janela in-sample crescer: 2018 a 2021 primeiro, depois 2018 a 2022, depois 2018 a 2023. Mais dados tendem a entregar parâmetros mais estáveis entre iterações, mas uma adaptação mais lenta. Uma regra prática útil: escolha a móvel para sistemas de trend-following, breakout e momentum; escolha a ancorada para estratégias estáveis de reversão à média apoiadas em níveis profundos de suporte e resistência.

Walk-forward efficiency e como lê-la

A WFE é a razão entre o retorno out-of-sample anualizado e o retorno in-sample anualizado, geralmente expressa como porcentagem. Valores próximos de um são suspeitos — esse nível de transferência perfeita quase nunca ocorre fora dos sistemas de trend-following mais simples e, quando ocorre, normalmente há algo vazando entre as janelas. A faixa de 0,5 a 0,75 é o habitat natural das estratégias robustas, e é essa faixa que justifica pensar em deployment real. Valores na banda de 0,3 a 0,5 sinalizam ajuste moderado ao ruído: a estratégia captura algo real, mas o conjunto de regras carrega graus de liberdade demais. Qualquer coisa abaixo de 0,3 é uma confissão clara de curve-fit, e a métrica está dizendo ao trader o que o ego prefere não ouvir — simplifique as regras, não persiga mais um teste no qual os números finalmente fiquem bonitos. Uma causa-raiz separada de uma WFE ruim é um indicador que repinta barras históricas — um sinal que repinta é inadequado para o teste walk-forward porque os dados in-sample parecem melhores do que jamais serão em tempo real.

Um exemplo ilustrativo — duas estratégias sob a lupa

Imagine duas estratégias em EUR/USD, ambas testadas em dados M30 cobrindo 2018 a 2023 na variante móvel, com uma janela in-sample de quatro anos e uma janela out-of-sample de um ano. Uma estratégia de breakout entrega, na primeira iteração, uma taxa de acerto in-sample de 70 por cento e um retorno anualizado de 30 por cento; na janela out-of-sample correspondente a taxa de acerto cai para 55 por cento e o retorno para 12 por cento ao ano. A WFE sai em 12 dividido por 30, ou seja, 0,4. Ao longo de cinco iterações a WFE mediana se estabiliza na banda de 0,38 a 0,45 — a estratégia captura uma vantagem real, mas a lógica de entrada está superespecificada e precisa ser simplificada. Uma segunda estratégia, um trend-follower construído sobre médias móveis, entrega 60 por cento de taxa de acerto in-sample e 25 por cento de retorno anualizado; out-of-sample 58 por cento e 20 por cento. WFE 0,8, parâmetros oscilam menos de 20 por cento entre iterações. Essa merece um lugar em forward testing adicional na demo. Todos os números são ilustrativos — mostram como ler o teste, não o que esperar de qualquer estratégia específica.

“O propósito inteiro da walk-forward analysis é revelar o desempenho em tempo real, com dinheiro real, de uma estratégia de trading sem de fato operá-la com dinheiro real em tempo real.” — Robert Pardo, 2008

O que a walk-forward não consegue fazer

Mesmo uma walk-forward limpa com WFE confortavelmente acima de 0,5 não promete lucratividade real. O teste se apoia em uma suposição silenciosa: o regime capturado pelas janelas out-of-sample precisa ser semelhante o bastante ao regime sob o qual a estratégia vai de fato operar. Se a história contém dois grandes choques de volatilidade e dois ciclos de juros, e a estratégia depois opera dentro de um longo range com baixa volatilidade e poucos movimentos puxados por manchetes, a média out-of-sample pode não refletir o que está acontecendo ao vivo. É por isso que o ofício consiste em empilhar três filtros: walk-forward com WFE na faixa segura, um forward test de três a seis meses na demo, e uma simulação de Monte Carlo no workshop do trader que reordena aleatoriamente as sequências de trades e revela a distribuição de curvas de capital possíveis. A walk-forward é uma peneira muito boa, não um oráculo — nenhum teste histórico é. A psicologia entra aqui também: o controle das emoções discutido em psicologia do trading é o que impede o trader de ignorar uma WFE ruim só porque o ego quer ver a estratégia rodando.

O que fazer agora

  1. Puxe o histórico de preços do par que você realmente opera e isole os últimos cinco anos de dados em M30 ou M15; particione-os em cinco pares de janelas — quatro anos in-sample mais um ano out-of-sample — com o ponto de partida deslocado de um ano entre iterações, para que você possa comparar os resultados out-of-sample em regimes diferentes e reunir pelo menos cinco observações independentes.
  2. Rode uma otimização completa de parâmetros apenas na primeira janela in-sample de 2018 a 2021, registre o conjunto vencedor, congele-o totalmente e execute um único backtest no out-of-sample correspondente de 2022 sem nenhum ajuste adicional; repita o ciclo para todos os cinco pares de janelas e capture os retornos anualizados e os drawdowns de cada rodada out-of-sample em uma planilha.
  3. Calcule a WFE de cada iteração como a razão entre o retorno out-of-sample e o retorno in-sample, depois olhe tanto a média quanto a mediana; se a mediana cair abaixo de 0,5 ou os parâmetros saltarem mais de 50 por cento entre iterações, a estratégia está ajustando ruído e a resposta correta é simplificar a lógica de entrada em vez de tentar mais uma rodada de otimização.
  4. Para qualquer estratégia que passe pelo gate da walk-forward com WFE acima de 0,5, adicione dois filtros extras antes de arriscar capital real: três a seis meses de forward testing numa conta demo usando os parâmetros congelados após a iteração final, mais uma simulação de Monte Carlo que permuta aleatoriamente a ordem dos trades e cujo drawdown no percentil 95 precisa caber dentro da sua tolerância pessoal ao risco.
Jarosław Wasiński
Sobre o autor

Jarosław Wasiński

Editor-chefe do MyBank.pl · Analista financeiro e de mercados

Analista e profissional independente com mais de 20 anos de experiência no setor financeiro. Fundador e editor-chefe do portal MyBank.pl, em atividade desde 2004. Análise fundamentalista dos mercados de câmbio e macroeconômicos desde 2007. Escreve a partir da perspectiva dos mercados globais, com atenção ao quadro regulatório europeu (ESMA) e brasileiro (CVM).

Fontes e bibliografia

  1. MetaQuotes MetaTrader 5 Strategy Tester — Forward Testing · opis trybu forward testing wbudowanego w Strategy Tester i jego roli w walce z over-optimisation www.metatrader5.com ↗
  2. MetaQuotes MetaTrader 5 Help — Strategy Optimization · oficjalna dokumentacja MT5 o optymalizacji parametrów i forward testing przeciw overfittingowi www.metatrader5.com ↗
  3. QuantStart Successful Backtesting of Algorithmic Trading Strategies — Part I · omówienie czterech klasycznych biasów backtestu: optimisation, look-ahead, survivorship, psychological tolerance www.quantstart.com ↗
  4. MQL5 Community Articles on Strategy Testing in MQL5 · kuratorska kolekcja artykułów wspólnoty MQL5 o backtestingu i walk-forward www.mql5.com ↗

Perguntas frequentes

Em que a walk-forward difere de uma simples divisão in-sample / out-of-sample?

A divisão hold-out clássica recorta uma única janela no fim da história e testa a estratégia ali com parâmetros calibrados sobre o resto. É uma verificação de robustez de tentativa única que lhe dá um único número e encerra o assunto. A walk-forward repete o exercício muitas vezes. A primeira janela out-of-sample é 2022, a segunda 2023, a terceira 2024, e os parâmetros são reotimizados sobre o bloco in-sample deslocado antes de cada uma. O trader, portanto, não depende da loteria de um único ano — cinco a dez janelas out-of-sample são agregadas e o impacto da sorte cai drasticamente. A segunda vantagem é que a walk-forward espelha como um deployment real de fato se comporta: otimiza, congela, opera um ano, reotimiza. É exatamente assim que a maioria dos fundos sistemáticos opera. Um único hold-out não captura essa ciclicidade.

Como interpreto a WFE e quais limiares importam?

A WFE é calculada como o retorno anualizado out-of-sample dividido pelo retorno anualizado in-sample: mostra quanto da promessa in-sample de fato sobreviveu ao contato com dados não vistos. Valores próximos de 1,0 são suspeitos — esse nível de transferência perfeita é raro fora dos sistemas de trend-following mais simples e, quando ocorre, normalmente há algo vazando entre as janelas. A faixa de 0,5 a 0,75 é a faixa típica das estratégias que valem o deployment e é a faixa que deve disparar uma consideração séria de capital real. A banda de 0,3 a 0,5 sinaliza ajuste moderado ao ruído: a estratégia captura algo real, mas o conjunto de regras carrega parâmetros demais. Qualquer coisa abaixo de 0,3 é uma confissão clara de curve-fit, e a métrica está dizendo ao trader o que o ego prefere não ouvir: simplifique as regras em vez de tentar mais um teste. O limiar nunca é o único critério — você também precisa olhar a estabilidade dos parâmetros entre as iterações (saltos acima de 50 por cento apontam para hipersensibilidade) e a distribuição dos drawdowns ao longo das janelas out-of-sample, não apenas a média.

Quando devo preferir a variante móvel à ancorada?

A variante móvel usa uma janela in-sample de comprimento fixo — digamos, quatro anos — e a desloca para a frente pelo comprimento da janela out-of-sample antes de cada iteração. O benefício é a resposta à mudança de regime: os anos de baixa volatilidade de 2017 a 2019 e os anos de alta volatilidade de 2020 a 2023 são mundos distintos, e uma estratégia de trend-following aprende o mundo em que realmente vai operar a seguir. A variante ancorada começa a janela in-sample em uma origem fixa e a deixa crescer — 2018 a 2021 primeiro, depois 2018 a 2022, depois 2018 a 2023. Mais dados entregam parâmetros mais estáveis ao custo de uma adaptação mais lenta. Como regra prática: escolha a móvel para sistemas de trend-following, breakout e momentum; escolha a ancorada para estratégias estáveis de reversão à média que se apoiam em níveis profundos de suporte e resistência. Com uma história curta de menos de cinco anos, a ancorada vence ao espremer o máximo dos dados disponíveis; com mais de dez anos de história limpa, a móvel se torna o padrão.

Uma walk-forward limpa garante lucratividade no trading real?

Não. A walk-forward é o teste estatístico de robustez mais forte ao alcance de um trader de varejo, mas carrega uma suposição silenciosa: o regime de mercado durante as janelas out-of-sample precisa ser semelhante o bastante ao regime real para que os parâmetros sobreviventes ainda façam sentido. Se a estratégia aprendeu o mercado de 2018 a 2023 — um período com dois grandes choques de volatilidade e dois ciclos de juros — e depois opera a partir de janeiro de 2024 num ambiente diferente (longo range, baixa volatilidade, poucos movimentos puxados por manchetes), a média out-of-sample pode não refletir o que está acontecendo ao vivo. É por isso que a abordagem disciplinada não consiste em depender só da walk-forward, mas em combiná-la com um forward test de três a seis meses na demo, mais uma simulação de Monte Carlo que reordena aleatoriamente a sequência de trades e revela a distribuição de curvas de capital possíveis. Apenas três luzes verdes juntas — walk-forward com WFE acima de 0,5, forward test na demo alinhado com as expectativas e um drawdown no percentil 95 da Monte Carlo abaixo de 25 por cento — justificam o uso de capital real.

Aprofunde-se · o guia completo