Walk-Forward-Analyse — Robustheitstest für Handelsstrategien

Zuletzt geprüft: · Zeitloser Inhalt
Risikohinweis · YMYL Dieser Artikel dient ausschließlich zu Bildungszwecken und stellt keine Anlageberatung dar. Der Handel am Forex-Markt birgt ein hohes Risiko des Kapitalverlusts — die ESMA berichtet, dass zwischen 74 % und 89 % der Privatanlegerkonten Verluste erleiden.

Die Walk-Forward-Analyse ist der Robustheitstest, den Robert Pardo in The Evaluation and Optimization of Trading Strategies (Wiley, 2008) formalisierte — seitdem behandeln systematische Fonds ihn als Standardfilter, bevor eine Strategie echtes Kapital berührt. Die Grundidee ist schlicht: Statt Parameter einmalig über die gesamte verfügbare Geschichte zu optimieren, teilt man die Historie in sich wiederholende In-Sample/Out-of-Sample-Fensterpaare auf. Eine Strategie verdient den Live-Einsatz erst dann, wenn sie ihre Edge auch auf Daten beweist, gegen die sie nie kalibriert wurde.

Warum Curve-Fitting das Problem ist, das die Walk-Forward-Analyse löst

Ein einfacher Backtest, bei dem der Trader tausend Parameterkombinationen durchläuft und die beste auswählt, liefert fast immer eine Kapitalkurve, die schöner aussieht als alles, was die Realität jemals bringen wird. Der Optimierer sieht Rauschen in der History und behandelt es als Signal — ein 14-Perioden-Moving-Average schnitt besser ab als der 12-Perioden-MA nicht, weil er klüger ist, sondern weil sich das Rauschen in diesen bestimmten Monaten so zusammengefügt hat. Die Warnsignale dieser Krankheit und wie du sie in deiner eigenen Arbeit erkennst, sind in unserem Beitrag auf der Praxis-Seite zum korrekten Backtesting katalogisiert: eine unmöglich glatte Kurve, eine Win-Rate über 75 Prozent bei 200 Trades, ein Profit-Faktor über 3,5 und ausgeprägte Empfindlichkeit gegenüber kleinen Parameterverschiebungen. Die Walk-Forward-Analyse nimmt dem Optimierer die Möglichkeit, die Daten auswendig zu lernen, auf denen die Strategie am Ende beurteilt wird.

Die Mechanik des gleitenden Fensters — Schritt für Schritt

Zuerst teilst du die Historie — typischerweise zehn Jahre saubere Daten für Majors auf M30 oder höher — in eine Folge von Blöcken auf. Das erste In-Sample-Fenster könnte 2018 bis 2021 umfassen, mit dem passenden Out-of-Sample-Fenster in 2022. Auf dem In-Sample-Block führst du eine vollständige Optimierung durch: Der Tester durchsucht Hunderte von Parameterkombinationen und liefert diejenige mit dem besten Return bei akzeptablem Drawdown zurück. Dann frierst du den Gewinner ein und läufst die Strategie mit genau diesen Parametern über das Out-of-Sample-Fenster 2022 — keine Code-Änderungen, kein Nachoptimieren. Der dritte Schritt ist das Verschieben des Fensters um die Länge des Out-of-Sample-Blocks: neues In-Sample 2019 bis 2022, neues Out-of-Sample 2023. Erneut optimieren, einfrieren, testen, verschieben. Nach fünf bis sieben solchen Iterationen hast du fünf bis sieben unabhängige Out-of-Sample-Ergebnisse, und ihr Durchschnitt ist der ehrlichste verfügbare Proxy für das, was ein Live-Konto liefern wird. Die praktischen Einstellungen im MT5-Strategy-Tester sind auf der Praxis-Übersichtsseite zum MT4/MT5-Backtesting erklärt. Wenn du noch die richtige Testumgebung suchst, hilft dir der Vergleich zwischen Forex Tester und Strategy Tester beim Finden des passenden Werkzeugs für deinen Workflow.

Gleitend gegen verankert — die beiden Varianten

Bei der gleitenden Variante hat das In-Sample-Fenster eine feste Länge und bewegt sich wie eine Raupe vorwärts: immer vier Jahre, nur mit einem anderen Start- und Endpunkt. Die Strategie vergisst dabei natürlich, was lange zurückliegt, und konzentriert sich auf die jüngsten Jahre — was in der Praxis bedeutet, dass sie schneller auf einen Regimewechsel reagiert. Nach dem Volatilitätsschock 2020 oder dem Zinserhöhungszyklus 2022 handelt eine gleitende Walk-Forward-Strategie in der nächsten Iteration bereits mit Parametern, die auf die neue Welt zugeschnitten sind. Die verankerte Variante hält einen festen Startpunkt und lässt das In-Sample-Fenster wachsen: zunächst 2018 bis 2021, dann 2018 bis 2022, dann 2018 bis 2023. Mehr Daten liefern tendenziell stabilere Parameter zwischen den Iterationen, aber eine langsamere Anpassung. Eine nützliche Faustregel: Wähle die gleitende Variante für Trend-Following-, Breakout- und Momentum-Systeme; wähle die verankerte Variante für stabile Mean-Reversion-Strategien, die auf tiefen Unterstützungs- und Widerstandsniveaus basieren. Alles über die theoretische Grundlage liefert der Abschnitt zu Handelsstrategien auf dieser Seite.

Walk-Forward-Effizienz und wie du sie liest

Die WFE ist das Verhältnis des annualisierten Out-of-Sample-Returns zum annualisierten In-Sample-Return, üblicherweise als Prozentzahl ausgedrückt. Werte nahe 1 sind verdächtig — dieses Maß an perfekter Übertragung tritt fast nie außerhalb der einfachsten Trend-Following-Systeme auf, und wenn es doch der Fall ist, leckt meist etwas zwischen den Fenstern durch. Der Bereich von 0.5 bis 0.75 ist der natürliche Lebensraum robuster Strategien und derjenige, der den Gedanken an eine Live-Implementierung rechtfertigt. Werte im Bereich 0.3 bis 0.5 signalisieren eine moderate Anpassung an Rauschen: Die Strategie erfasst etwas Reales, aber das Regelwerk trägt zu viele Freiheitsgrade. Alles unter 0.3 ist ein klares Curve-Fitting-Geständnis, und die Kennzahl sagt dem Trader, was das Ego lieber nicht hören will — vereinfache die Regeln, jage nicht noch einem Test hinterher, in dem die Zahlen endlich schön aussehen. Ein separater Grund für ein schwaches WFE ist ein Indikator, der historische Bars nachträglich verändert (Repaint) — ein solches Signal ist für Walk-Forward-Tests völlig ungeeignet, weil die In-Sample-Daten besser aussehen als sie in Echtzeit je sein werden.

Ein anschauliches Beispiel — zwei Strategien unter der Lupe

Stell dir zwei Strategien auf EUR/USD vor, beide auf M30-Daten von 2018 bis 2023 in der gleitenden Variante getestet, mit einem vierjährigen In-Sample-Fenster und einem einjährigen Out-of-Sample-Fenster. Eine Breakout-Strategie liefert in der ersten Iteration eine In-Sample-Win-Rate von 70 Prozent und einen annualisierten Return von 30 Prozent; im passenden Out-of-Sample-Fenster fällt die Win-Rate auf 55 Prozent und der Return auf 12 Prozent jährlich. Die WFE ergibt sich aus 12 geteilt durch 30, also 0.4. Über fünf Iterationen pendelt sich der Median-WFE im Bereich 0.38 bis 0.45 ein — die Strategie erfasst eine echte Edge, aber die Einstiegslogik ist überspecifiziert und muss vereinfacht werden. Eine zweite Strategie, ein Trend-Follower auf Basis von Moving Averages, liefert eine In-Sample-Win-Rate von 60 Prozent und einen annualisierten Return von 25 Prozent; Out-of-Sample 58 Prozent und 20 Prozent. WFE 0.8, die Parameter driften zwischen den Iterationen um weniger als 20 Prozent. Diese Strategie verdient einen Platz im weiteren Demo-Forward-Testing. Alle Zahlen sind illustrativ — sie zeigen, wie der Test zu lesen ist, nicht was von einer konkreten Strategie zu erwarten ist.

„The whole purpose of walk-forward analysis is to reveal the real-time, real-money performance of a trading strategy without actually trading it with real money in real time.“ — Robert Pardo, 2008

Was die Walk-Forward-Analyse nicht kann

Selbst ein sauberer Walk-Forward-Test mit WFE deutlich über 0.5 verspricht keine Live-Profitabilität. Der Test beruht auf einer stillen Annahme: Das Regime, das die Out-of-Sample-Fenster erfassen, muss dem Regime, in dem die Strategie tatsächlich handelt, ähnlich genug sein. Wenn die Geschichte zwei große Volatilitätsschocks und zwei Zinszyklen enthält und die Strategie anschließend in ein langes Range-Marktumfeld mit niedriger Volatilität und wenigen headline-getriebenen Bewegungen tritt, spiegelt der Out-of-Sample-Durchschnitt möglicherweise nicht wider, was live passiert. Deshalb besteht das Handwerk im Stapeln dreier Filter: Walk-Forward mit WFE im sicheren Bereich, ein drei- bis sechsmonatiger Forward-Test auf einem Demo-Konto und eine Monte-Carlo-Simulation, die die Reihenfolge der Trades zufällig neu ordnet und die Verteilung möglicher Kapitalkurven offenbart. Die Walk-Forward-Analyse ist ein sehr gutes Sieb, kein Orakel — das ist kein historischer Test. Konzeptionellen Hintergrund zu Risikomanagement und dem richtigen Umgang mit solchen Kennzahlen findest du im Bereich Risikomanagement.

Was jetzt zu tun ist

  1. Lade die Kurshistorie des Paares herunter, das du tatsächlich handelst, und isoliere die letzten fünf Jahre M30- oder M15-Daten; teile sie in fünf Fensterpaare auf — jeweils vier Jahre In-Sample plus ein Jahr Out-of-Sample — wobei du den Startpunkt zwischen den Iterationen um ein Jahr verschiebst, damit du Out-of-Sample-Ergebnisse aus unterschiedlichen Marktregimen vergleichen und mindestens fünf unabhängige Beobachtungen sammeln kannst.
  2. Führe eine vollständige Parameteroptimierung ausschließlich auf dem ersten In-Sample-Fenster 2018 bis 2021 durch, halte den Gewinnersatz fest, friere ihn komplett ein und starte einen einzigen Backtest auf dem passenden Out-of-Sample-Fenster 2022 ohne weiteres Nachoptimieren; wiederhole den Zyklus für alle fünf Fensterpaare und halte annualisierte Returns sowie Drawdowns jedes Out-of-Sample-Laufs in einer Tabelle fest.
  3. Berechne die WFE für jede Iteration als Verhältnis von Out-of-Sample-Return zu In-Sample-Return und betrachte sowohl Mittelwert als auch Median; fällt der Median unter 0.5 oder springen die Parameter zwischen Iterationen um mehr als 50 Prozent, passt sich die Strategie dem Rauschen an — die richtige Antwort ist dann, die Einstiegslogik zu vereinfachen, nicht noch eine Optimierungsrunde zu starten.
  4. Lege für jede Strategie, die den Walk-Forward-Test mit WFE über 0.5 besteht, zwei weitere Filter an, bevor du echtes Kapital riskierst: drei bis sechs Monate Forward-Testing auf einem Demo-Konto mit den nach der letzten Iteration eingefrorenen Parametern sowie eine Monte-Carlo-Simulation, die die Trade-Reihenfolge zufällig permutiert und deren Drawdown im 95. Perzentil in deine persönliche Risikotoleranz passen muss.
Jarosław Wasiński
Über den Autor

Jarosław Wasiński

Chefredakteur bei MyBank.pl · Finanz- und Marktanalyst

Unabhängiger Analyst und Praktiker mit über 20 Jahren Erfahrung im Finanzsektor. Gründer und Chefredakteur des Portals MyBank.pl, aktiv seit 2004. Fundamentalanalyse der Devisen- und Makromärkte seit 2007. Schreibt aus europäischer Marktperspektive im regulatorischen Rahmen von ESMA und BaFin.

Quellen und Literatur

  1. MetaQuotes MetaTrader 5 Strategy Tester — Forward Testing · opis trybu forward testing wbudowanego w Strategy Tester i jego roli w walce z over-optimisation www.metatrader5.com ↗
  2. MetaQuotes MetaTrader 5 Help — Strategy Optimization · oficjalna dokumentacja MT5 o optymalizacji parametrów i forward testing przeciw overfittingowi www.metatrader5.com ↗
  3. QuantStart Successful Backtesting of Algorithmic Trading Strategies — Part I · omówienie czterech klasycznych biasów backtestu: optimisation, look-ahead, survivorship, psychological tolerance www.quantstart.com ↗
  4. MQL5 Community Articles on Strategy Testing in MQL5 · kuratorska kolekcja artykułów wspólnoty MQL5 o backtestingu i walk-forward www.mql5.com ↗

Häufig gestellte Fragen

Wie unterscheidet sich die Walk-Forward-Analyse von einem einfachen In-Sample-/Out-of-Sample-Split?

Der klassische Hold-out-Split schneidet ein einzelnes Fenster am Ende der History heraus und testet die Strategie dort mit Parametern, die auf dem Rest der Daten optimiert wurden. Das ist ein einmaliger Robustheitscheck, der dir eine einzige Zahl liefert — und damit ist die Sache erledigt. Die Walk-Forward-Analyse wiederholt diese Übung viele Male. Das erste Out-of-Sample-Fenster ist 2022, das zweite 2023, das dritte 2024, und die Parameter werden vor jedem Fenster auf dem weitergeschobenen In-Sample-Block neu optimiert. Der Trader verlässt sich daher nicht auf das Glücksspiel eines einzelnen Jahres — fünf bis zehn Out-of-Sample-Fenster werden aggregiert und der Einfluss des Zufalls sinkt dramatisch. Der zweite Vorteil: Die Walk-Forward-Analyse spiegelt wider, wie ein Live-Deployment tatsächlich funktioniert — optimieren, einfrieren, ein Jahr handeln, erneut optimieren. Genau so arbeiten die meisten systematischen Fonds. Ein einfacher Hold-out bildet diese Zyklizität nicht ab.

Wie interpretiere ich die WFE und welche Schwellenwerte sind entscheidend?

Die WFE berechnet sich als annualisierter Out-of-Sample-Return geteilt durch den annualisierten In-Sample-Return. Sie sagt dir, wie viel vom In-Sample-Versprechen den Kontakt mit ungesehenen Daten tatsächlich überlebt hat. Werte nahe 1.0 sind verdächtig — dieses Maß an perfekter Übertragung ist außerhalb sehr einfacher Trend-Following-Systeme selten, und wenn es auftritt, leckt normalerweise etwas zwischen den Fenstern. Der Bereich 0.5 bis 0.75 ist der typische Bereich für Strategien, die den Live-Einsatz verdienen und eine ernsthafte Überlegung auslösen sollten. Der Bereich 0.3 bis 0.5 signalisiert ein moderates Curve-Fitting — die Strategie erfasst etwas Reales, aber das Regelwerk trägt zu viele Parameter. Alles unter 0.3 ist ein klares Curve-Fitting-Geständnis, und die Kennzahl sagt dem Trader, was das Ego nicht hören will: vereinfache die Regeln, starte nicht noch einen Test. Der Schwellenwert ist nie das einzige Kriterium — du musst auch die Parameterstabilität zwischen den Iterationen prüfen (Sprünge über 50 Prozent deuten auf Überempfindlichkeit hin) und die Verteilung der Drawdowns über alle Out-of-Sample-Fenster betrachten, nicht nur den Durchschnitt.

Wann ist die gleitende Variante besser, wann die verankerte?

Die gleitende Variante verwendet ein In-Sample-Fenster fester Länge — etwa vier Jahre — und verschiebt es um die Länge des Out-of-Sample-Fensters vor jeder Iteration vorwärts. Der Vorteil ist die Reaktionsfähigkeit auf Regimewechsel: Die volatilitätsarmen Jahre 2017 bis 2019 und die volatilitätsreichen Jahre 2020 bis 2023 sind zwei verschiedene Welten, und eine Trend-Following-Strategie lernt die Welt kennen, in der sie als nächstes handeln wird. Die verankerte Variante startet das In-Sample-Fenster an einem festen Ursprung und lässt es wachsen — zuerst 2018 bis 2021, dann 2018 bis 2022, dann 2018 bis 2023. Mehr Daten liefern stabilere Parameter auf Kosten langsamerer Anpassung. Als Faustregel gilt: Wähle die gleitende Variante für Trend-Following-, Breakout- und Momentum-Systeme; wähle die verankerte Variante für stabile Mean-Reversion-Strategien, die auf tiefen Unterstützungs- und Widerstandsniveaus basieren. Bei einer kurzen History von unter fünf Jahren gewinnt die verankerte Variante, weil sie das Maximum aus den verfügbaren Daten herausholt; bei mehr als zehn Jahren sauberer History wird die gleitende Variante zum Standard.

Garantiert ein bestandener Walk-Forward-Test Live-Profitabilität?

Nein. Die Walk-Forward-Analyse ist der stärkste statistische Robustheitstest, den ein Retail-Trader zur Hand hat, aber sie beruht auf einer stillen Annahme: Das Marktregime während der Out-of-Sample-Fenster muss dem Live-Regime ähnlich genug sein, damit die überlebenden Parameter noch Sinn ergeben. Wenn die Strategie den Markt 2018 bis 2023 gelernt hat — eine Periode mit zwei großen Volatilitätsschocks und zwei Zinserhöhungszyklen — und dann ab Januar 2024 in einem anderen Umfeld handelt (langer Seitwärtsmarkt, niedrige Volatilität, wenige headline-getriebene Bewegungen), spiegelt der Out-of-Sample-Durchschnitt möglicherweise nicht wider, was live passiert. Deshalb besteht der disziplinierte Ansatz nicht darin, sich allein auf die Walk-Forward-Analyse zu verlassen, sondern sie mit einem drei- bis sechsmonatigen Forward-Test auf einem Demo-Konto und einer Monte-Carlo-Simulation zu kombinieren, die die Trade-Reihenfolge zufällig neu ordnet und die Verteilung möglicher Kapitalkurven offenbart. Erst drei grüne Lichter zusammen — Walk-Forward mit WFE über 0.5, Demo-Forward-Test im Einklang mit den Erwartungen und ein Monte-Carlo-Drawdown im 95. Perzentil unter 25 Prozent — rechtfertigen den Einsatz echter Kapital.

Tiefer eintauchen · der vollständige Leitfaden