ウォークフォワード分析 — トレード戦略のロバストネステスト

最終確認日: · 普遍的な内容
リスク警告 · YMYL この記事は教育目的のみのものであり、投資助言を構成するものではありません。Forex取引には資金を失う高いリスクが伴います — ESMAによれば、個人投資家口座の74〜89%が損失を出しています。

ウォークフォワード分析は、Robert Pardoが著書The Evaluation and Optimization of Trading Strategies(Wiley、2008年刊)で体系化したロバストネス(頑健性)の検証手法であり、システム運用のファンドはそれ以来、戦略を実弾に近づける前の標準フィルターとして扱ってきました。考え方は単純です。利用できる全履歴で一度だけパラメータを最適化するのではなく、履歴をインサンプルとアウトオブサンプルの窓のペアに繰り返し切り分け、一度も較正していないデータでも優位性を保った戦略だけが運用の資格を得るのです。

カーブフィッティングこそウォークフォワードが解く問題

1,000通りのパラメータの組み合わせを総当たりし、その中から最良を選ぶだけの素朴なバックテストは、現実が届けてくれるどんなものよりも美しい資産曲線をほぼ必ず生み出します。最適化エンジンは履歴の中のノイズを見て、それをシグナルだと取り違えるのです。14期間の移動平均が12期間に勝ったのは、それが賢いからではなく、たまたまその数か月でノイズがそう並んだからにすぎません。この病の警告サインと、自分の作業の中でそれを見抜く方法は、実践・ワークショップのカテゴリーでまとめています。あり得ないほど滑らかな曲線、200トレードにわたって75パーセントを超える勝率、3.5を超えるプロフィットファクター、そして小さなパラメータの変化への過敏な反応がそれです。ウォークフォワードは、戦略が最終的に評価されるデータを最適化エンジンに学習させる能力そのものを奪います。

ローリング窓の仕組み — ステップごとに

まず履歴を——典型的にはメジャー通貨のM30以上のクリーンなデータ10年分を——一連のブロックに分割します。最初のインサンプル窓は2018年から2021年をカバーし、対応するアウトオブサンプル窓は2022年に置かれるとしましょう。インサンプルのブロックで完全な最適化を実行します。テスターに数百通りのパラメータの組み合わせを総当たりさせ、許容できるドローダウンのもとで最良のリターンを返したものを採用するのです。次に勝ったパラメータセットを凍結し、その値のままアウトオブサンプルの2022年に戦略を走らせます——コードの編集も、再調整も一切しません。第三のステップは、アウトオブサンプルのブロックの長さだけ窓をずらすこと。新しいインサンプルは2019年から2022年、新しいアウトオブサンプルは2023年です。再び最適化し、凍結し、テストし、ずらす。こうした反復を5回から7回繰り返せば、5つから7つの独立したアウトオブサンプルの結果が手に入り、その平均こそが、実弾口座が届けるであろうものを最も正直に近似します。MT5上での実務的な手順や、Strategy Testerに用意されたオプションについては、プラットフォームのカテゴリーで扱っています。

ローリングとアンカード — 2つのバリアント

ローリング型ではインサンプル窓の長さが固定で、毛虫のように前進していきます。常に4年間、ただし開始と終了が変わるだけです。戦略は自然と遠い過去を忘れ、直近の年に集中します——これは実務上、レジームの変化により速く反応することを意味します。2020年のボラティリティショックや2022年の利上げサイクルの後、ローリングのウォークフォワード戦略は次の反復ですでに、新しい世界に合わせて調整されたパラメータでトレードしています。アンカード型は開始点を固定したままインサンプル窓を成長させます。最初は2018年から2021年、次に2018年から2022年、その次は2018年から2023年。データが増えるほど反復間でパラメータは安定しやすくなりますが、適応は遅くなります。経験則として、トレンドフォロー、ブレイクアウト、モメンタムのシステムにはローリングを、深いサポートとレジスタンスの水準に根ざした安定的な平均回帰戦略にはアンカードを選びます。

ウォークフォワード効率(WFE)とその読み方

WFEは年率換算したアウトオブサンプルのリターンを、年率換算したインサンプルのリターンで割った比率で、通常はパーセントで表します。1に近い値は疑わしいものです——そこまで完璧な引き継ぎは、最も単純なトレンドフォローのシステムを除けばまず起こらず、起きたときはたいてい窓と窓の間で何かが漏れています。0.5から0.75の範囲は頑健な戦略の自然な生息域であり、実弾投入を考える根拠となるのもこの範囲です。0.3から0.5の帯はノイズへの中程度の過適合を示します。戦略は何か本物をとらえていますが、ルールセットが抱える自由度が多すぎるのです。0.3を下回るものは明白なカーブフィットの告白であり、指標はトレーダーに、エゴが聞きたがらないことを告げています——ルールを単純にせよ、数字がやっと見栄えよくなる別のテストを追い求めるな、と。WFEが低いもう一つの根本原因は、過去のバーを描き直すリペイント型のインジケーターです。リペイントするシグナルはウォークフォワードの検証には不適切で、インサンプルのデータがリアルタイムで実現するよりも良く見えてしまうからです。

例で示す — レンズの下の2つの戦略

EUR/USDの2つの戦略を想像してください。どちらも2018年から2023年をカバーするM30データで、ローリング型、4年のインサンプル窓と1年のアウトオブサンプル窓で検証します。あるブレイクアウト戦略は、最初の反復でインサンプルの勝率70パーセント、年率リターン30パーセントを出します。対応するアウトオブサンプル窓では勝率は55パーセントに、リターンは年率12パーセントに落ちます。WFEは12を30で割って0.4です。5回の反復にわたって、WFEの中央値は0.38から0.45の帯に落ち着きます——戦略は本物の優位性をとらえていますが、エントリーロジックが作り込みすぎで単純化が必要です。第二の戦略、移動平均で組んだトレンドフォローは、インサンプルで勝率60パーセント、年率リターン25パーセント、アウトオブサンプルで58パーセントと20パーセントを出します。WFEは0.8、反復間でパラメータのぶれは20パーセント未満です。こちらはさらにデモでのフォワードテストへ進む資格があります。すべての数字は説明のための例であり、テストの読み方を示すものであって、特定の戦略から期待すべき結果ではありません。

「ウォークフォワード分析の目的のすべては、実際にリアルタイムで実弾をトレードすることなく、トレード戦略のリアルタイム・実弾でのパフォーマンスを明らかにすることにあります。」 — Robert Pardo, 2008

ウォークフォワードにできないこと

WFEが0.5を余裕で超えたクリーンなウォークフォワードであっても、実弾での収益性を約束するものではありません。このテストは沈黙の前提の上に成り立っています——アウトオブサンプル窓がとらえたレジームが、戦略が実際にトレードするレジームと十分に似ていなければならない、という前提です。履歴に2度の大きなボラティリティショックと2度の金利サイクルが含まれていて、その後に戦略が、長いレンジで低ボラティリティ、ヘッドラインに動かされる場面の少ない相場へトレードしていくなら、アウトオブサンプルの平均は実弾で起きていることを反映しないかもしれません。だからこそ職人の技は、3つのフィルターを積み重ねることにあります——WFEが安全な範囲にあるウォークフォワード、デモでの3〜6か月のフォワードテスト、そしてトレードの順序をランダムに並べ替えて起こりうる資産曲線の分布を明らかにするモンテカルロ・シミュレーションです。リスク管理の体系的な土台については、リスク管理のカテゴリーも参照してください。ウォークフォワードは非常に優れた篩であって、神託ではありません——どんな過去のテストもそうです。より広い方法論の文脈は、ForexMechanicsのトレーダーズ・ワークショップにあります。

今すぐやるべきこと

  1. 実際にトレードしている通貨ペアの価格履歴を引き出し、直近5年分のM30またはM15データを切り出してください。それを4年のインサンプルと1年のアウトオブサンプルからなる5組の窓に分割し、反復ごとに開始点を1年ずらすことで、異なるレジームをまたいだアウトオブサンプルの結果を比較し、少なくとも5つの独立した観測値を集められるようにします。
  2. 最初のインサンプル窓2018年から2021年だけで完全なパラメータ最適化を実行し、勝ったセットを記録し、それを完全に凍結したうえで、対応するアウトオブサンプル2022年で再調整なしの単一のバックテストを実行してください。このサイクルを5組すべての窓ペアで繰り返し、各アウトオブサンプル走行の年率リターンとドローダウンを表計算ソフトに記録します。
  3. 反復ごとにアウトオブサンプルのリターンをインサンプルのリターンで割った比率としてWFEを計算し、平均値と中央値の両方を見てください。中央値が0.5を下回るか、反復間でパラメータが50パーセントを超えて跳ねるなら、戦略はノイズに過適合しており、正しい対応はさらなる最適化ではなくエントリーロジックの単純化です。
  4. WFEが0.5を超えてウォークフォワードのゲートを通過した戦略には、実弾を投じる前に2つのフィルターを重ねてください。最終反復で凍結したパラメータを使ったデモ口座での3〜6か月のフォワードテストと、トレード順序をランダムに並べ替え、その95パーセンタイルのドローダウンがあなた自身のリスク許容度に収まらなければならないモンテカルロ・シミュレーションです。
Jarosław Wasiński
著者について

Jarosław Wasiński

MyBank.pl 編集長 · 金融・市場アナリスト

金融業界で20年以上の経験を持つ独立系アナリスト兼実務家です。2004年から運営されているポータルサイト MyBank.pl の創設者であり編集長を務めています。2007年から外国為替市場とマクロ経済のファンダメンタル分析を行っています。グローバル市場の視点から執筆し、欧州(ESMA)および日本(金融庁/FSA)の規制枠組みにも目を配っています。

出典・参考文献

  1. MetaQuotes MetaTrader 5 Strategy Tester — Forward Testing · opis trybu forward testing wbudowanego w Strategy Tester i jego roli w walce z over-optimisation www.metatrader5.com ↗
  2. MetaQuotes MetaTrader 5 Help — Strategy Optimization · oficjalna dokumentacja MT5 o optymalizacji parametrów i forward testing przeciw overfittingowi www.metatrader5.com ↗
  3. QuantStart Successful Backtesting of Algorithmic Trading Strategies — Part I · omówienie czterech klasycznych biasów backtestu: optimisation, look-ahead, survivorship, psychological tolerance www.quantstart.com ↗
  4. MQL5 Community Articles on Strategy Testing in MQL5 · kuratorska kolekcja artykułów wspólnoty MQL5 o backtestingu i walk-forward www.mql5.com ↗

よくある質問

ウォークフォワードは、単一のインサンプル/アウトオブサンプル分割と何が違うのですか?

古典的なホールドアウト分割は、履歴の末尾から一つの窓を切り出し、残りのデータで調整したパラメータでそこを検証します。これは一発勝負のロバストネスチェックで、一つの数字を与えてそれで終わりです。ウォークフォワードは同じ作業を何度も繰り返します。最初のアウトオブサンプル窓は2022年、二つ目は2023年、三つ目は2024年で、それぞれの前に、前進させたインサンプルのブロックでパラメータを再最適化します。したがってトレーダーは、ある単一の年というくじ引きに依存しません——5〜10のアウトオブサンプル窓を集計し、運の影響が劇的に下がります。第二の利点は、ウォークフォワードが実弾運用の実際の振る舞いを写し取ることです。最適化し、凍結し、1年トレードし、再び最適化する。これこそ大半のシステム運用ファンドのやり方です。単一のホールドアウトはこの周期性をとらえられません。

WFEはどう解釈すればよく、どの閾値を真剣に受け止めるべきですか?

WFEは、年率換算したアウトオブサンプルのリターンを、年率換算したインサンプルのリターンで割って計算します。インサンプルでの約束のうち、どれだけが未見のデータとの接触を生き延びたかを教えてくれます。1.0に近い値は疑わしいものです——その水準の完璧な引き継ぎは、ごく単純なトレンドフォローのシステムを除けばまれで、起きたときはたいてい窓と窓の間で何かが漏れています。0.5から0.75の範囲は運用に値する戦略の典型であり、実弾を真剣に検討する引き金となる範囲です。0.3から0.5の帯はノイズへの中程度のカーブフィッティングを示します——戦略は何か本物をとらえていますが、ルールセットがパラメータを抱えすぎているのです。0.3を下回るものは明白なカーブフィットの告白であり、この指標はトレーダーに、エゴが聞きたがらないことを告げています。別のテストを立ち上げるのではなく、ルールを単純にせよ、と。閾値だけが基準になることは決してありません——反復間のパラメータの安定性(50パーセントを超える跳ねは過敏さを指します)と、平均だけでなくアウトオブサンプル窓全体のドローダウンの分布にも目を向ける必要があります。

ローリング型とアンカード型は、どちらをいつ選べばよいですか?

ローリング型は固定長のインサンプル窓——たとえば4年——を使い、各反復の前にアウトオブサンプル窓の長さだけ前へずらします。利点はレジームの変化への反応の速さです。低ボラティリティの2017年から2019年と、高ボラティリティの2020年から2023年は別世界であり、トレンドフォロー戦略はこの先実際にトレードする世界を学びます。アンカード型はインサンプル窓を固定の起点から始め、成長させます——最初は2018年から2021年、次に2018年から2022年、その次は2018年から2023年です。データが増えれば反復間でパラメータはより安定しますが、適応は遅くなります。経験則として、トレンドフォロー、ブレイクアウト、モメンタムのシステムにはローリングを、深いサポートとレジスタンスの水準に依拠する安定的な平均回帰戦略にはアンカードを選びます。5年未満の短い履歴ではアンカードが勝ちます。利用できるデータから最大限を絞り出すからです。10年を超えるクリーンな履歴があれば、ローリングが標準になります。

クリーンなウォークフォワードを通れば、実弾での収益は保証されますか?

いいえ。ウォークフォワードは個人トレーダーの手の届く範囲で最も強力な統計的ロバストネステストですが、一つの沈黙の前提を抱えています。アウトオブサンプル窓における市場のレジームが、生き残ったパラメータがなお意味をもつほどに実弾のレジームと似ていなければならない、という前提です。戦略が2018年から2023年の市場——2度の大きなボラティリティショックと2度の金利サイクルを含む期間——を学び、その後2024年1月から異なる環境(長いレンジ、低ボラティリティ、ヘッドラインに動かされる場面が少ない)でトレードするなら、アウトオブサンプルの平均は実弾で起きていることを反映しないかもしれません。だからこそ規律ある取り組みは、ウォークフォワードだけに頼ることではなく、デモでの3〜6か月のフォワードテストと、トレードの順序をランダムに並べ替えて起こりうる資産曲線の分布を明らかにするモンテカルロ・シミュレーションを組み合わせることにあります。3つの青信号がそろって初めて——WFEが0.5を超えるウォークフォワード、期待に沿うデモのフォワードテスト、そして95パーセンタイルのドローダウンが25パーセント未満のモンテカルロ——実弾の投入が正当化されます。

さらに深く · 完全ガイド