バックテストの実践——段階的な検証プロセス
戦略に本気で取り組む人のほとんどはバックテストを行いますが、誠実で段階的な検証プロセスを踏む人はわずかです。そして、まさにそのプロセスが、最初の一年を生き延びる口座と、三カ月目で吹き飛ぶ口座とを分けます。本稿ではパイプライン全体をたどります。ルールを明確に書き出し、履歴の期間を選び、データを分割し、ウォークフォワード、デモ、そして最初のマイクロロットによるライブへと進む流れです。これは一回のテストの手順書ではなく、戦略をアイデアからライブ口座まで運ぶための規律そのものです。
なぜ一回のバックテストはプロセスではないのか
一回のバックテストは、あなた自身が意味を知らない数字を示します。その戦略は三十パーセントを稼いだ——けれどもそれは本物のエッジを捉えたのでしょうか、それとも三百通りのパラメータの組み合わせを試して、過去のノイズに一つだけたまたまフィットしたのでしょうか。数字だけではこの問いに答えられません。プロセスなら答えられます。最終的に戦略が評価されるデータから、トレーダーが学習してしまう余地を段階的に取り除いていくからです。各段階はより細かい目を持つふるいです。一回のクリーンなテストのやり方は実践トレードの記事でも扱っていますが、ここでは最初の「スタート」をクリックするずっと前から始まる規律に焦点を当てます。
ルールは紙の上に、解釈の余地なく
コードや厳密なルールのシートに翻訳できない戦略は、テストの準備ができていません。エントリー、エグジット、損切り(ストップロス)、利確(テイクプロフィット)、そしてポジションサイズを、その文書を読んだ別の人間がまったく同じトレードを置けるほど厳密に書き出してください。「トレンドが見えたら買う」というのは印象であって、ルールではありません。テスト可能な版はこうです。「日足の確定時にEMA(50)がEMA(200)を上回り、RSI(14)が七十未満で、価格が二十期間移動平均に上から触れたら買う。損切りはエントリーの1.5 ATR(14)下、目標は2.5 ATR上、リスクは一パーセント」。この規律は、テストを走らせる前にほとんどのアイデアをふるい落とします。
データの期間は複数のレジームをまたがねばならない
二つ目のふるいは履歴です。私のルールは、日足戦略なら最低十年、M30とM15なら五年、M15未満のスキャルピングなら二年——合成されたFX会社の履歴ではなく、本物のティックデータからです。過去十年には、長いDXYトレンド(2014–2017)、2020年3月のボラティリティショック、利上げサイクル(2022–2023)、そして2024年のもみ合いが含まれていました。そのうちの一つの世界でしか機能しない戦略は、一つの時代にフィットさせただけの幻想です。五年間で百回未満のトレードはサンプルとして小さすぎます。百回が下限で、プロは三百回を目指します。
データの分割とアウトオブサンプル枠の保護
三つ目の段階は、データを自分自身から遠ざけることです。履歴を最適化用の七十パーセントのIS(イン・サンプル)と、最適化が終わるまで手をつけない二十五から三十パーセントのOOS(アウト・オブ・サンプル)に分割します。OOSは誠実さのふるいです——トレーニングデータで選んだパラメータが、それを超えた価値を持つかどうかを示します。ISで勝率八十パーセント、プロフィットファクター2.4が出て、同じパラメータがOOSで五十パーセント、1.1になったなら、あなたはたった今、自分がカーブフィッティングをしている現場を押さえたのです。ISで年率十二パーセント・OOSで十一パーセントのほうが、ISで三十・OOSで八よりも本当に優れています。ピークではなく、一貫性なのです。
最も細かいふるいとしてのウォークフォワード
一回のIS/OOS分割は一つの数字を与えるだけです。ウォークフォワードはそれを五回から七回繰り返します。最初はIS 2018–2021、OOS 2022。二回目はISが2019–2022にずれ、OOSは2023。以下同様です。各窓ごとに再最適化し、勝ったパラメータを凍結し、OOSでテストし、結果を記録し、窓をずらします。五から七サイクルの後、平均OOSが、ライブ口座が生み出すであろうものの最も誠実な代理指標になります。WFEが0.5–0.75ならば先に進める価値のある戦略を示し、0.3未満ならカーブフィットの自白です。仕組みと、ローリング型・アンカー型の違いは戦略のカテゴリでより深く扱っており、さらに広い文脈はForexMechanicsのトレーダーズワークショップをご覧ください。
「ウォークフォワード分析の全目的は、実時間・実資金で実際にトレードすることなく、トレーディング戦略のリアルタイム・実資金でのパフォーマンスを明らかにすることにある」 — Robert Pardo, 2008
デモとマイクロロットのライブ——戦略が現実と出会う場所
ウォークフォワードを通過した戦略は、デモの準備ができたのであって、実資金の準備ができたわけではありません。パラメータを凍結したまま三カ月から六カ月のフォワードテストを行うことが、最初のリアルタイム挙動テストになります。生のスプレッド、実際のマクロ指標発表、日曜夕方のギャップ、実際の取引時間帯の流動性。デモは、バックテストが決して見せないものを引き出します——履歴上は流動的だと判断された戦略が、シグナルがあなたの就寝中に現れるために執行しづらいと分かることもあるのです。これはデータの問題ではなく、あなたとあなたの市場の問題です。
フォワードテストの後、いきなりフルサイズには飛びません。マイクロロット——目標の十分の一——で、実資金で三カ月から六カ月押し進めます。狙いは情報を得ることです。ライブの執行がデモとどう違うか、実際のスリッページ、NFP前後でFX会社がどう振る舞うか、そして小さくとも本物の損失にあなたがどう反応するか。各段階をまたぐ表には四つの列があります。IS、OOS、デモ、マイクロロット。数字が近く並ぶほど、幻想の中で生きているリスクは低くなります。乖離が大きければ、それは規模を拡大するのではなく、一歩下がるべきサインです。
例解——ブレイクアウト戦略の完全なパイプライン
EUR/USD、M30のブレイクアウト戦略。エントリーは二十本のローソク足の最高値を更新したとき、エグジットは十本の最安値です。履歴は2014–2023、IS 2014–2020、OOS 2021–2023。IS上の最適化では、高値に二十三、安値に十一、損切り1.4 ATR、勝率五十八パーセント、プロフィットファクター1.72、年率二十二パーセント。OOS上では勝率五十四パーセント、プロフィットファクター1.51、年率十八パーセント。五回のウォークフォワード反復で平均WFEは0.71。四カ月のデモで、想定より0.5 pip多いスリッページが確認され、勝率とプロフィットファクターは範囲内に収まります。一月からのマイクロロットのライブは、三カ月後に五十一パーセント——バックテストを下回るものの、なお純プラスです。第3四半期に判断が来ます。規模を拡大するか、ボラティリティが平常から外れていくなら待つか。数字は説明用です。
今すぐやるべきこと
- 戦略のルールを、それを読んだ別の人間がまったく同じトレードを置けるほど厳密に、プレーンテキストのファイルに書き出してください——解釈の余地も「トレンドを感じる」もなく、正確なパラメータ値、損切りの計算式、そして口座資金に対する割合としてのポジションサイズを記します。
- あなたが実際に取引する通貨ペアの履歴データをダウンロードしてください——日足チャートなら最低十年、M30とM15なら五年、スキャルピングなら本物のティックデータ二年分。サンプルがトレンド、もみ合い、ボラティリティショック、金利サイクルといった異なるレジームをまたいでいることを確認します。
- データを七十パーセントのイン・サンプルと二十五から三十パーセントのアウト・オブ・サンプルに分け、IS最適化が終わるまでOOSには手をつけず、その後ウォークフォワードを五回から七回反復してください。WFEが0.5未満に落ちたり、反復間でパラメータが五十パーセント超も跳ねたりするなら、ロジックを単純化します。
- ウォークフォワードを通過した戦略については、パラメータを凍結したままデモで三カ月から六カ月のフォワードテストを行い、続いてマイクロロットのライブを三カ月から六カ月。四つの結果セットが一貫しているときに限り、リスク管理のカテゴリで扱うモンテカルロ・シミュレーションを併用しつつ、目標サイズへ拡大してください。
- 結果は最高リターンではなく、一貫性というレンズを通して読んでください。各段階で年率十二パーセントのほうが、ISで三十・OOSで八よりも優れています。一貫性こそが、口座が最初の一年を生き延びるかどうかを決めるからです。なお国内の店頭FXでは、レバレッジは金融庁(FSA)の規制により最大25倍に制限されています。EUでは、ESMAが個人投資家のレバレッジを最大1:30に制限していますが、これは日本の口座を拘束するものではありません。FX会社は金融庁の登録を受けた業者を選び、無登録の海外業者には注意してください。本稿は教育目的のみであり、投資助言ではありません。
出典・参考文献
-
Robert Pardo The Evaluation and Optimization of Trading Strategies · klasyczny podręcznik o ewaluacji systemów transakcyjnych i metodyce walk-forward onlinelibrary.wiley.com ↗
-
MetaQuotes MetaTrader 5 Help — Strategy Tester · oficjalna dokumentacja MT5 dotycząca Strategy Testera, forward testingu i optymalizacji parametrów www.metatrader5.com ↗
-
MetaQuotes MetaTrader 4 Help — Strategy Testing · opis Strategy Testera MT4: parametry uruchomienia, modele tickowe, interpretacja raportu www.metatrader4.com ↗
-
Backtrader Backtrader documentation — Introduction · wprowadzenie do otwartego silnika backtestowego w Pythonie używanego przez quants www.backtrader.com ↗
-
TradingView Pine Script v6 — Welcome · oficjalna dokumentacja Pine Script i Strategy Testera w TradingView www.tradingview.com ↗
よくある質問
この多段階のプロセスは、一回のバックテストとどう違うのですか。
一回のバックテストは、一つの数字と一つの解釈を与えます。戦略が歴史的に利益を出したかどうかは示しますが、最適化のプロセスがノイズを学習しなかったことを暗黙のうちに前提としています。多段階のプロセスは、その一つの数字を一連のふるいに変えます。まず、書き出されたルールが検証不能なアイデアをふるい落とします。次に、長い履歴の窓が、一つのレジームでしか機能しない戦略をふるい落とします。続いて、イン・サンプルとアウト・オブ・サンプルの分割が、トレーニングデータでしか機能しないパラメータをふるい落とします。ウォークフォワードは、一つの偶然のアウト・オブ・サンプル窓でしか機能しないパラメータをふるい落とします。デモは、生のスプレッドで執行できない戦略をふるい落とします。マイクロロットのライブは、心理的に持ちこたえられないトレーダーをふるい落とします。六つすべてのふるいを通った後には、元の戦略群のごく一部が残りますが、それこそが最初の一年を生き延びる現実的な可能性を持つ一部なのです。一回のバックテストはこの選別を強制しません。だからこそ、リテールの八十パーセントが何らかの過去テストを行っているにもかかわらず、八十パーセントが損失を出すのです。
アイデアからマイクロロットのライブまで、全プロセスにどれくらいかかりますか。
現実的なスケジュールは、最初のルールの書き出しからポジションを目標サイズへ拡大するまで、九カ月から十五カ月に及びます。最初の二週間は、ルールの精密な書き出しと履歴データのダウンロードに充てます。次の二週間から四週間は、イン・サンプルでの最適化と最初のアウト・オブ・サンプル検証です。通過しなければ、よりよいテストを探すのではなくルールに戻ります。五回から七回の反復によるウォークフォワードは、各窓が独自の最適化を要するため、さらに一カ月かかります。その後、デモ口座での三カ月から六カ月のフォワードテストが続きます。さらにその後、三カ月から六カ月のマイクロロットのライブ。四つの結果セットを比較し、その一貫性を確認して初めて、目標ポジションへ拡大できます。このスケジュールを九カ月未満に短縮することは、いずれかのふるいを飛ばすことを意味し、飛ばされたふるいはそれぞれ、リスクを検証フェーズから——本物のお金がかかるライブフェーズへと移します。
不整合を捉えるために、段階をまたいでどの指標を追うべきですか。
プロセス全体を通じて維持する表には、四つの結果列(イン・サンプル、アウト・オブ・サンプル、デモ、マイクロロットのライブ)と、それぞれに少なくとも四行の指標を置くべきです。第一は勝率(パーセント)——段階間で十パーセントポイントを超える差は不整合を示します。第二はプロフィットファクター、すなわち総利益を総損失で割ったもの——段階間で0.3を超える差は警告サインです。第三は平均リスクリワード比——0.5 Rを超える差は、損切りがテストと異なる振る舞いをしていることを示唆します。第四は最大ドローダウンで、これはほぼ常に段階ごとに増えますが、隣り合う二段階の間で五十パーセントを超える上昇は、戦略がテストになかった条件に直面していることを意味します。第五は任意で、平均スリッページ(pip)——バックテストとデモの差、そしてデモとマイクロロットの差が、FX会社が前提どおりに振る舞っているかを教えてくれます。これらの指標のいずれかに不整合があれば、それはポジションを拡大するのではなく、一段階下がってその原因を理解せよというサインです。
全プロセスを通過すれば、戦略がライブで稼ぐと保証されますか。
いいえ。各段階は戦略が本物のエッジを持つ確率を高めますが、いかなる過去テストやフォワードテストの組み合わせも、根本的なリスクを取り除きはしません——来期の市場は、あなたがデータで見たどんなものとも違うかもしれないのです。プロセス全体は、アウト・オブ・サンプルの窓やデモのレジームが、ライブのレジームと十分に似ているだろうと暗黙のうちに前提しています。もし戦略が二つのボラティリティショックと二つの金利サイクルを含む2018年から2023年の市場を学習し、2024年以降、低ボラティリティで市場を動かす発表の少ない長いレンジで取引しているなら、マイクロロットのライブはバックテストとかけ離れた結果を示すかもしれません。だからこそ規律とは、ふるいをクリーンに通り抜けたことだけに頼るのではなく、実資金での結果を先の三段階と比較できるほど長くマイクロロットを保つことにあります。補完となるのはリスク管理で扱うモンテカルロ・シミュレーションで、これはトレードの順序をランダムに並べ替え、起こりうる資産曲線の分布を明らかにします——バックテスト単独では決して露わにならない、合理的な最悪シナリオの推定を与えてくれます。本稿は教育目的のみであり、投資助言ではありません。