Backtest Strategi — Cara Melakukannya dengan Benar?
Ketika seorang pembaca memberi tahu saya bahwa strateginya menghasilkan sembilan puluh lima persen perdagangan yang menang, saya sudah tahu cerita itu tidak akan berakhir baik. Backtest bukan sebuah ramalan, bukan pula janji uang di masa depan. Ini adalah alat untuk memfalsifikasi ide Anda — untuk mengetahui apakah aturan-aturan Anda bertahan di berbagai kondisi pasar atau hanya menggambarkan satu episode mujur. Berikut ini: cara menjalankan backtest dengan jujur, di mana jebakan terburuk tersembunyi, dan mengapa bahkan backtest yang dijalankan dengan benar pun tidak menjamin akun live yang menguntungkan.
Mengapa menguji strategi pada data historis?
Sebelum mempertaruhkan uang nyata, Anda memeriksa apakah aturan-aturan Anda akan menghasilkan keuntungan selama beberapa tahun terakhir. Jika aturan tersebut menghasilkan positive expectancy selama lima tahun kondisi campuran, kemungkinan besar ada edge di dalamnya. Rapuh memang — pasar berevolusi, bank sentral mengubah kebijakan, likuiditas berpindah — tetapi itulah yang terbaik yang kita miliki. Backtest menyaring ide-ide yang tidak layak dan meloloskan yang pantas diuji di akun demo, lalu, di posisi live kecil setelahnya. Tidak lebih dari itu.
Bagi trader di pasar Forex, memahami backtest adalah langkah awal yang krusial sebelum menempatkan modal nyata di pasar.
Aturan harus tidak ambigu — atau Anda sedang menguji fiksi
Langkah pertama inilah yang paling sering menggagalkan pemula. Strategi harus ditulis sedemikian rupa sehingga orang asing yang membaca aturannya akan membuka perdagangan yang sama persis. Entri seperti "saya beli ketika melihat tren" bukan sebuah strategi — itu sebuah perasaan. Versi yang dapat diuji: "beli pada penutupan harian ketika EMA 50-periode berada di atas EMA 200-periode, RSI 14-periode berada di bawah 70, dan harga menyentuh rata-rata 20-periode dari atas; stop loss pada 1,5 ATR(14) di bawah entri; target 2,5 ATR di atas; risiko satu persen ekuitas per perdagangan." Hanya aturan seperti inilah yang dapat diuji dengan jujur.
Dari mana mendapatkan data historis dan berapa banyak sampel yang cukup?
Data adalah sumber kesalahan besar kedua. Riwayat tick dari satu broker tidak akan pernah cocok dengan broker lain tick demi tick — model eksekusi berbeda, sumber likuiditas berbeda. Untuk strategi dengan stop loss ketat, selisih itu bisa menentukan hasilnya. Untuk pekerjaan intraday, gunakan data futures CME — terpusat dan dapat diaudit. Untuk swing pada candle harian, riwayat broker biasanya memadai.
Masalah kedua adalah ukuran sampel. Aturan yang sudah lama berlaku menyatakan setidaknya seratus perdagangan, jika tidak, hasilnya bisa saja hanya keberuntungan semata. Tiga puluh perdagangan luar biasa selama enam bulan tidak memberi tahu Anda apa-apa. Seratus adalah ambang signifikansi statistik; para profesional menargetkan tiga ratus atau lebih. Swing pada D1 membutuhkan lima tahun, day trading dua tahun, scalping satu tahun riwayat tick.
Lima tahun juga memiliki keunggulan lain: mencakup beberapa rezim pasar. Dekade terakhir memberikan kita tren (DXY 2014–2017), guncangan volatilitas (Maret 2020), siklus pengetatan (2022–2023), dan konsolidasi sepanjang 2024. Strategi yang hanya bekerja pada satu rezim bukanlah sebuah strategi — itu adalah ilusi yang disesuaikan dengan satu era.
Anda bisa mempelajari lebih lanjut tentang pembacaan kondisi pasar dalam panduan analisis teknikal Forex yang mencakup berbagai indikator dan pola grafik.
Spread, komisi, dan slippage — tanpa ketiganya, backtest Anda berbohong
Backtest "ajaib" yang paling umum terjadi karena lupa mengurangi biaya. Untuk swing pada H4 dengan target 200 pip, spread 0,8 pip hampir tidak terlihat. Untuk scalper yang menjalankan 30 perdagangan sehari dengan target lima pip, spread yang sama akan menggerus sebagian besar edge. Backtest yang realistis harus mencakup spread broker, komisi per lot, dan, untuk strategi yang sensitif terhadap eksekusi, slippage — selip harga antara harga yang Anda lihat saat mengklik dan harga yang Anda dapatkan.
Ambang batas saya: jika rata-rata keuntungan per perdagangan kurang dari dua kali rata-rata biaya (spread, komisi, dan slippage yang diasumsikan digabungkan), strategi tersebut tidak memiliki margin keamanan. Keras, tetapi menghemat berbulan-bulan menipu diri sendiri. Jebakan terpisah yang perlu diwaspadai: indikator yang repaint nilai historisnya akan terlihat sempurna dalam backtest mana pun, tetapi berperilaku sama sekali berbeda dalam perdagangan secara real-time.
Kurva yang disesuaikan dengan histori bukan strategi — itu museum
Jebakan yang paling banyak dialami trader otodidak adalah over-fitting (predopasowanie). Anda menguji tiga puluh nilai parameter, memilih hasil terbaik, lalu mengumumkan sistem menghasilkan empat puluh persen per tahun. Apa yang sebenarnya Anda lakukan adalah mengoptimalkan terhadap kebisingan, bukan sinyal. Semakin banyak parameter yang disentuh optimizer, semakin tinggi kemungkinan hasilnya adalah kebetulan. Robert Pardo, penulis buku klasik tentang evaluasi sistem, mengatakannya dengan tegas:
"Uji out-of-sample adalah satu-satunya ukuran jujur kualitas strategi. Jika sebuah sistem gagal mempertahankan keunggulannya pada data yang tidak dilihatnya selama optimisasi, sistem tersebut telah disesuaikan dengan histori, bukan dengan pasar." — Robert Pardo, 2008
Karenanya, pembagian menjadi in-sample (penyetelan) dan out-of-sample (konfirmasi), biasanya tujuh puluh / tiga puluh. Jika out-of-sample jauh lebih buruk, Anda mengalami over-fitting — strategi tidak layak untuk akun live. Pendekatan yang lebih ketat adalah analisis walk-forward, yang bergantian antara jendela optimisasi dan jendela verifikasi, bergulir melalui histori. Itu adalah perlindungan terbaik yang kita miliki terhadap kepercayaan diri yang salah dalam backtest.
Contoh hipotetis — cara membaca angka secara jujur
Bayangkan sebuah strategi swing pada EUR/USD D1 yang diuji selama 2019–2024. Hasil ilustratif: 147 perdagangan, 54 persen menang, rata-rata rasio risiko-imbalan 2,3 banding 1, profit factor 1,78, drawdown (penurunan ekuitas) 14,5 persen, imbal hasil bersih plus 87 persen selama lima tahun (sekitar 13,3 persen berganda). Tidak spektakuler, tetapi realistis — sebuah templat, bukan akun nyata.
Langkah berguna berikutnya adalah simulasi Monte Carlo, yang mengacak urutan perdagangan untuk menunjukkan bagaimana ekuitas mungkin telah berkembang di bawah urutan yang berbeda. Ingat bahwa di Indonesia, keuntungan dari trading umumnya dikenai Pajak Penghasilan (PPh) dan harus dilaporkan dalam SPT Tahunan; pastikan Anda memiliki NPWP dan konsultasikan perlakuan pajak spesifik dengan konsultan pajak.
Perdagangan Forex ritel di Indonesia diawasi oleh BAPPEBTI (Badan Pengawas Perdagangan Berjangka Komoditi) untuk perdagangan berjangka, dan OJK (Otoritas Jasa Keuangan) untuk sektor jasa keuangan secara luas. Pastikan Anda memilih broker atau pialang berjangka yang berizin BAPPEBTI untuk perlindungan optimal.
Langkah selanjutnya — apa yang harus dilakukan besok
Pengetahuan tentang backtesting baru benar-benar bekerja ketika Anda menjalankannya dan membandingkan hasilnya dengan jurnal trading Anda. Lima langkah berikut membutuhkan beberapa sore dan menghindarkan Anda dari kesalahan paling umum seorang trader yang sedang berkembang. Perlu dipahami bahwa artikel ini bersifat edukatif semata dan bukan merupakan nasihat investasi.
- Tulis strategi Anda dalam satu file teks, secara mekanis. Setiap entri, keluar, stop loss, dan filter harus ditulis sehingga orang lain yang membaca aturannya akan membuka perdagangan yang identik. Jika Anda harus menambahkan "tergantung situasi" di mana saja, perketat aturannya — backtest tidak membaca antara baris. Untuk memperkuat pemahaman tentang manajemen risiko, pelajari prinsip-prinsip manajemen risiko Forex yang solid.
- Kumpulkan lima tahun data untuk swing atau dua tahun untuk day trading, dibagi sejak awal. Cadangkan tujuh puluh persen pertama untuk penyetelan, kunci tiga puluh persen terakhir sampai strategi dibekukan. Baru kemudian jalankan backtest pada bagian yang disisihkan tersebut — itulah ujian nyata Anda. Jika riwayat menghasilkan lebih sedikit dari seratus perdagangan, perluas periode atau tambahkan instrumen dari kelompok yang sama.
- Masukkan biaya realistis ke dalam setiap simulasi. Tambahkan spread broker, komisi per lot, dan slippage yang diasumsikan, dengan nilai terpisah untuk jendela pasar yang tenang dan sesi sekitar rilis data besar. Jika strategi kehilangan lebih dari dua puluh persen keuntungannya setelah biaya dimasukkan, jawabannya jelas: tidak ada margin keamanan.
- Tetapkan batas keras seratus perdagangan. Catat jumlah perdagangan, rata-rata drawdown, dan tingkat kemenangan — ketiga angka tersebut memberitahu lebih banyak daripada imbal hasil utama. Jika Anda menggunakan strategi yang melibatkan swap (biaya menginap), ketahuilah bahwa banyak broker juga menawarkan akun syariah (bebas swap) yang bisa menjadi pilihan lebih sesuai untuk kebutuhan Anda.
- Setelah backtest yang berhasil, jalankan demo setidaknya tiga bulan sebelum go live. Bandingkan demo dengan backtest — jika demo secara nyata lebih buruk, curigai over-fitting, biaya yang diremehkan, atau kesalahan pemrograman. Kembali ke aturan, bukan ke harapan bahwa keadaan membaik di akun nyata. Backtest yang baik tidak pernah menjamin hasil live yang baik — itu hanya mendapatkan hak untuk dicoba.
Sumber dan referensi
-
MetaQuotes Strategy Testing in MetaTrader 5 · oficjalna dokumentacja testera strategii (testowanie i optymalizacja na danych historycznych) www.metatrader5.com ↗
-
MQL5 Reference Testing Trading Strategies · dokumentacja deweloperska MQL5: tryby generowania tików, symulacja spreadu, testy wielowalutowe www.mql5.com ↗
-
Bank for International Settlements OTC foreign exchange turnover in April 2022 · Triennial Central Bank Survey — dane o strukturze rynku FX (kontekst dla backtestu instrumentów detalicznych) www.bis.org ↗
Pertanyaan yang sering diajukan
Apa itu over-fitting pada strategi trading?
Over-fitting (disebut juga curve-fitting) adalah situasi di mana parameter strategi telah disesuaikan begitu ketat dengan data harga masa lalu sehingga gagal menangani data baru. Gejala klasiknya: backtest dengan tingkat kemenangan sembilan puluh lima persen, tetapi akun live hanya tiga puluh persen. Alasannya sederhana: tingkat kemenangan sembilan puluh lima persen tidak berkelanjutan dalam Forex dalam jangka panjang — strategi nyata bertahan di kisaran lima puluh hingga enam puluh persen. Jika backtest Anda menunjukkan lebih dari tujuh puluh persen perdagangan menang, anggap itu sebagai peringatan dan curigai over-fitting hingga terbukti sebaliknya.
Perangkat lunak apa yang sebaiknya digunakan untuk backtesting?
Untuk pemula, pilihan terkuat adalah Strategy Tester bawaan di MetaTrader 5: gratis, mendukung pengujian multi-mata-uang, data tick nyata, dan optimisasi genetik. MetaTrader 4 masih digunakan tetapi terbatas pada satu instrumen dan satu timeframe. Forex Tester 5 berharga sekitar tiga ratus dolar dan menawarkan pengujian manual candle-per-candle — alat yang baik untuk trader yang ingin mengembangkan intuisi visual atas aturan sebelum mengotomatisasinya. Pine Script di TradingView cukup untuk pengujian sederhana pada satu instrumen. Dalam praktiknya, sebagian besar pengujian serius paling baik dilakukan di MT5 atau di lingkungan skrip Python dengan pustaka backtesting khusus.
Berapa banyak data historis yang dibutuhkan untuk backtest yang jujur?
Untuk strategi swing dan posisi, acuan standarnya adalah minimal lima tahun data, untuk day trading dua tahun, dan untuk scalping satu tahun riwayat tick asli. Rentang waktu ini bukan dipilih secara ajaib dari kalender — melainkan agar pengujian mencakup berbagai rezim pasar: trending, ranging, dan volatilitas tinggi. Terlepas dari timeframe, ada syarat statistik: setidaknya seratus perdagangan dalam backtest, agar hasilnya bukan sekadar keberuntungan. Para profesional menargetkan tiga ratus atau lebih. Jika riwayat Anda menghasilkan lebih sedikit perdagangan, perluas jendelanya atau tambahkan instrumen dari kelompok yang sama — jika tidak, Anda sedang menguji hipotesis, bukan strategi.
Seperti apa hasil realistis dari backtest yang baik?
Angka yang realistis adalah tingkat kemenangan lima puluh hingga enam puluh persen, rata-rata rasio risiko-imbalan minimal dua banding satu, profit factor dalam kisaran 1,5 hingga 3,0, dan drawdown (penurunan ekuitas) maksimal di bawah dua puluh persen — dengan setidaknya seratus perdagangan dan angka dikonfirmasi pada jendela out-of-sample. Rasio Sharpe di atas satu menunjukkan imbal hasil yang wajar relatif terhadap volatilitas. Tanda bahaya: tingkat kemenangan di atas delapan puluh persen, profit factor di atas lima, dan drawdown di bawah lima persen — kombinasi itu hampir selalu menandakan over-fitting, bukan keunggulan nyata.