Backtesting dalam praktik — proses validasi bertahap
Hampir semua trader serius pernah menjalankan backtest, namun hanya sedikit yang menerapkan proses validasi bertahap yang jujur — dan proses inilah yang membedakan akun yang bertahan di tahun pertama dari akun yang ludes pada bulan ketiga. Artikel ini membahas keseluruhan alur: menulis aturan dengan jelas, memilih rentang data historis, membagi data, walk-forward, demo, hingga micro-lot live pertama. Bukan panduan untuk satu kali pengujian, melainkan disiplin membawa strategi dari ide ke akun nyata.
Mengapa satu backtest bukan sebuah proses
Satu backtest menghasilkan sebuah angka yang Anda tidak benar-benar pahami. Strategi menghasilkan tiga puluh persen — tetapi apakah itu mencerminkan keunggulan nyata, atau Anda menjalankan tiga ratus kombinasi parameter sampai salah satu cocok dengan kebisingan data historis? Angka saja tidak bisa menjawab. Sebuah proses bisa, dengan cara secara bertahap mengurangi kemampuan trader untuk "belajar" dari data yang akhirnya menjadi tolok ukur evaluasi strategi. Setiap tahap adalah saringan dengan lubang yang semakin kecil. Satu pengujian yang bersih dibahas dalam artikel saya tentang cara melakukan backtesting strategi; di sini saya fokus pada disiplin yang dimulai jauh sebelum klik pertama pada tombol Start.
Aturan di atas kertas, tanpa interpretasi
Strategi yang tidak bisa dijabarkan ke dalam kode atau lembar aturan yang tepat belum siap diuji. Tulis aturan entri, exit, stop loss, take profit (ambil untung), dan ukuran posisi dengan cukup presisi sehingga orang lain yang membaca dokumen tersebut akan membuka posisi yang sama persis. "Saya beli saat melihat tren" adalah kesan, bukan aturan. Versi yang dapat diuji: "beli pada penutupan lilin harian ketika EMA(50) berada di atas EMA(200), RSI(14) di bawah tujuh puluh, harga menyentuh rata-rata dua puluh periode dari atas; stop loss 1,5 ATR(14) di bawah entri; target 2,5 ATR di atas; risiko satu persen dari ekuitas akun." Disiplin ini menyaring sebagian besar ide bahkan sebelum pengujian dijalankan.
Rentang data harus mencakup lebih dari satu rezim pasar
Saringan kedua adalah data historis. Aturan saya: minimum sepuluh tahun untuk strategi harian, lima tahun untuk M30 dan M15, dua tahun untuk scalping di bawah M15 — dari data tick asli, bukan riwayat broker sintetis. Satu dekade terakhir mencakup tren DXY yang panjang (2014–2017), guncangan volatilitas Maret 2020, siklus kenaikan suku bunga (2022–2023), dan konsolidasi 2024. Strategi yang hanya bekerja dalam salah satu kondisi tersebut adalah ilusi yang disesuaikan dengan satu zaman. Kurang dari seratus transaksi selama lima tahun adalah sampel yang terlalu kecil — seratus adalah batas minimal, para profesional menargetkan tiga ratus.
Membagi data dan melindungi blok out-of-sample
Tahap ketiga adalah menyembunyikan sebagian data dari diri Anda sendiri. Bagi data historis menjadi tujuh puluh persen in-sample (IS) untuk optimasi parameter dan dua puluh lima hingga tiga puluh persen out-of-sample (OOS), yang tidak boleh disentuh sampai optimasi selesai. OOS adalah saringan kejujuran — ia menunjukkan apakah parameter yang dipilih pada data latih memiliki nilai di luar data tersebut. Jika IS menghasilkan win rate delapan puluh persen dan profit factor 2,4, lalu parameter yang sama menghasilkan lima puluh persen dan 1,1 pada OOS, Anda baru saja menangkap diri sendiri melakukan curve-fitting. Dua belas persen per tahun pada IS dan sebelas persen pada OOS secara nyata lebih baik daripada tiga puluh persen pada IS dan delapan persen pada OOS. Konsistensi, bukan puncak.
Walk-forward sebagai saringan paling halus
Satu pembagian IS/OOS hanya menghasilkan satu angka. Walk-forward mengulanginya lima hingga tujuh kali: IS pertama 2018–2021, OOS 2022; IS kedua bergeser ke 2019–2022, OOS 2023; dan seterusnya. Untuk setiap jendela, Anda melakukan optimasi ulang, membekukan parameter terbaik, mengujinya pada OOS, mencatat hasilnya, lalu menggeser jendela. Setelah lima hingga tujuh siklus, rata-rata OOS adalah proksi paling jujur dari apa yang akan dihasilkan akun live. WFE di kisaran 0,5–0,75 menandakan strategi layak dilanjutkan; di bawah 0,3 adalah pengakuan curve-fitting. Mekanisme dan perbedaan antara varian rolling dan anchored dibahas dalam artikel tentang analisis walk-forward; untuk konteks lebih luas, lihat sumber daya di traders' workshop ForexMechanics.
"Seluruh tujuan analisis walk-forward adalah untuk mengungkapkan kinerja nyata sebuah strategi trading di waktu nyata dengan uang nyata — tanpa benar-benar memperdagangkannya dengan uang nyata di waktu nyata." — Robert Pardo, 2008
Demo dan micro-lot live — tempat strategi bertemu realita
Strategi yang lolos walk-forward siap untuk demo, bukan uang nyata. Tiga hingga enam bulan forward testing dengan parameter yang dibekukan adalah uji perilaku real-time pertama: spread live, rilis makro aktual, gap Minggu malam, likuiditas jam trading sesungguhnya. Demo mengungkap apa yang tidak pernah ditampilkan backtest — strategi yang tampak likuid dalam data historis bisa terbukti sulit dieksekusi karena sinyal muncul saat Anda sedang tidur. Bukan masalah data, melainkan masalah Anda dan pasar Anda.
Setelah forward testing, Anda tidak langsung loncat ke ukuran penuh. Anda melanjutkan dengan micro-lot — sepersepuluh dari ukuran target — selama tiga hingga enam bulan dengan uang nyata. Tujuannya bersifat informatif: bagaimana eksekusi live berbeda dari demo, slippage (selip harga) nyata, bagaimana broker berperilaku di sekitar rilis NFP, dan bagaimana Anda bereaksi terhadap kerugian kecil yang sesungguhnya. Tabel hasil di seluruh tahap memiliki empat kolom: IS, OOS, demo, micro-lot. Semakin dekat angka-angkanya, semakin kecil risiko bahwa Anda hidup dalam ilusi. Divergensi yang melebar adalah sinyal untuk mundur, bukan untuk memperbesar posisi. Perlu dicatat bahwa perdagangan forex ritel di Indonesia diawasi oleh BAPPEBTI (Badan Pengawas Perdagangan Berjangka Komoditi), sehingga pilih broker atau pialang berjangka yang berizin BAPPEBTI agar proses validasi Anda berpijak pada fondasi yang aman secara regulasi. Untuk strategi berbasis manajemen risiko yang solid, pastikan setiap tahap pengujian Anda mengintegrasikan parameter stop loss dan ukuran posisi yang konsisten.
Contoh ilustratif — seluruh alur untuk strategi breakout
Strategi breakout pada EUR/USD, M30: entri saat harga menembus highest high dari dua puluh candlestick (lilin), exit pada lowest low dari sepuluh candlestick. Data historis 2014–2023, IS 2014–2020, OOS 2021–2023. Optimasi pada IS: dua puluh tiga untuk high, sebelas untuk low, stop loss 1,4 ATR, win rate lima puluh delapan persen, profit factor 1,72, dua puluh dua persen per tahun. Pada OOS: win rate lima puluh empat persen, profit factor 1,51, delapan belas persen per tahun. Lima iterasi walk-forward menghasilkan rata-rata WFE 0,71. Empat bulan demo mengkonfirmasi slippage setengah pip lebih besar dari asumsi; win rate dan profit factor tetap dalam kisaran. Micro-lot live mulai Januari menghasilkan lima puluh satu persen setelah tiga bulan — di bawah backtest, namun masih positif bersih. Kuartal ketiga membawa keputusan: perbesar posisi, atau tunggu jika volatilitas bergeser dari norma. Angka-angka ini bersifat ilustratif.
Langkah selanjutnya — apa yang harus Anda lakukan
- Tulis aturan strategi Anda ke dalam file teks biasa dengan cukup presisi sehingga orang lain yang membacanya akan membuka posisi yang sama persis — tanpa interpretasi, tanpa "saya merasakan tren", lengkap dengan nilai parameter yang tepat, rumus stop loss, dan ukuran posisi sebagai persentase dari ekuitas akun Anda.
- Unduh data historis untuk pair yang benar-benar Anda perdagangkan — minimum sepuluh tahun untuk grafik harian, lima tahun untuk M30 dan M15, dua tahun data tick asli untuk scalping; pastikan sampel mencakup berbagai rezim pasar, termasuk tren, konsolidasi, guncangan volatilitas, dan siklus suku bunga.
- Bagi data menjadi tujuh puluh persen in-sample dan dua puluh lima hingga tiga puluh persen out-of-sample; jangan sentuh OOS sampai optimasi IS selesai, kemudian jalankan lima hingga tujuh iterasi walk-forward; jika WFE jatuh di bawah 0,5 atau parameter berubah lebih dari lima puluh persen antar iterasi, sederhanakan logika strategi Anda.
- Untuk strategi yang telah lolos walk-forward, jalankan tiga hingga enam bulan forward testing pada akun demo dengan parameter dibekukan, kemudian tiga hingga enam bulan micro-lot live; hanya ketika keempat set hasil menunjukkan konsistensi, tingkatkan ke ukuran target — pertimbangkan juga simulasi Monte Carlo sebagai pelengkap yang menunjukkan distribusi kurva ekuitas terburuk yang masuk akal. Bagi Anda yang mempertimbangkan akun syariah (bebas swap), banyak pialang berjangka berizin BAPPEBTI menawarkan opsi ini.
- Baca hasil melalui lensa konsistensi, bukan imbal hasil tertinggi: dua belas persen per tahun di setiap tahap lebih baik daripada tiga puluh persen pada IS dan delapan persen pada OOS, karena konsistensilah yang menentukan apakah akun Anda bertahan di tahun pertama. Keuntungan dari trading umumnya dikenai Pajak Penghasilan (PPh) dan dilaporkan dalam SPT Tahunan; pastikan Anda memiliki NPWP dan konsultasikan dengan konsultan pajak mengenai tarif dan perlakuan yang berlaku untuk situasi Anda.
Sumber dan referensi
-
Robert Pardo The Evaluation and Optimization of Trading Strategies · klasyczny podręcznik o ewaluacji systemów transakcyjnych i metodyce walk-forward onlinelibrary.wiley.com ↗
-
MetaQuotes MetaTrader 5 Help — Strategy Tester · oficjalna dokumentacja MT5 dotycząca Strategy Testera, forward testingu i optymalizacji parametrów www.metatrader5.com ↗
-
MetaQuotes MetaTrader 4 Help — Strategy Testing · opis Strategy Testera MT4: parametry uruchomienia, modele tickowe, interpretacja raportu www.metatrader4.com ↗
-
Backtrader Backtrader documentation — Introduction · wprowadzenie do otwartego silnika backtestowego w Pythonie używanego przez quants www.backtrader.com ↗
-
TradingView Pine Script v6 — Welcome · oficjalna dokumentacja Pine Script i Strategy Testera w TradingView www.tradingview.com ↗
Pertanyaan yang sering diajukan
Apa perbedaan proses bertahap ini dengan satu kali backtesting?
Satu kali backtesting menghasilkan satu angka dan satu interpretasi. Ia menunjukkan apakah strategi secara historis menguntungkan, namun secara diam-diam mengasumsikan bahwa proses optimasi tidak mempelajari kebisingan data. Proses bertahap mengubah angka tunggal itu menjadi serangkaian saringan. Pertama, aturan tertulis menyaring ide-ide yang tidak dapat diverifikasi. Berikutnya, jendela data historis yang panjang menyaring strategi yang hanya bekerja dalam satu rezim pasar. Kemudian, pembagian in-sample versus out-of-sample menyaring parameter yang hanya bekerja pada data latih. Walk-forward menyaring parameter yang hanya bekerja pada satu jendela OOS acak. Demo menyaring strategi yang tidak dapat dieksekusi pada spread live. Micro-lot live menyaring trader yang tidak tahan secara psikologis. Setelah keenam saringan tersebut, hanya sebagian kecil dari kelompok strategi awal yang tersisa — namun itulah bagian yang memiliki peluang nyata untuk bertahan di tahun pertama. Satu kali backtesting tidak memaksakan seleksi tersebut, itulah mengapa delapan puluh persen trader ritel merugi meskipun delapan puluh persen telah menjalankan semacam pengujian historis.
Berapa lama seluruh proses dari ide hingga micro-lot live berlangsung?
Jadwal yang realistis berkisar antara sembilan hingga lima belas bulan, dari penulisan aturan pertama hingga memperbesar posisi ke ukuran target. Dua minggu pertama digunakan untuk menulis aturan dengan presisi dan mengunduh data historis. Dua hingga empat minggu berikutnya mencakup optimasi in-sample dan validasi out-of-sample pertama; jika gagal, Anda kembali ke aturan, bukan mencari pengujian yang lebih baik. Walk-forward dengan lima hingga tujuh iterasi menambah satu bulan lagi karena setiap jendela memerlukan optimasinya sendiri. Kemudian tiga hingga enam bulan forward testing di akun demo. Setelah itu, tiga hingga enam bulan micro-lot live. Hanya setelah membandingkan keempat set hasil dan memastikan konsistensinya, Anda dapat memperbesar ke posisi target. Memotong jadwal di bawah sembilan bulan berarti melewatkan salah satu saringan, dan setiap saringan yang dilewati memindahkan risiko dari fase validasi ke fase live — di mana ia memerlukan biaya uang nyata.
Metrik apa yang harus saya pantau antar tahap untuk mendeteksi inkonsistensi?
Tabel yang dipelihara sepanjang proses harus memiliki empat kolom hasil (in-sample, out-of-sample, demo, micro-lot live) dan setidaknya empat baris metrik untuk masing-masing. Pertama adalah win rate dalam persentase — selisih lebih dari sepuluh poin persentase antar tahap menandakan inkonsistensi. Kedua adalah profit factor, laba kotor dibagi rugi kotor — selisih lebih dari 0,3 antar tahap adalah tanda peringatan. Ketiga adalah rasio risiko-imbalan rata-rata — selisih lebih dari 0,5 R mengindikasikan bahwa stop loss berperilaku berbeda dari pengujian. Keempat adalah drawdown (penurunan ekuitas) maksimum, yang hampir selalu meningkat dari tahap ke tahap; namun kenaikan di atas lima puluh persen antara dua tahap yang berdekatan berarti strategi menghadapi kondisi yang tidak ada dalam pengujian. Kelima, opsional, adalah rata-rata slippage (selip harga) dalam pip — perbedaan antara backtest dan demo, serta antara demo dan micro-lot, menunjukkan apakah broker berperilaku sesuai asumsi. Inkonsistensi pada metrik mana pun adalah sinyal untuk mundur satu tahap dan memahami sumbernya, bukan untuk memperbesar posisi.
Apakah menyelesaikan seluruh proses menjamin strategi akan menghasilkan keuntungan saat live?
Tidak. Setiap tahap meningkatkan probabilitas bahwa strategi memiliki keunggulan nyata, namun tidak ada serangkaian pengujian historis atau forward yang menghilangkan risiko fundamental: pasar kuartal depan bisa saja berbeda dari semua yang Anda lihat dalam data. Seluruh proses secara diam-diam mengasumsikan bahwa rezim pasar dalam jendela out-of-sample dan demo akan cukup mirip dengan rezim live. Jika strategi mempelajari pasar 2018 hingga 2023 dengan dua guncangan volatilitas dan dua siklus kenaikan suku bunga, lalu berjalan dari 2024 dalam range panjang dengan volatilitas rendah dan lebih sedikit rilis yang menggerakkan pasar, micro-lot live bisa menunjukkan hasil yang jauh dari backtest. Itulah mengapa disiplin bukan sekadar mengandalkan lolosnya saringan, melainkan mempertahankan micro-lot cukup lama untuk membandingkan hasilnya dengan uang nyata terhadap tiga tahap sebelumnya. Pelengkap yang berguna adalah simulasi Monte Carlo yang mengacak urutan transaksi secara acak dan mengungkapkan distribusi kurva ekuitas yang mungkin terjadi — estimasi skenario terburuk yang masuk akal, yang tidak pernah terungkap oleh backtest saja. Artikel ini semata-mata bersifat edukatif dan bukan merupakan nasihat investasi.