Backtesting en la práctica — proceso de validación por etapas

Última verificación: · Contenido de vigencia prolongada
Advertencia de riesgo · YMYL Este artículo tiene fines exclusivamente educativos y no constituye asesoramiento de inversión. Operar en el mercado Forex conlleva un alto riesgo de pérdida de capital — la ESMA informa que entre el 74 % y el 89 % de las cuentas minoristas pierde dinero.

Casi todo trader serio ha ejecutado alguna vez un backtesting (prueba retrospectiva) de su estrategia, pero pocos siguen un proceso de validación honesto y escalonado — y esa diferencia separa la cuenta que sobrevive el primer año de la que queda a cero en el tercer mes. Este artículo recorre el proceso completo: redactar las reglas con precisión, elegir la ventana histórica, dividir los datos, realizar el walk-forward (análisis deslizante), operar en demo y afrontar el primer micro lote en real. No es la instrucción para un único test, sino la disciplina de llevar una estrategia desde la idea hasta la cuenta real.

Por qué un solo backtest no es un proceso

Un solo backtest arroja un número que no entiendes del todo. La estrategia ganó un 30 % — ¿capturó una ventaja real o ejecutaste trescientas combinaciones de parámetros hasta que una se ajustó al ruido histórico? El número por sí solo no responde. Lo hace el proceso, que elimina progresivamente la capacidad del trader de aprender de los datos sobre los que la estrategia será finalmente juzgada. Cada etapa es un tamiz de mallas más finas. La mecánica de un test único la explico en el artículo sobre cómo hacer un backtest de estrategia; aquí me centro en la disciplina que empieza mucho antes del primer clic en "Iniciar".

Reglas por escrito, sin interpretación

Una estrategia que no puede traducirse en código o en una hoja de reglas precisa no está lista para probarse. Escribe las condiciones de entrada, salida, stop loss (orden de stop), take profit y tamaño de la posición con suficiente precisión para que un segundo lector del documento abra exactamente las mismas operaciones. "Compro cuando veo tendencia" es una impresión, no una regla. Una versión testeable dice: "compro al cierre de la vela diaria cuando la EMA de 50 sesiones está por encima de la EMA de 200, el RSI(14) por debajo de 70 y el precio toca la media de 20 sesiones por arriba; stop loss a 1,5 ATR(14) por debajo de la entrada, objetivo a 2,5 ATR por encima; riesgo del 1 % del capital de la cuenta". La disciplina de redactar filtra la mayoría de ideas antes de que el test empiece.

La ventana de datos debe abarcar más de un régimen

El segundo filtro es la historia. Mi regla: mínimo diez años para estrategias diarias, cinco para marcos M30 y M15, dos para scalping — con ticks reales, no con el histórico sintético del bróker. La última década incluye las largas tendencias en el DXY (2014–2017), el shock de volatilidad de marzo de 2020, el ciclo de subidas de tipos (2022–2023) y la consolidación de 2024. Una estrategia que solo funciona en uno de esos mundos es una ilusión ajustada a una época. Menos de cien operaciones en cinco años es una muestra insuficiente — cien es el mínimo de significación estadística, los profesionales apuntan a trescientas.

División entre in-sample y out-of-sample

La tercera etapa consiste en quitarte datos de las manos. Divide la historia en un 70 % in-sample (IS) para la optimización y entre un 25 % y un 30 % out-of-sample (OOS), que no debes tocar hasta que la optimización esté completa. El bloque OOS es el tamiz de honestidad: muestra si los parámetros elegidos con los datos de entrenamiento tienen valor más allá de ellos. Si en IS obtienes una tasa de aciertos del 80 % y un profit factor de 2,4, y esos mismos parámetros dan un 50 % y 1,1 en OOS, acabas de pillarte a ti mismo haciendo sobreajuste (overfitting). Una estrategia con el 12 % anualizado en IS y el 11 % en OOS es genuinamente mejor que una con el 30 % en IS y el 8 % en OOS. Buscas consistencia, no el máximo.

El walk-forward como tamiz de mallas más finas

Una sola división IS/OOS da un único número. El walk-forward la repite cinco a siete veces: primer IS 2018–2021, OOS 2022; segundo IS 2019–2022, OOS 2023; y así sucesivamente. Para cada ventana reoptimizas, congelas los parámetros ganadores, pruebas en OOS, registras el resultado y desplazas la ventana. Tras cinco a siete ciclos, el OOS medio es el mejor proxy de lo que producirá la cuenta real. Un WFE (Walk-Forward Efficiency) entre 0,5 y 0,75 señala una estrategia que merece ser llevada al siguiente paso; por debajo de 0,3 es una confesión de sobreajuste. La mecánica de la ventana deslizante y la diferencia entre la variante móvil y la anclada las explico en el artículo de análisis walk-forward; para un contexto más amplio, el taller de traders de ForexMechanics cubre variantes avanzadas.

«El propósito del análisis walk-forward es revelar el rendimiento real de una estrategia de trading en tiempo real y con dinero real, sin necesidad de operarla realmente en tiempo real con dinero real.» — Robert Pardo, The Evaluation and Optimization of Trading Strategies, Wiley, 2008

Demo y micro lote real — donde la estrategia se encuentra con la realidad

Una estrategia que supera el walk-forward está lista para el demo, no para el dinero real. Tres a seis meses de forward testing (prueba prospectiva) con los parámetros congelados tras la última iteración es el primer test en tiempo real: spreads (la horquilla) reales, la secuencia auténtica de publicaciones macroeconómicas, el gap del domingo por la noche, la liquidez real de cada hora del día. El demo extrae lo que el backtest nunca muestra: una estrategia considerada líquida en el histórico puede resultar difícil de ejecutar porque las señales aparecen mientras duermes. No son problemas de datos — son problemas tuyos y del mercado en ese trimestre.

Tras el forward testing no entras a plena posición. Entras con un micro lote — una décima parte del tamaño objetivo — durante tres a seis meses en dinero real. El objetivo es informativo: ver en qué se diferencia la ejecución real del demo, cuánto es el slippage (deslizamiento) verdadero, cómo se comporta el bróker alrededor del NFP y cómo reaccionas a pérdidas reales, aunque modestas. La tabla mantenida a lo largo de todas las etapas tiene cuatro columnas: IS, OOS, demo, micro lote real. Cuanto más próximas estén las cifras en las cuatro columnas, menor es el riesgo de que estés viviendo en una ilusión. Una divergencia mayor es la señal de retroceder una etapa, no de escalar la posición.

Ejemplo ilustrativo — proceso completo para una estrategia de ruptura

Una estrategia de ruptura (breakout) en EUR/USD, M30: entrada al superar el máximo de veinte velas, salida en el mínimo de diez. Histórico 2014–2023, IS 2014–2020, OOS 2021–2023. Optimización en IS: veintitrés velas para el máximo, once para el mínimo, stop loss a 1,4 ATR, tasa de aciertos del 58 %, profit factor 1,72, rendimiento del 22 % anualizado. Los mismos parámetros en OOS: tasa de aciertos 54 %, profit factor 1,51, rendimiento del 18 % anualizado. Cinco iteraciones de walk-forward dan un WFE medio de 0,71. Cuatro meses de demo confirman medio pip más de deslizamiento del previsto; la tasa de aciertos y el profit factor se mantienen en el rango. El micro lote real desde enero arroja un 51 % tras tres meses — por debajo del backtest, pero con ganancia neta positiva. El tercer trimestre trae la decisión: escalar o esperar si la volatilidad se desvía de la norma histórica. Las cifras son ilustrativas.

¿Qué hacer mañana?

  1. Escribe las reglas de la estrategia en un archivo de texto con suficiente precisión para que otro lector abra operaciones idénticas — sin interpretación, con valores exactos de cada parámetro, la fórmula del stop loss y el take profit, y el tamaño de la posición expresado como porcentaje del equity (patrimonio) de la cuenta.
  2. Descarga el histórico del par que realmente operas — mínimo diez años para marcos diarios, cinco para M30 y M15, dos años de ticks reales para scalping — y verifica que la muestra abarca distintos regímenes: tendencia, consolidación, shocks de volatilidad y ciclos de tipos de interés.
  3. Divide los datos en un 70 % in-sample y un 25–30 % out-of-sample; no toques el bloque OOS hasta terminar la optimización y luego ejecuta cinco a siete iteraciones de walk-forward — si el WFE cae por debajo de 0,5 o los parámetros saltan más de un 50 % entre iteraciones, simplifica la lógica en lugar de buscar un nuevo test.
  4. Para una estrategia que supere el walk-forward, ejecuta tres a seis meses de forward testing en demo con parámetros congelados y luego otros tres a seis meses con micro lote real; solo cuando los cuatro conjuntos de resultados sean consistentes escala al tamaño objetivo, apoyándote en una simulación Monte Carlo para estimar el peor escenario razonable.
  5. Lee los resultados a través del prisma de la consistencia, no del retorno máximo: una estrategia con el 12 % anualizado en cada etapa es genuinamente mejor que una con el 30 % en IS y el 8 % en OOS; para profundizar en la ventaja que este proceso pone a prueba, consulta el artículo sobre cómo descubrir una ventaja en el trading.

Si operas desde Latinoamérica, consulta tu regulador local — CNBV (México), CNV (Argentina), CMF (Chile), SBS (Perú) u otro organismo competente en tu país.

Jarosław Wasiński
Sobre el autor

Jarosław Wasiński

Redactor jefe de MyBank.pl · Analista financiero y de mercados

Analista y profesional independiente con más de 20 años en el sector financiero. Fundador y redactor jefe del portal MyBank.pl, en marcha desde 2004. Análisis fundamental de los mercados de divisas y macroeconómicos desde 2007. Escribe desde la perspectiva de los mercados europeos y el marco regulatorio de ESMA.

Fuentes y bibliografía

  1. Robert Pardo The Evaluation and Optimization of Trading Strategies · klasyczny podręcznik o ewaluacji systemów transakcyjnych i metodyce walk-forward onlinelibrary.wiley.com ↗
  2. MetaQuotes MetaTrader 5 Help — Strategy Tester · oficjalna dokumentacja MT5 dotycząca Strategy Testera, forward testingu i optymalizacji parametrów www.metatrader5.com ↗
  3. MetaQuotes MetaTrader 4 Help — Strategy Testing · opis Strategy Testera MT4: parametry uruchomienia, modele tickowe, interpretacja raportu www.metatrader4.com ↗
  4. Backtrader Backtrader documentation — Introduction · wprowadzenie do otwartego silnika backtestowego w Pythonie używanego przez quants www.backtrader.com ↗
  5. TradingView Pine Script v6 — Welcome · oficjalna dokumentacja Pine Script i Strategy Testera w TradingView www.tradingview.com ↗

Preguntas frecuentes

¿En qué se diferencia este proceso por etapas de un backtesting único?

Un único backtesting arroja un número y una interpretación. Muestra si la estrategia fue históricamente rentable pero asume en silencio que la optimización no aprendió el ruido. Un proceso por etapas convierte ese único número en una secuencia de tamices. Primero, las reglas escritas filtran ideas no verificables. Después, una ventana larga de histórico filtra estrategias que solo funcionan en un régimen. A continuación, la división in-sample/out-of-sample filtra los parámetros que solo funcionan con los datos de entrenamiento. El walk-forward filtra los parámetros que solo funcionan en una ventana OOS aleatoria. El demo filtra las estrategias que no pueden ejecutarse con spreads reales. El micro lote real filtra a los traders que no aguantan psicológicamente. Tras pasar por los seis tamices queda una fracción del grupo original de estrategias, pero esa fracción tiene una probabilidad real de sobrevivir el primer año. Un único backtesting no impone esa selección, y por eso el ochenta por ciento de los traders minoristas pierde dinero aunque el ochenta por ciento haya realizado algún tipo de test histórico.

¿Cuánto tiempo dura el proceso completo desde la idea hasta el micro lote real?

Un calendario realista va de nueve a quince meses desde la primera redacción de reglas hasta escalar la posición al tamaño objetivo. Las dos primeras semanas se dedican a redactar las reglas con precisión y descargar el histórico. Las dos a cuatro semanas siguientes cubren la optimización in-sample y la primera validación out-of-sample; si el resultado no supera el test, vuelves a las reglas en lugar de buscar un test mejor. El walk-forward con cinco a siete iteraciones añade otro mes, porque cada ventana requiere su propia optimización. A continuación vienen tres a seis meses de forward testing en demo. Después, otros tres a seis meses de micro lote real. Solo tras comparar los cuatro conjuntos de resultados y confirmar su consistencia puedes escalar al tamaño objetivo. Acortar el calendario por debajo de nueve meses significa saltarse uno de los tamices, y cada tamiz omitido traslada el riesgo de la fase de validación a la fase real, donde ya cuesta dinero verdadero.

¿Qué métricas debo seguir entre etapas para detectar inconsistencias?

La tabla mantenida a lo largo del proceso debe tener cuatro columnas de resultados (in-sample, out-of-sample, demo, micro lote real) y al menos cuatro filas de métricas por columna. La primera es la tasa de aciertos en porcentaje — una diferencia superior a diez puntos porcentuales entre etapas señala inconsistencia. La segunda es el profit factor, beneficio bruto dividido entre pérdida bruta — una diferencia superior a 0,3 entre etapas es una señal de alerta. La tercera es la relación riesgo-beneficio media — una diferencia superior a 0,5 R sugiere que el stop loss se comporta de forma distinta a como lo hace en el test. La cuarta es el drawdown (caída máxima) máximo, que casi siempre crece de etapa en etapa, pero un aumento superior al 50 % entre dos etapas adyacentes indica que la estrategia encuentra condiciones ausentes en el test. La quinta, opcional, es el slippage (deslizamiento) medio en pips — la diferencia entre el backtesting y el demo, y entre el demo y el micro lote, dice si el bróker se comporta conforme a las hipótesis. La inconsistencia en cualquiera de estas métricas es la señal de retroceder una etapa y entender el origen, no de escalar la posición.

¿Superar todo el proceso garantiza que la estrategia ganará en real?

No. Cada etapa eleva la probabilidad de que la estrategia tenga una ventaja real, pero ningún conjunto de tests históricos o prospectivos elimina el riesgo fundamental: el mercado del próximo trimestre puede diferir de todo lo que has visto en los datos. El proceso asume en silencio que el régimen de las ventanas OOS y del demo se parecerá lo suficiente al régimen real. Si la estrategia aprendió el mercado de 2018 a 2023 con dos shocks de volatilidad y dos ciclos de subidas de tipos, y opera desde 2024 en un rango largo con baja volatilidad y menos publicaciones que muevan el mercado, el micro lote real puede arrojar resultados muy alejados del backtesting. Por eso la disciplina no consiste en confiar únicamente en haber superado los tamices, sino en mantener el micro lote el tiempo suficiente para comparar el resultado en dinero real con las tres etapas anteriores. El complemento es una simulación Monte Carlo que reordena aleatoriamente la secuencia de operaciones y revela la distribución de posibles curvas de equity — una estimación del peor escenario razonable que el backtesting por sí solo nunca muestra.

Profundiza más · la guía completa