Backtesting de una estrategia: ¿cómo hacerlo bien?

Última verificación: · Contenido de vigencia prolongada
Advertencia de riesgo · YMYL Este artículo tiene fines exclusivamente educativos y no constituye asesoramiento de inversión. Operar en el mercado Forex conlleva un alto riesgo de pérdida de capital — la ESMA informa que entre el 74 % y el 89 % de las cuentas minoristas pierde dinero.

Cuando un lector me cuenta que su estrategia dio un noventa y cinco por ciento de operaciones ganadoras, ya sé que la historia no termina bien. Un backtest (prueba retrospectiva) no es un oráculo ni una promesa de dinero futuro. Es una herramienta para falsar tu idea: para averiguar si tus reglas aguantaron distintos regímenes de mercado o solo describieron un episodio afortunado. Aquí verás cómo hacer la prueba con honestidad, dónde están las peores trampas y por qué incluso un backtest bien ejecutado no garantiza una cuenta real rentable.

¿Por qué probar una estrategia sobre datos históricos?

Antes de arriesgar dinero real, compruebas si tus reglas habrían ganado dinero a lo largo de los últimos años. Si produjeron una expectativa positiva durante cinco años de condiciones variadas, probablemente tengan algo de ventaja. Frágil —los mercados evolucionan, los bancos centrales cambian de política, la liquidez migra—, pero es lo mejor que tenemos. Un backtest descarta las ideas inviables y deja pasar las que merecen una prueba en cuenta demo y, más adelante, una pequeña posición real. Nada más.

Las reglas deben ser inequívocas o estarás probando ficción

El primer paso es donde tropieza la mayoría de los principiantes. La estrategia debe estar escrita de forma que un desconocido que lea las reglas abriría exactamente las mismas operaciones que tú. Una entrada como «compro cuando veo una tendencia» no es una estrategia: es una sensación. Una versión verificable de la misma idea: «compro al cierre de la vela diaria cuando la media móvil exponencial (EMA) de 50 sesiones está por encima de la EMA de 200, el RSI (índice de fuerza relativa) de 14 sesiones está por debajo de 70 y el precio toca la media de 20 sesiones desde arriba; stop loss (orden de stop) a 1,5 ATR(14) por debajo de la entrada; objetivo a 2,5 ATR por encima; riesgo del uno por ciento del capital por operación». Solo una regla así puede probarse con rigor.

Un tema relacionado es cómo descubrir tu propia ventaja en el trading: si no sabes en qué se apoya tu ventaja, el backtest te lo dirá de forma brutal y rápida. Para un marco más amplio sobre las pruebas dentro de la rutina del trader, consulta el taller del trader en ForexMechanics.com.

¿De dónde sacar datos históricos y cuántas muestras bastan?

Los datos son la segunda gran fuente de error. El historial de tics de un bróker nunca coincidirá tic a tic con el de otro: distinto modelo de ejecución, distinta fuente de liquidez. Para una estrategia de stop ajustado, esa diferencia decide el resultado. Para operativa intradía conviene recurrir a los datos de futuros de la bolsa de Chicago (CME), centralizados y auditables. Para swing sobre velas diarias, el historial del bróker suele bastar, siempre que provenga de un proveedor de prestigio. La elección de la herramienta también pesa: comparar Forex Tester con el Strategy Tester integrado en MetaTrader ayuda a decidir cuándo el programa dedicado aporta ventaja frente al simulador de la propia plataforma.

La segunda cuestión es el tamaño de la muestra. Una regla presente en la literatura desde hace décadas dice: al menos cien operaciones en la prueba, para que el resultado no sea víctima de la suerte. Treinta operaciones magníficas en una ventana de seis meses no significan nada. Cien es el umbral de la significación estadística; los profesionales apuntan a trescientas o más. Una estrategia swing en D1 necesita cinco años de datos, el day trading dos, y el scalping basta con un año, pero de tics reales.

Cinco años tienen otra virtud: cubren distintos regímenes de mercado. En la última década cupieron periodos de tendencia (2014–2017 en el DXY), de volatilidad brusca (marzo de 2020), de endurecimiento monetario (2022–2023) y de vuelta a la consolidación (2024). Una estrategia que solo funciona en un tipo de mercado no es una estrategia: es una ilusión ajustada a una época.

Spread, comisión y slippage: sin ellos el backtest miente

El backtest «milagroso» más habitual es aquel en el que se olvidó restar los costes de operar. Para swing en H4 con un objetivo de 200 pips, un spread (la horquilla) de 0,8 pips apenas se nota. Para un scalper que hace 30 operaciones al día con un objetivo de cinco pips, ese mismo spread devora la mayor parte de la ventaja. Una prueba realista debe incluir el spread vigente del bróker, la comisión por lote y, para estrategias sensibles a la ejecución, también el slippage (deslizamiento): la diferencia entre el precio que ves al hacer clic y el precio real de ejecución.

El umbral que yo mismo aplico: si el beneficio medio por operación es menor que el doble del coste medio (spread, comisión y slippage previsto en conjunto), la estrategia no tiene margen de seguridad y no pasa de fase. Un filtro brutal, pero salva de meses engañándote a ti mismo. Otra fuente aparte de espejismos es usar indicadores que repintan sus valores históricos: en la prueba sobre datos pasados parecen perfectos, pero en tiempo real se comportan de forma muy distinta.

Una curva ajustada a la historia no es una estrategia, es un museo

La trampa en la que cae la mayoría de los autodidactas se llama sobreajuste (curve fitting, ajuste a la curva). Funciona así: pruebas la estrategia con treinta valores de un parámetro, eliges el del mejor resultado y anuncias que el sistema rinde un cuarenta por ciento al año. Pero lo que de verdad hiciste fue optimizar el ruido, no la señal. Cuantos más parámetros admites a optimización, mayor es la probabilidad de que el resultado sea obra del azar. Robert Pardo, autor del libro clásico sobre la evaluación de sistemas de trading, lo formula así:

«La prueba fuera de muestra es la única medida honesta de la calidad de una estrategia. Si un sistema no conserva su ventaja sobre datos que no vio durante la optimización, significa que se ajustó a la historia, no al mercado.» — Robert Pardo, The Evaluation and Optimization of Trading Strategies, Wiley, 2008.

De ahí nace la división de los datos en muestra de entrenamiento (in-sample) y muestra de validación (out-of-sample). El reparto típico es de un setenta por ciento para el ajuste y un treinta por ciento para la confirmación. Si el resultado en la muestra fuera de optimización es notablemente peor, tienes sobreajuste, y la estrategia en su forma actual no sirve para una cuenta real. Un enfoque aún más riguroso es el análisis walk-forward sobre datos históricos, que optimiza de forma alterna sobre una ventana histórica y prueba sobre la ventana siguiente, desplazándose a través del historial. Es la mejor protección de la que disponemos hoy contra la falsa confianza en un backtest.

Un ejemplo hipotético: cómo leer las cifras con honestidad

Imagina una estrategia swing sobre EUR/USD, en D1, probada entre 2019 y 2024 con el flujo de trabajo de la práctica del backtest en MetaTrader 4 y MetaTrader 5. Resultado ilustrativo: 147 operaciones, un 54 por ciento de aciertos, relación media de beneficio a riesgo de 2,3 a 1, factor de beneficio (profit factor) de 1,78, drawdown (caída máxima) del 14,5 por ciento y rentabilidad neta de +87 por ciento en cinco años (en torno al 13,3 por ciento anual compuesto). Cifras poco espectaculares, pero realistas: una plantilla, no un extracto de cuenta. Un buen paso siguiente es una simulación de Monte Carlo de la misma estrategia, que reordena al azar la secuencia de operaciones para mostrar cómo podría haber evolucionado el capital bajo distintos órdenes.

Qué hacer mañana

El conocimiento sobre el backtesting solo empieza a trabajar cuando tú mismo pruebas y confrontas los resultados con tu diario de trading. Los cinco pasos de abajo ocupan unas pocas tardes y te ahorran los errores más frecuentes de un trader en formación.

  1. Escribe la estrategia en un único archivo de texto, de forma mecánica. Cada entrada, cada salida, cada stop loss y cada filtro debe quedar redactado de modo que otra persona, leyendo las mismas reglas, abriría operaciones idénticas. Si en algún punto tienes que añadir «depende de la situación», vuelve al escritorio y concreta: un backtest no lee entre líneas.
  2. Reúne cinco años de datos para swing o dos para day trading, y divídelos por adelantado. Reserva el primer setenta por ciento para el ajuste de las reglas y guarda el último treinta por ciento cerrado hasta que la estrategia sea definitiva. Solo entonces ejecuta la prueba sobre esa segunda parte: ese es tu verdadero examen.
  3. Introduce costes realistas en cada simulación. Añade el spread vigente del bróker, la comisión por lote y un slippage previsto, con valores distintos para las ventanas tranquilas y las sesiones en torno a las publicaciones macroeconómicas. Si, una vez incluidos los costes, la estrategia pierde más del veinte por ciento del beneficio, la respuesta está clara: no tiene margen de seguridad.
  4. Fija un suelo firme de cien operaciones en la prueba. Si la ventana produce menos, alarga el historial, añade instrumentos de la misma familia o acepta que el resultado es una hipótesis, no una prueba. Anota en el diario el número de operaciones, el drawdown medio y el porcentaje de aciertos: esas tres cifras dicen más que la rentabilidad por sí sola. Si operas desde Latinoamérica, consulta tu regulador local —CNBV (México), CNV (Argentina), CMF (Chile), SBS (Perú) u otro organismo competente en tu país— antes de pasar a una cuenta real.
  5. Tras un backtest exitoso, opera en demo al menos tres meses antes de salir a real. Compara las estadísticas de la demo con las del backtest: si la demo sale claramente peor, sospecha sobreajuste, costes subestimados o un error en la automatización. Vuelve a las reglas, no a la esperanza de que en una cuenta real irá mejor. Un buen backtest nunca garantiza un buen resultado en real; solo da el derecho a intentarlo.
Jarosław Wasiński
Sobre el autor

Jarosław Wasiński

Redactor jefe de MyBank.pl · Analista financiero y de mercados

Analista y profesional independiente con más de 20 años en el sector financiero. Fundador y redactor jefe del portal MyBank.pl, en marcha desde 2004. Análisis fundamental de los mercados de divisas y macroeconómicos desde 2007. Escribe desde la perspectiva de los mercados europeos y el marco regulatorio de ESMA.

Fuentes y bibliografía

  1. MetaQuotes Strategy Testing in MetaTrader 5 · oficjalna dokumentacja testera strategii (testowanie i optymalizacja na danych historycznych) www.metatrader5.com ↗
  2. MQL5 Reference Testing Trading Strategies · dokumentacja deweloperska MQL5: tryby generowania tików, symulacja spreadu, testy wielowalutowe www.mql5.com ↗
  3. Bank for International Settlements OTC foreign exchange turnover in April 2022 · Triennial Central Bank Survey — dane o strukturze rynku FX (kontekst dla backtestu instrumentów detalicznych) www.bis.org ↗

Preguntas frecuentes

¿Qué es el sobreajuste de una estrategia?

El sobreajuste (curve fitting, ajuste a la curva) es la situación en la que los parámetros de una estrategia se han afinado tanto sobre las cotizaciones pasadas que no saben manejar los datos nuevos. El síntoma clásico es un backtesting con un noventa y cinco por ciento de aciertos y una cuenta real con un treinta. La razón es sencilla: un noventa y cinco por ciento de aciertos no es sostenible en forex a largo plazo; las estrategias reales se mantienen en el rango del cincuenta al sesenta por ciento. Si tu backtesting muestra más de un setenta por ciento de operaciones ganadoras, tómalo como una señal de alarma y sospecha sobreajuste hasta que se demuestre lo contrario.

¿Con qué software conviene hacer el backtesting?

Para los principiantes, la mejor opción es el Strategy Tester integrado en MetaTrader 5: es gratuito y admite pruebas multidivisa, tics reales y optimización genética. MetaTrader 4 todavía se usa, pero se limita a un único instrumento y a un solo marco temporal. Forex Tester en su versión cinco cuesta unos trescientos dólares y permite revisar la estrategia a mano, vela a vela: una buena herramienta para quien quiere afinar la intuición visual de las reglas antes de automatizarlas. Pine Script en TradingView basta para pruebas sencillas sobre un solo instrumento. En la práctica, la mayoría de las pruebas serias conviene hacerlas en MT5 o en un entorno de programación tipo Python con bibliotecas de backtesting dedicadas.

¿Cuántos datos históricos necesito para una prueba honesta?

Para las estrategias swing y de posición se asume un mínimo de cinco años de datos, para el day trading dos años, y para el scalping un año de tics reales. Estos intervalos no salen de una cifra de calendario mágica, sino de la necesidad de cubrir distintos regímenes de mercado: tendencial, lateral y de alta volatilidad. Además, y con independencia del marco temporal, rige una condición estadística: al menos cien operaciones en la prueba, para que el resultado no sea víctima de la suerte. Los profesionales apuntan a trescientas o más. Si tu historial produce menos, alarga el periodo de la prueba o añade instrumentos de la misma familia; de lo contrario estarás probando una hipótesis, no una estrategia.

¿Cómo son los resultados realistas de un buen backtesting?

Las cifras realistas son un porcentaje de aciertos del cincuenta al sesenta por ciento, una relación media de beneficio a riesgo de al menos dos a uno, un factor de beneficio (profit factor) entre 1,5 y 3,0 y un drawdown (caída máxima) por debajo del veinte por ciento, con un mínimo de cien operaciones y el resultado confirmado en una ventana fuera de muestra. Un ratio de Sharpe por encima de uno indica una relación razonable entre la rentabilidad y la volatilidad. Las banderas rojas son un porcentaje de aciertos por encima del ochenta por ciento, un factor de beneficio por encima de cinco y un drawdown por debajo del cinco por ciento: esa combinación casi siempre delata sobreajuste, no ventaja.

Profundiza más · la guía completa