�Cuánto proyecta un sistema?

Usted est� aqu�:
Home
Optimizaci�n
�Cu�nto proyecta un sistema?

�Cu�nto proyecta un sistema?

TradingSys (AndG) - 20 Jun 2016

0 comentarios

tradingsys El principal problema de optimizar una estrategia es qu� combinaci�n param�trica elegir y si esa combinaci�n espec�fica es capaz de proyectar a futuro un porcentaje apreciable de la performance obtenida en la regi�n optimizada del hist�rico.

Para contextualizar esta cuesti�n vamos a utilizar un sistema sencillo cuyas reglas ya describimos el art�culo "C�mo mejorar sistemas empleando t�cnicas de programaci�n gen�tica" (Hispatrading, N� 23). El sistema ST36 es de tipo intradiario, con una alta cadencia operativa y ha sido dise�ado para trabajar �ndices en time frames relativamente peque�os de 10 a 20 minutos. Las reglas de esta estrategia son:

ENTRAR LARGOS:

Si el cierre actual cruza por encima de una EMA de 500 barras, es mayor que una EMA de 25 barras y el RSI de 14 barras est� por encima del nivel 50.

ENTRAR CORTOS:

L�gica Inversa.

CERRAR LARGOS:

Si el cierre actual cae por debajo de una EMA de 25 barras.

CERRAR CORTOS:

L�gica inversa.

� El sistema es de tipo reverse: No es necesario esperar al cierre de una posici�n para entrar en sentido contrario.

En los ejemplos que veremos a continuaci�n aplicaremos el sistema los siguientes futuros sobre �ndices estadounidenses: ES, YM, TF y NQ, en un time frame de 15 min. y con un hist�rico de 2001 a 2015.

Los par�metros optimizables son cuatro: EMA Larga, EMA Corta, RSI Up y RSI Down. Una vez realizada la evaluaci�n In-Sample, obtenemos la siguiente zona robusta y valores de salto:

tradingsys

N�tese que la ventana de optimizaci�n del RSI Up/Down es muy estrecha. Esto es as� porque en el dise�o de la l�gica lo que se buscan son cortes ascendentes y descendentes con el valor central de 50 del RSI. Sin embargo, nosotros los incorporamos como par�metros para a�adir m�s diversidad.

El n�mero de combinaciones param�tricas es:

CP = (400/10) * 30 *10 * 10 = 120.000

No hace falta que perdamos el tiempo explor�ndolas todas. Nos valdr� con una muestra aleatoria de 5.000. Realizaremos nuestro experimento del siguiente modo:

-   Regi�n In-Sample (IS) a optimizar: 2001-2007

-   Regi�n Out-Sample (OS): 2008-2015.

-    Ratio diana: SQN.

Generamos un conjunto de 5.000 combinaciones param�tricas aleatorias y las ordenamos en un ranking seg�n el SQN. Seleccionamos las mejores combinaciones, las peores y las situadas en la mediana. Acto seguido aplicamos dichas combinaciones a la regi�n Out-Sample.

Advi�rtase que para mitigar el efecto de la sobreoptimizaci�n, elegimos una generosa regi�n IS de 7 a�os de hist�rico, en la que se realizan en promedio 498 operaciones por mercado. Con un pico de 1310 y un m�nimo de 473.

Realizamos este peque�o experimento para responder a dos preguntas:

1) �Las mejores combinaciones param�tricas en el IS siguen siendo una buena elecci�n para el OS?

2) �Elegir los mejores par�metros del IS conducir� inexorablemente a sistemas sobreoptimizados?

En los siguientes gr�ficos mostramos el resultado de optimizar los par�metros de la zona robusta en el periodo IS y aplicar las mejores combinaciones de valores (verde), peores (rojo) y pr�ximas a la mediana (azul) al per�odo OS en los activos: ES, NQ, TF, YM:

tradingsys

Como puede apreciarse, las combinaciones param�tricas de m�ximo rendimiento en el IS son tambi�n la mejor opci�n para el OS. Si elegimos combinaciones param�tricas pr�ximas a la mediana (IS) y las aplicamos al (OS) tampoco obtenemos una mejora significativa, salvo en el caso del YM. Por lo que se refiere a las combinaciones de m�nimo rendimiento en el IS, en todos los casos se observa una mejora en el OS, pero con un rendimiento inferior al de las combinaciones pr�ximas a la mediana y de m�ximo rendimiento.

As� que por ahora, la respuesta a la primera pegunta es afirmativa, pero con las salvedades que veremos m�s adelante. En lo referente a sobreoptimizaci�n, en este caso no apreciamos que las mejores combinaciones generen necesariamente resultados pobres en el OS, sino m�s bien al contrario.

Seguidamente analizaremos con m�s detalle el caso del ES:

Si analizamos la distribuci�n del beneficio medio por operaci�n (BMO) de la muestra aleatoria de combinaciones param�tricas en la regi�n IS, obtenemos la siguiente distribuci�n:

tradingsys

BMO M�ximo = $59,24
BMO M�nimo = $12,94
BMO Mediana = $36,09

El hecho de que todas las combinaciones de par�metros tengan BMO positivo y que no haya demasiada dispersi�n, nos est� indicando que la zona robusta ha sido correctamente delimitada en la regi�n IS.

Veamos qu� ocurre en el OS:

tradingsys

BMO M�ximo = $56,74
BMO M�nimo = $14,14
BMO Mediana = $39,17

Observamos una distribuci�n m�s irregular y alejada de la normalidad. Sin embargo el BMO est� en terreno positivo para todas las combinaciones y no se aprecia mayor dispersi�n. Por tanto, en este tramo del hist�rico el sistema seguir� funcionando dentro de la zona robusta.

En este gr�fico podemos las curvas del beneficio acumulado en IS de las tres mejores combinaciones param�tricas, las tres peores y las tres m�s pr�ximas a la mediana:

tradingsys

Todas las combinaciones param�tricas de la zona robusta se encuentran dentro del cono formado por las curvas de m�ximo y m�nimo rendimiento. El BMO oscila entre un m�ximo de 59,24$ y un m�nimo de 12,94$.

Seguidamente veremos si esas distancias se mantienen en la regi�n no optimizada o si las curvas de m�ximo y m�nimo rendimiento tienden a converger hacia la mediana, as� como si se aprecia una reducci�n del BMO en cada grupo de combinaciones que podamos imputar al desgaste de la l�gica.

El siguiente grafico muestra la aplicaci�n de las mismas combinaciones param�tricas a la regi�n OS. El beneficio medio no var�a sustancialmente, aunque las curvas aparecen m�s escarpadas, el DD es mayor en las tres categor�as y el ratio de Sharpe tambi�n:

tradingsys

Como puede apreciarse, las combinaciones de m�ximo rendimiento siguen ofreciendo los mejores resultados en OS. Las combinaciones pr�ximas a la mediana son las que mayor variabilidad experimentan, situ�ndose en un caso por encima y en los otros dos por debajo. Las combinaciones de peor rendimiento, mantienen su comportamiento mediocre en OS, si bien el BMO mejora algo respecto al IS.

Por �ltimo, vamos a analizar mediante una matriz de validaci�n cruzada el rendimiento de las combinaciones param�tricas en cortes de tres a�os. La evaluaci�n se realiza del siguiente modo:

-   Dividimos el hist�rico 2001-2015 en 5 cortes de 3 a�os: 2001-03, 2004-06, 2007-09, 2010-12 y 2013-15.

-   Modelo de optimizaci�n (IS): Optimizamos cada uno de los 5 cortes tomando como base la zona robusta anteriormente mencionada y como ratio diana el SQN.

-   Validaci�n cruzada (OS): Se aplican las 3 combinaciones param�tricas mejores, peores y pr�ximas a la mediana a cada uno de los cinco cortes.

-    Se construye una matriz de validaci�n considerando el SQN, Net Profit y BMO en cada corte.

Esta es la matriz resultante para cada grupo de par�metros:

tradingsys

Las celdas sombreadas en la diagonal de la tabla son los cortes IS con los mejores par�metros de la optimizaci�n. Como podemos apreciar, al aplicar cada una de esas combinaciones param�tricas a los dem�s cortes (regiones OS) la diferencia es siempre negativa. No se aprecia sobreoptimizaci�n, pero s� una p�rdida m�s o menos acusada del rendimiento en cada corte trianual.

El comportamiento es el que cabe esperar de un sistema cuya l�gica no est� rota y todav�a tiene una notable capacidad de proyectar. No apreciamos una diferencia significativa al aplicar las combinaciones param�tricas en sentido "forward" y "backward", tampoco en los per�odos pr�ximos o lejanos al IS. En este caso concreto parece que las diferencias se deben �nicamente a factores como la volatilidad y/o tendencialidad de cada corte temporal.

En las siguientes tablas mostramos la validaci�n cruzada empleando las combinaciones param�tricas pr�ximas a la mediana:

tradingsys

La pauta es la que ya hemos observado previamente: Los resultados en los cortes OS son m�s pobres que si utilizamos las combinaciones de m�ximo rendimiento. Sin embargo la variabilidad es menor. Con respecto a la p�rdida o mejora de la performance, comprobamos que no hay una pauta fija: al aplicar en OS las combinaciones pr�ximas a la mediana, unas veces los resultados mejoran y otras empeoran.

Por �ltimo, repetimos la validaci�n cruzada con las combinaciones de m�nimo rendimiento en el IS. Observamos que en todos los casos los resultados OS son peores a los que se obtienen con las combinaciones pr�ximas a la mediana y de m�ximo rendimiento. Sin embargo, como podemos ver en las tablas, se observa una ligera mejora en todas las regiones OS con respecto al IS. La peque�a mejora observada, no justifica en absoluto el empleo de combinaciones de m�nimo rendimiento:

tradingsys

En definitiva:

- Cuando la zona robusta est� bien acotada, las combinaciones de m�ximo rendimiento tienden a funcionar mejor en OS.

- La clave para delimitar correctamente la zona robusta es hacer la evaluaci�n IS en un hist�rico largo y que recoja de manera no sesgada la variabilidad de los mercados: Tramos alcistas, bajistas y laterales, junto con marco�pocas de alta y baja volatilidad.

- Cuando un sistema no est� sobreoptimizado existe una alta probabilidad de que las mejores combinaciones param�tricas sean las que proyectan mejores resultados en OS.

- La elecci�n de combinaciones param�tricas pr�ximas a la mediana o por debajo de esta generan de manera consistente peores resultados en OS que las combinaciones de m�ximo rendimiento.

Este es un estudio emp�rico a peque�a escala. Sus resultados no deben extrapolarse a todo tipo de sistemas y mercados. Para corroborar estas conclusiones deber�a hacerse un estudio de base mucho m�s amplia con l�gicas muy distintas (tendenciales, antitendenciales, patrones, etc.) en una muestra amplia de mercados y time frames.

Andr�s A. Garc�a.

� Tradingsys.org , 2016

Si usted es ciudadano o residente en los EE.UU. debe leer la siguiente advertencia.

IMPORTANT RISK DISCLOSURE

Futures based investments are often complex and can carry the risk of substantial losses. They are intended for sophisticated investors and are not suitable for everyone. The ability to withstand losses and to adhere to a particular trading program in spite of trading losses are material points which can adversely affect investor returns.

Past performance is not necessarily indicative of future results. Data and graph above are intended to be mere examples and are for educational and illustrative purpose only, and do not represent any trading recommendation.

Please read carefully the CFTC required disclaimer regarding hypothetical results below.

HYPOTHETICAL PERFORMANCE RESULTS HAVE MANY INHERENT LIMITATIONS, SOME OF WHICH ARE DESCRIBED BELOW. NO REPRESENTATION IS BEING MADE THAT ANY ACCOUNT WILL OR IS LIKELY TO ACHIEVE PROFITS OR LOSSES SIMILAR TO THOSE SHOWN; IN FACT, THERE ARE FREQUENTLY SHARP DIFFERENCES BETWEEN HYPOTHETICAL PERFORMANCE RESULTS AND THE ACTUAL RESULTS SUBSEQUENTLY ACHIEVED BY ANY PARTICULAR TRADING PROGRAM. ONE OF THE LIMITATIONS OF HYPOTHETICAL PERFORMANCE RESULTS IS THAT THEY ARE GENERALLY PREPARED WITH THE BENEFIT OF HINDSIGHT. IN ADDITION, HYPOTHETICAL TRADING DOES NOT INVOLVE FINANCIAL RISK, AND NO HYPOTHETICAL TRADING RECORD CAN COMPLETELY ACCOUNT FOR THE IMPACT OF FINANCIAL RISK OF ACTUAL TRADING. FOR EXAMPLE, THE ABILITY TO WITHSTAND LOSSES OR TO ADHERE TO A PARTICULAR TRADING PROGRAM IN SPITE OF TRADING LOSSES ARE MATERIAL POINTS WHICH CAN ALSO ADVERSELY AFFECT ACTUAL TRADING RESULTS. THERE ARE NUMEROUS OTHER FACTORS RELATED TO THE MARKETS IN GENERAL OR TO THE IMPLEMENTATION OF ANY SPECIFIC TRADING PROGRAM WHICH CANNOT BE FULLY ACCOUNTED FOR IN THE PREPARATION OF HYPOTHETICAL PERFORMANCE RESULTS AND ALL WHICH CAN ADVERSELY

Modificado por AndyG - 29 Abr 2017

�Cu�nto proyecta un sistema?

A�adir comentario

Secciones

Entradas recientes

Enlaces