Sobreoptimización y ruptura de sistemas.

Usted est� aqu�:
Home
Optimizaci�n
Sobreoptimizaci�n y ruptura de sistemas.

Sobreoptimizaci�n y ruptura de sistemas.

TradingSys (AndG) - 18 Mayo 2016

0 comentarios

tradingsys En este art�culo abordaremos el escurridizo concepto de sobreoptimizaci�n en relaci�n con la ruptura de sistemas en operativa real. Mostraremos un nuevo m�todo para determinar el desgaste de una estrategia en el tiempo diferenciando entre la rentabilidad potencial debida a la l�gica y la que se obtiene mediante optimizaci�n.

1) INTRODUCCI�N

Un sistema de trading es un conjunto de reglas y par�metros que determinan los puntos de apertura y cierre de posiciones. Llamamos "l�gica" a las reglas del sistema que nos permiten capturar una ineficiencia o ventaja aprovechable (edge) en los mercados.

Llamamos "par�metros" a las variables susceptibles de optimizaci�n que contienen las reglas. Los par�metros aportan diversidad y permiten operar una misma estrategia en diferentes compresiones horarias y activos. Incluso un sistema simple, con muy pocos par�metros y reglas, genera una enorme variabilidad o n�mero de configuraciones posibles.

Llamamos "optimizaci�n" al proceso iterativo en el que vamos probando en un hist�rico dado cada una de estas configuraciones a fin de seleccionar aquellas que generen mejores resultados.

Al dise�ar y evaluar sistemas normalmente dividimos el hist�rico disponible en dos regiones distintas: In-Sample (IS) y Out-Sample (OS). Usamos la regi�n IS para construir la estrategia, hacer un testeo preliminar de la l�gica subyacente y determinar las horquillas param�tricas de la zona robusta. Llamamos "zona robusta" a los rangos entre valores m�ximos y m�nimos de cada par�metro optimizable que muestran un comportamiento m�s estable y robusto, bajo el criterio de alg�n ratio de performance (Sharpe, SQN, Profit Factor, Calmar, etc.).

La regi�n OS (o fuera de muestra) contiene los datos hist�ricos no empleados en el dise�o de la estrategia y se utiliza para hacer una evaluaci�n m�s realista. Generalmente se utiliza alguna t�cnica estad�stica de validaci�n cruzada, como el Walk-Forwrad (WF), que no es m�s que una validaci�n lineal (de atr�s a adelante) con K iteraciones o el Robust Walk Forward (RWF) que limita el training solo a los rangos de valores de la zona robusta. Comparando los resultados obtenidos en IS y OS podremos determinar si la estrategia tiene potencial de proyectar a futuro los resultados obtenidos en backtest.

2) SOBREOPTIMIZACI�N Y RETORNO ESPERADO

La sobreoptimizaci�n es un concepto difuso y a menudo mal entendido. En el contexto del aprendizaje autom�tico mediante sistemas basados en l�gica difusa, redes neuronales y algoritmos gen�ticos este concepto hace referencia a la incapacidad de la m�quina de encontrar soluciones globales, de construir un modelo que sintetice la estructura general de un problema o situaci�n. En lugar de ello, el algoritmo de autoaprendizaje se atasca en el laberinto de los local optima o soluciones id�neas para el conjunto de datos de entrada pero con escasa o nula aplicabilidad a otros conjuntos de datos o problemas del mismo tipo.

En el �mbito de los sistemas de trading decimos que un sistema est� sobreoptimizado cuando con un conjunto espec�fico de reglas y par�metros conseguimos en el IS unos resultados muy superiores a los que obtenemos en las regiones fuera de muestra u OS. En t�rminos m�s formales: Consideramos sobreoptimizado un sistema si la performance obtenida en OS con las mejores combinaciones param�tricas del IS est� por debajo de la mediana de la performance obtenida en OS en el conjunto de combinaciones param�tricas de la zona robusta.

El siguiente gr�fico servir� para ilustrar el concepto que vamos a explicar a continuaci�n:

tradingsys

>> Ampliar Imagen.

Supongamos un sistema con cuatro par�metros optimizables que queremos optimizar en un hist�rico de ocho a�os. Una vez acotada la zona robusta, obtenemos una matriz de por ejemplo 5.500 combinaciones param�tricas. Cada combinaci�n de par�metros generar� una serie de operaciones diferente. Si disponemos todas ellas, o una muestra significativa, en un gr�fico de equity curve obtendremos un gr�fico como la de la imagen superior. Algunas combinaciones de par�metros obtendr�n una performance muy superior a la media, mientras que otras tendr�n un rendimiento muy inferior. La superficie acotada entre las curvas de m�ximo y m�nimo rendimiento dar� lugar a un cono con una determinada pendiente. Bien, pues para que un sistema tenga calidad, lo realmente importante es que dicha pendiente sea positiva y que el conjunto de curvas tenga la menor dispersi�n posible.

Consideramos sobreoptimizadas o infraoptimizadas aquellas curvas que se alejan varias desviaciones t�picas de los valores centrales de la distribuci�n. Idealmente consideraremos tambi�n, aunque luego veremos que no tiene por qu� ser as�, que el rendimiento esperable en OS para dicho sistema estar� pr�ximo a la mediana de la distribuci�n. De este modo, cuando aplicamos al OS las combinaciones param�tricas de m�ximo rendimiento, existe una alt�sima probabilidad de que los resultados obtenidos sean considerablemente peores que en el IS. Realmente lo que ocurre es que debido a la variabilidad de los mercados, en cada corte temporal ser� �ptima una combinaci�n param�trica distinta.

En mi opini�n el concepto de sobreoptimizaci�n est� sobrevalorado: Lo importante no es la elecci�n de una determinada combinaci�n de par�metros, sino la robustez de la l�gica en s�. Dicho de manera gr�fica: La pendiente y la anchura del cono por el que se mueven todas las curvas posibles. As� que lo que nos interesa es construir sistemas que, con independencia del juego de par�metros elegido, tengan esperanza matem�tica positiva. A�n podemos ser m�s exigentes: �Qu� le pedir�amos a un sistema ideal? Sencillo: Que con cualquier combinaci�n param�trica obtengamos un BMO (beneficio medio por operaci�n) superior a los gastos de la operativa. Hasta aqu� todo perfecto. El problema surge cuando comprobamos en operativa real que muchos sistemas van teniendo a�o a a�o unos resultados peores que los obtenidos en la evaluaci�n OS. Y no es problema de que est�n mal evaluados. Se trata, como seguidamente veremos, del desgaste inherente a la l�gica; del progresivo desacople entre sistema y mercado.

3) RENTABILIDAD DEBIDA A LA L�GICA Y A LOS PAR�METROS

En todo sistema nos interesa diferenciar la rentabilidad debida a la calidad de la l�gica; m�s estable y consistente entre marco�pocas, de la rentabilidad debida a los par�metros; es decir, aquella que se obtiene por la v�a de la optimizaci�n.

Supongamos un sistema intradiario con las siguientes zonas robustas. Estas zonas han sido obtenidas en un hist�rico de siete a�os (2001-07), aplicando unos gastos de operativa que consideramos realistas para ese activo y utilizando para optimizar el ratio diana SQN:

tradingsys

Con estos valores obtenemos la siguiente matriz de combinaciones param�tricas:

M = (35-15) * [(400-150)/10] * [(300-100)/10] * (30-10) * [(1,5-0,5)*10] = 2.000.000

Dos millones de combinaciones posibles parecen muchas para realizar una optimizaci�n completa. Sin embargo, podemos generar una muestra suficientemente representativa con 2.000 a 5.000 combinaciones aleatorias.

Hecha la optimizaci�n, la distribuci�n resultante del BMO (Beneficio Medio por Operaci�n) es:

tradingsys

Siendo el BMO:

M�ximo = 120,17�

M�nimo = 28,21�

Media = 75,25�

Mediana = 74,77�

El BMO m�nimo y m�ximo lo extraemos del promedio de las curvas que se encuentran por debajo de los percentiles 0,01 y 0,99. De este modo contrarrestamos las diferencias en BMO debidas al n�mero de operaciones.

EL BMO m�nimo podemos interpretarlo como el escenario m�s adverso posible aplicando las combinaciones param�tricas menos �ptimas. Es decir, casos extremos de "desoptimizaci�n". El BMO m�ximo representa el mejor escenario que podemos conseguir optimizando. Estas son las combinaciones param�tricas que inevitablemente generan sobreoptimizaci�n.

La mediana de la distribuci�n podemos considerarla como el potencial del sistema debido a la calidad de la l�gica. Aunque fluct�a en el tiempo debido a la permanente variabilidad de los mercados, es m�s estable que las combinaciones param�tricas. Su evoluci�n en periodos largos puede ser una herramienta �til para tanto para analizar el progresivo desgaste de un sistema como su ruptura.

4) RUPTURA DE SISTEMAS

Una cuesti�n muy debatida entre desarrolladores y gestores de portfolios sistem�ticos son los criterios para determinar cu�ndo una estrategia se ha roto. Esta ruptura puede ocurrir de manera abrupta, cuando el sistema incurre en un profundo drawdown, superior al observado en OS y al obtenido en simulaciones de Montecarlo (DDm), o de marera progresiva, lo que se conoce como stagnation. En este segundo caso el sistema se queda estancado en largos per�odos o gana dinero a un ritmo muy inferior al previsto en el modelo.

Los criterios m�s usados son de tipo estad�stico y de tipo estoc�stico. Entre los primeros tenemos el T-Test y la prueba de Chi cuadrado. Con ellos tratamos de confirmar si la serie de operaciones reales pertenece a la misma poblaci�n que la serie OS (o conjunto de estad�sticas representativas del modelo). Los segundos emplean simulaciones de Montecarlo para determinar el DDm, las bandas de m�ximos y m�nimos, el CVaR y el CMO o curva de m�nimo rendimiento.

Teniendo en cuenta lo expuesto en este art�culo otro criterio de ruptura podr�a centrarse en la calidad de la l�gica. Consistir�a en comparar la mediana de las combinaciones param�tricas de la zona robusta del modelo con el per�odo de operativa real. Consideraremos rotas aquellas estrategias en las que la merma del BMO sea superior a un nivel dado; por ej. el 70%.

En la siguiente imagen podemos ver un caso claro de degradaci�n de la l�gica analizado en las siguientes tres regiones:

IS (2001-07) � OS (2008-12) � REAL (2013-16)

Tras realizar en cada regi�n una optimizaci�n del sistema y recoger una muestra aleatoria de 3.000 combinaciones param�tricas, obtenemos la siguiente tabla:

tradingsys

Siendo la distribuci�n el BMO de cada per�odo:

tradingsys

>> Ampliar imagen. .

Como podemos apreciar comparando las regiones IS y OS, el deterioro de la l�gica no es muy grande, por lo que el sistema pasar� el RWF sin dificultad. Sin embargo, entre los periodos OS y Real el deterioro de la l�gica resulta evidente. La distribuci�n (2013-16) muestra un alt�simo porcentaje de combinaciones param�tricas perdedoras y la mediana del BMO desciende hasta 6,30�. Salta a la vista que el sistema est� roto; se ha producido un desacople casi total entre la l�gica y el mercado.

Este enfoque tiene diferencias importantes respecto a los procedimientos m�s habituales de evaluaci�n OS y de detecci�n de ruptura de estrategias:

1.- En un RWF cl�sico, en cada corte solo utilizamos la combinaci�n param�trica de m�ximo rendimiento (seg�n el ratio que sea) para proyectar a futuro. Podr�a ocurrir que, por azar, la mayor�a las combinaciones seleccionadas se encuentren en percentiles altos de la distribuci�n de cada tramo OS. Al final, y aunque hubi�semos seguido con total rigor el procedimiento RWF, tendr�amos un modelo (serie P&L completa del OS) sobreoptimizado.

2.- Para detectar la ruptura de sistemas por alguno de los m�todos mencionados comparamos las series OS y Real. Pero la comparaci�n es de un solo "hilo"; una secuencia de operaciones contra la otra; no nos permite explorar el desgaste de la l�gica en su conjunto. De este modo, no podemos hablar de "ruptura del sistema", sino m�s bien de ruptura de la combinaci�n param�trica seleccionada para "ese sistema".

3.- En general, todos los estad�sticos que utilizamos para medir la consistencia y robustez de las estrategias son de un solo "hilo". Lo que realmente interesa es acreditar la consistencia y robustez en toda la matriz de combinaciones posibles.

Resumiendo, lo que tenemos que acreditar es la consistencia de la l�gica entre marco�pocas y cortes temporales: No nos interesa tanto el rendimiento puntual de los mejores par�metros como el de la matriz de todas las combinaciones posibles. Y esto en cada tramo, en cada �poca y en cada evaluaci�n realizada.

Andr�s A. Garc�a.

� Tradingsys.org, 2016.

Si usted es ciudadano o residente en los EE.UU. debe leer la siguiente advertencia.

IMPORTANT RISK DISCLOSURE

Futures based investments are often complex and can carry the risk of substantial losses. They are intended for sophisticated investors and are not suitable for everyone. The ability to withstand losses and to adhere to a particular trading program in spite of trading losses are material points which can adversely affect investor returns.

Past performance is not necessarily indicative of future results. Data and graph above are intended to be mere examples and are for educational and illustrative purpose only, and do not represent any trading recommendation.

Please read carefully the CFTC required disclaimer regarding hypothetical results below.

HYPOTHETICAL PERFORMANCE RESULTS HAVE MANY INHERENT LIMITATIONS, SOME OF WHICH ARE DESCRIBED BELOW. NO REPRESENTATION IS BEING MADE THAT ANY ACCOUNT WILL OR IS LIKELY TO ACHIEVE PROFITS OR LOSSES SIMILAR TO THOSE SHOWN; IN FACT, THERE ARE FREQUENTLY SHARP DIFFERENCES BETWEEN HYPOTHETICAL PERFORMANCE RESULTS AND THE ACTUAL RESULTS SUBSEQUENTLY ACHIEVED BY ANY PARTICULAR TRADING PROGRAM. ONE OF THE LIMITATIONS OF HYPOTHETICAL PERFORMANCE RESULTS IS THAT THEY ARE GENERALLY PREPARED WITH THE BENEFIT OF HINDSIGHT. IN ADDITION, HYPOTHETICAL TRADING DOES NOT INVOLVE FINANCIAL RISK, AND NO HYPOTHETICAL TRADING RECORD CAN COMPLETELY ACCOUNT FOR THE IMPACT OF FINANCIAL RISK OF ACTUAL TRADING. FOR EXAMPLE, THE ABILITY TO WITHSTAND LOSSES OR TO ADHERE TO A PARTICULAR TRADING PROGRAM IN SPITE OF TRADING LOSSES ARE MATERIAL POINTS WHICH CAN ALSO ADVERSELY AFFECT ACTUAL TRADING RESULTS. THERE ARE NUMEROUS OTHER FACTORS RELATED TO THE MARKETS IN GENERAL OR TO THE IMPLEMENTATION OF ANY SPECIFIC TRADING PROGRAM WHICH CANNOT BE FULLY ACCOUNTED FOR IN THE PREPARATION OF HYPOTHETICAL PERFORMANCE RESULTS AND ALL WHICH CAN ADVERSELY

Modificado por Global - 30 Mar 2017

Sobreoptimizaci�n y ruptura de sistemas.

1) INTRODUCCI�N

2) SOBREOPTIMIZACI�N Y RETORNO ESPERADO

3) RENTABILIDAD DEBIDA A LA L�GICA Y A LOS PAR�METROS

4) RUPTURA DE SISTEMAS

A�adir comentario

Secciones

Entradas recientes

Enlaces