Un científico de datos explica: ¿Cuándo funciona bien el aprendizaje automático en los mercados financieros?


Como científico de datos, una de las mejores cosas de trabajar con clientes de DataRobot es la gran variedad de preguntas muy interesantes que surgen. Recientemente, un posible cliente me preguntó cómo compaginaba el hecho de que robotic de datos tiene varios bancos de inversión muy exitosos que usan DataRobot para mejorar las pérdidas y ganancias de sus negocios comerciales con mis comentarios de que los modelos de aprendizaje automático no siempre son buenos para predecir los precios de los activos financieros. Mire nuestra conversación para saber cuándo el aprendizaje automático funciona bien y cuándo no en los casos de uso de los mercados financieros.

¿Por qué el aprendizaje automático puede funcionar bien en aplicaciones comerciales de alta frecuencia, pero es tan malo para predecir precios de activos a largo plazo?

Si bien ha habido algunos éxitos en la industria que utilizan el aprendizaje automático para la predicción de precios, han sido pocos y distantes entre sí. Como regla common, cuanto más corto sea el horizonte temporal de predicción, mayores serán las probabilidades de éxito.

Aplicaciones de ML en el comercio

En términos generales, los casos de uso de creación de mercado en los que DataRobot (y otros enfoques de aprendizaje automático) sobresalen comparten una o más de las siguientes características:

  • Para la predicción de precios a futuro: un horizonte de predicción muy corto (generalmente dentro de los siguientes 10 segundos), la disponibilidad de buenos datos de la cartera de pedidos y el reconocimiento de que incluso un modelo que tiene una precisión del 55 % al 60 % es útil; en última instancia, es un juego de porcentajes.
  • Para el descubrimiento de precios (p. ej., establecer un precio adecuado para valores sin liquidez, predecir dónde se ubicará la liquidez y determinar los índices de cobertura apropiados), así como de manera más common: la existencia de buenos datos comerciales históricos sobre los activos a cotizar (por ejemplo, TRACE, informes del mercado de bonos asiáticos, historial comercial de ECN), así como un conjunto claro de activos más líquidos que pueden usarse como predictores (por ejemplo, créditos más líquidos , futuros de bonos, mercados de swaps, and so on.).
  • Para la predicción del comportamiento de la contraparte: algún tipo de datos estructurados que contienen no solo transacciones ganadas sino también solicitudes/respuestas fallidas.
  • En todas las aplicaciones: una ventaja de información, por ejemplo, al controlar una gran parte del flujo en esa clase de activos, o al tener datos de comportamiento del cliente que se pueden usar.

Las áreas en las que cualquier forma de aprendizaje automático tendrá dificultades se caracterizan típicamente por uno o más de estos aspectos:

  • Regímenes, comportamientos e impulsores que cambian rápidamente: una razón clave por la cual las predicciones a largo plazo son tan difíciles. Muy a menudo encontramos que los controladores clave del modelo cambian muy regularmente en la mayoría de mercados financieros, con una variable que es un indicador útil para una semana o mes que tiene poco contenido de información en la siguiente. Incluso en aplicaciones exitosas, los modelos se vuelven a entrenar y se vuelven a implementar con mucha regularidad (normalmente al menos semanalmente).
  • Datos poco frecuentes: un ejemplo clásico aquí son los datos mensuales o menos frecuentes. En tales casos, el comportamiento que se modela generalmente cambia con tanta frecuencia que cuando se acumulan suficientes datos de capacitación para el aprendizaje automático (24 meses o más), el mercado se encuentra en un régimen diferente. Por si sirve de algo, algunos de nuestros clientes han tenido cierto éxito, por ejemplo, en la selección de acciones utilizando predicciones en un horizonte de un mes, pero (comprensiblemente) no nos dicen cómo lo están haciendo.
  • Datos escasos: donde no hay suficientes datos disponibles para obtener una buena imagen del mercado en conjunto, como ciertos mercados OTC donde no hay buenas ECN.
  • Una ausencia de predictores: en common, los datos sobre el comportamiento pasado de la variable que se predice (por ejemplo, los precios) no son suficientes. También necesita datos que describan los impulsores de esa variable (p. ej., libros de pedidos, flujos, expectativas, posicionamiento). El desempeño pasado no es indicativo de resultados futuros… .
  • Historial limitado de regímenes similares: Debido a que los modelos de aprendizaje automático tienen que ver con el reconocimiento de patrones en datos históricos, los nuevos mercados o activos pueden ser muy difíciles para los modelos de ML. Esto se conoce en la academia como el “problema del arranque en frío”. Hay varias estrategias para hacerle frente, pero ninguna de ellas es perfecta.
  • No siendo en realidad un problema de aprendizaje automático: El modelo de valor en riesgo es el ejemplo clásico aquí: el VaR no es una predicción de nada, es una suma estadística de los resultados de la simulación. Dicho esto, predecir el resultado de una simulación es un problema de ML, y hay algunas buenas aplicaciones de ML en la fijación de precios de derivados complejos y dependientes de la ruta.

Finalmente, y aparte de lo anterior, un issue crítico de éxito en cualquier caso de uso de aprendizaje automático que no debe subestimarse es la participación de personas capaces y motivadas (por lo common, analistas cuantitativos y, a veces, científicos de datos) que entienden los datos (y cómo manipularlos), los procesos comerciales y las palancas de valor. El éxito suele ser impulsado por esas personas que llevan a cabo muchos experimentos iterativos sobre el problema en cuestión, que es en última instancia donde nuestro plataforma entra. Como se discutió, aceleramos masivamente ese proceso de experimentación. Hay muchas cosas que se pueden automatizar en el aprendizaje automático, pero el conocimiento del dominio no puede serlo.

Para resumir: es justo decir que la probabilidad de éxito en los casos de uso comercial está positivamente correlacionada con la frecuencia de la negociación (o al menos negativamente con el período/horizonte de tenencia) con algunas excepciones para probar la regla. También vale la pena tener en cuenta que el aprendizaje automático suele ser mejor en casos de uso de segundo orden, como predecir los impulsores de los mercados, por ejemplo, eventos de riesgo y, hasta cierto punto, volúmenes, en lugar de predicciones de precios de primer orden, sujeto a la advertencias anteriores.

Sobre el Autor

pedro simon
pedro simon

Director Common, Ciencia de Datos de Mercados Financieros

Peter dirige la práctica de ciencia de datos de mercados financieros de DataRobot y trabaja en estrecha colaboración con clientes de fintech, banca y gestión de activos en numerosos casos de uso de alto retorno de la inversión para DataRobot AI Platform. Antes de unirse a DataRobot, obtuvo veinticinco años de experiencia en funciones sénior de investigación cuantitativa, gestión de carteras, comercio, gestión de riesgos y ciencia de datos en bancos de inversión y gestores de activos, incluidos Morgan Stanley, Warburg Pincus, Goldman Sachs, Credit score Suisse, Lansdowne Companions. e Invesco, además de pasar varios años como socio en un fondo de cobertura de acciones globales de nueva creación. Peter tiene un M.Sc. en Information Science de Metropolis, College of London, un MBA de Cranfield College Faculty of Administration y un B.Sc. en Contabilidad y Análisis Financiero de la Universidad de Warwick. Su artículo, “Looking Excessive and Low: Visualizing Shifting Correlations in Monetary Markets”, se publicó en la edición de julio de 2018 de Laptop Graphics Discussion board.


Conoce a Pedro Simón

Related Articles

3 pasos para mejorar los selectores de cantidad en tu tema de Shopify

Hay algunas opciones cuando se trata de selectores de...

Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Same Category

Registros escolares y derechos de los estudiantes

Los estudiantes de las escuelas públicas no pierden...
spot_img

Stay in touch!

Follow our Instagram