Investigadores de la Universidad de Oxford desarrollan Deep Double Dueling Q-Studying para traducir señales comerciales en estrategias comerciales SOTA


Un método estándar utilizado por las técnicas comerciales cuantitativas efectivas es la generación de señales comerciales con una asociación estadísticamente significativa con los precios futuros. Las acciones resultantes de estas señales están destinadas a tomar posiciones para beneficiarse de las posibles fluctuaciones de precios. Cuanto más essential sea el rendimiento, mayor será la frecuencia de la señal y la rotación de la estrategia.

Una orden de límite es la compra o venta de un valor a un precio fijo o superior. Los libros de órdenes limitadas son mecanismos de mercado financiero bastante populares y son ampliamente utilizados por los intercambios en todo el mundo. El experto en seguridad realiza un seguimiento de las órdenes de límite colocadas para valores en su base de datos. El especialista que administra el libro de órdenes limitadas se asegura de que la orden de máxima prioridad se ejecute antes que otras órdenes en el libro y antes que otras órdenes mantenidas o presentadas por otros comerciantes a un precio igual o peor. La introducción de la IA ha tenido un impacto significativo en el sistema comercial. Aunque los estudios han demostrado que los precios LOB se pueden predecir en períodos cortos, aún es un desafío desarrollar una estrategia comercial excellent lo suficientemente rápido como para convertir esta previsibilidad en ganancias comerciales.

El equipo de investigación de la Universidad de Oxford propuso Deep Dueling Double Q-Studying con la arquitectura APEX (reproducción de experiencia priorizada asíncrona) en su nuevo artículo Q-LEARNING DE DOBLE DUELO PROFUNDO ASINCRÓNICO PARA LA EJECUCIÓN DE SEÑALES DE TRADING EN MERCADOS DE LIBRO DE ÓRDENES LÍMITE. Este enfoque traduce las señales predictivas en estrategias óptimas de negociación de órdenes limitadas mediante el aprendizaje de refuerzo profundo. El aprendizaje por refuerzo se ha utilizado para aprender una variedad de tareas en contextos de mercado de libros de órdenes limitadas, incluidas las operaciones, la optimización de carteras, la creación de mercados y la ejecución óptima de operaciones.

El equipo permite la colocación de órdenes limitadas a varios precios en un entorno comercial LOB mediante el establecimiento de un espacio único de acción y estado. El agente de RL también aprende a emplear órdenes limitadas de unidades individuales de existencias para administrar su inventario, ya que mantiene una variedad de posiciones largas o cortas a lo largo del tiempo, además del momento y la colocación de nivel de las órdenes limitadas.

De manera más common, muestra una aplicación actual de RL para crear estrategias comerciales de orden límite, que todavía se crean típicamente a mano como parte de un sistema comercial.

Como resultado de la importante rotación de la cartera, los costos de transacción pueden tener una influencia sustancial e inaceptable en las ganancias, lo que dificulta la integración de pronósticos de alta frecuencia en estrategias negociables y lucrativas. Los investigadores proponen que RL puede ser una herramienta valiosa para llevar a cabo esta función de traducción y aprender las mejores soluciones para una combinación specific de señal y mercado. La necesidad de ajustar manualmente las técnicas de ejecución para varios mercados y señales se elimina con este tipo de personalización de la estrategia, que se ha descubierto que mejora significativamente el rendimiento. Se puede crear un solo espacio de observación para usos prácticos combinando varias señales distintas. Como resultado, el problema de RL podría fusionarse inmediatamente con la dificultad de incorporar varios pronósticos en una estrategia comercial cohesiva.


Revisar la Papel. Todo el crédito de esta investigación es para los investigadores de este proyecto. Además, no olvides unirte nuestro 13k+ ML SubReddit, Canal de discordia, y Boletín electrónicodonde compartimos las últimas noticias de investigación de IA, interesantes proyectos de IA y más.


Niharika es pasante de consultoría técnica en Marktechpost. Ella es una estudiante de tercer año, actualmente cursando su B.Tech del Instituto Indio de Tecnología (IIT), Kharagpur. Es una persona muy entusiasta con un gran interés en el aprendizaje automático, la ciencia de datos y la inteligencia synthetic y una ávida lectora de los últimos desarrollos en estos campos.


Related Articles

Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Same Category

spot_img

Stay in touch!

Follow our Instagram