En caso de que no lo supieras, hay un pequeño evento llamado Copa Mundial eso está pasando ahora mismo. Esta Copa del Mundo ha sido notable por un par de razones. El primero es el momento—esta vez no hay barbacoas para ver fiestas de verano, sino que la FIFA está rompiendo con la tradición y organizando el torneo en los meses de invierno del hemisferio norte para ahorrarles a los jugadores la experiencia de jugar al fútbol (Cloudera tiene su sede en los EE. UU., por lo que es “fútbol”) en temperaturas superiores a 41,5 °C (Cloudera tiene su sede en EE. UU., pero también reconocemos la superioridad del sistema métrico).
El segundo hecho notable sobre la Copa del Mundo de 2022 es que esta es solo la segunda Copa del Mundo que se lleva a cabo íntegramente en Asia, siendo la primera el torneo de 2002 que se llevó a cabo en Corea del Sur y Japón. Sin embargo, ¡es la primera Copa del Mundo que se lleva a cabo en la región del Medio Oriente del mundo!
El tercer hecho, y el más interesante sobre la Copa del Mundo de 2022, son las formas nuevas e innovadoras en que se utilizan la tecnología y los datos para mejorar el deporte rey, tanto dentro como fuera de la cancha. Para las innovaciones fuera de la cancha, Qatar ha implementado soluciones como un estado del arte sistema de refrigeracióne incluso cámaras y algoritmos de visión synthetic diseñados para evitar estampidas. Para los fanáticos, no es necesario buscar muy lejos para encontrar formas nuevas y emocionantes en las que la tecnología mejora su experiencia.
Sin embargo, la innovación de datos que más me entusiasmó aprender es la implementación de una solución de aprendizaje automático (ML) human-in-the-loop (HITL) para ayudar a los árbitros a marcar fuera de juego con mayor precisión. Oficialmente, FIFA se refiere a esta solución ML como Tecnología de fuera de juego semiautomática (SAOT). Human-in-the-loop ML no es una tecnología nueva o novedosa, pero su uso en el escenario más grande del fútbol es un paso importante para ML como mecanismo para mejorar la calidad del arbitraje en eventos deportivos profesionales.
¿Qué es el aprendizaje automático humano en el ciclo?
El aprendizaje automático es una subcategoría de la inteligencia synthetic en la que los sistemas informáticos aprenden a realizar tareas en función de los datos en lugar de programarse explícitamente para hacerlo. HITL ML agrega un paso adicional que requiere un ser humano (preferiblemente un experto en la materia) para verificar las tareas que realiza el sistema informático.
HITL ML esencialmente combina la fuerza tanto de ML como de humanos. ML tiene la ventaja única de poder escalar a través de múltiples sistemas y procesar datos exponencialmente más rápido que el cerebro humano, lo que le permite manejar muchas más tareas de las que un humano podría jamás. Sin embargo, ML no siempre es perfecto, por lo que al incluir humanos que son expertos en la materia en la capacitación del sistema y las tareas que se realizan, puede minimizar la probabilidad de que ML realice tareas incorrectamente.
Los humanos pueden participar en el entrenamiento del sistema al proporcionarle los datos de los que aprende o, en el caso de SATO, los humanos pueden usarse para verificar que la tarea realizada se realizó con tanta precisión.
Una solución de aprendizaje automático de clase mundial
El modelo ML implementado como parte de SAOT está entrenado para clasificar una jugada como fuera de juego o no. Utiliza dos fuentes principales de datos como entradas: la primera es el nuevo balón habilitado para IoT de Adidas, el Al Rihla Professional. Esta pelota revolucionaria contiene un sensor en su inside que detecta la inercia de la pelota; esos datos se capturan y se notifican unas 500 veces por segundo. Los datos de la pelota proporcionan una medida precisa de la dirección en la que se pateó una pelota, en el momento en que se pateó (bueno, dentro de 1/500 de segundo).
La segunda pieza de tecnología utilizada como entrada para el modelo ML proviene de 12 cámaras montadas justo debajo del techo del estadio. Estas cámaras capturan 29 puntos de datos de cada uno de los 22 jugadores en el campo, a una velocidad de 50 veces por segundo.
Eso significa que 17.400 puntos de datos posicionales de los jugadores en el campo se utilizan como entradas en el modelo de SAOT cada segundo.
Con estas dos fuentes de datos, los datos de inercia del balón y los datos de posición del jugador de las cámaras, el modelo SAOT ML puede proporcionar una clasificación de si cada jugada está fuera de juego o dentro de juego. Ahora aquí es donde entra en juego el aspecto HITL de la solución. La predicción de fuera de juego no va directamente al árbitro en el campo, sino que se envía a los VMO (oficiales del partido por video) que luego validan la predicción de fuera de juego. El modelo proporciona el punto de patada del pase que resultó en una jugada de fuera de juego, así como una línea de fuera de juego generada con los 29 puntos de los jugadores ofensivos y defensivos en el momento del pase. Si los VMO están de acuerdo en que la jugada fue fuera de juego, informan al árbitro en el campo.
Otras aplicaciones para el aprendizaje automático humano en el circuito
Una extensión pure de esta tecnología estaría en otros deportes. Imagínese si se usara un sistema automatizado para informar a los árbitros de la NFL si un jugador salió o no de los límites, o si la pelota cruzó la línea de gol en el caos de un QB furtivo desde la línea de una yarda. En la NBA, HITL ML podría usarse para clasificar definitivamente una jugada como un bloqueo o una carga (la ruina de la experiencia de cualquier fanático de la NBA).
Lo bueno de HITL ML es la velocidad a la que ocurre. No habría más revisión de cinco minutos del mismo ángulo de cámara en el que todos discrepamos si hay cancha/césped entre el pie de un jugador y una línea. En cambio, la predicción está disponible al instante. Además, debido a que todavía se utilizan funcionarios capacitados para verificar, se detectan predicciones inexactas (y no hay posibilidad de que Sky Web se lively y los robots se apoderen del mundo).
En los negocios, las metodologías HITL se pueden usar para minimizar el tiempo de inactividad debido a una precisión incorrecta de una falla en una aplicación de mantenimiento predictivo y dar confianza a las partes interesadas del negocio de que se puede confiar en el resultado de los modelos ML.
Se necesita más que el aprendizaje automático para resolver estos problemas
Tenga en cuenta que la solución de tecnología fuera de juego semiautomatizada no period solo un modelo de ML ubicado en la nube. Requería que los datos se transmitieran, transformaran, cargaran, analizaran e informaran, todo en cuestión de segundos. Una solución para algo así requiere servicios de datos para cada paso de este proceso, y estos servicios de datos tienen que funcionar juntos sin problemas, tanto en las instalaciones (la pelota y las cámaras) como en la nube (entrenamiento de modelos, predicciones y aplicaciones net de informes) .
Esta es la razón por la que Cloudera ha creado la plataforma de datos híbrida (Cloudera Information Platform) con servicios de datos integrados para cada paso del ciclo de vida de los datos de un extremo a otro, porque cualquiera que haya creado soluciones de ML sabe que se necesita algo más que un punto de ML. solución en la nube para ofrecer una solución lista para el negocio.
Si desea obtener más información sobre cómo Cloudera Information Platform es la solución híbrida que ha estado buscando, visite aquí aprender más.