El paradigma de HITL, de la A a la Z

HITL - Arbusta

Hace unas semanas contamos la revolución  que están teniendo la implementación de soluciones de Inteligencia Artificial de forma acelerada por la transformación digital -como único camino- para sostener los negocios en tiempos de Covid-19 y acelerar la recuperación de las economías post-pandemia, según datos precisos de IDC.

Expusimos el concepto de HITL (Human in the loop), como uno de los paradigmas que  supone incorporar la retroalimentación humana durante la instancia de entrenamiento (modelado y simulación) de los algoritmos de machine learning. 

AHORA BIEN, ¿CUÁLES SON LOS PROPÓSITOS DE HITL?

Este enfoque viene ganando terreno como el mejor camino posible para entrenar modelos más precisos, en la medida en que las personas prueban, ajustan y alimentan continuamente los datos, en vivo y de modo constructivo y virtual. 

Dado que los sistemas accionados por máquinas todavía no logran los niveles de precisión deseada, se requiere la intervención humana en los circuitos de entrenamiento a fin de crear modelos de aprendizaje automático más exactos. Es decir que HITL describe el proceso que se lleva adelante en los casos en que la máquina o el sistema informático no pueden ofrecer una respuesta a un problema y necesitan una intervención humana.

REDUCIR COSTOS Y NUEVOS DESARROLLOS

Los modelos de aprendizaje automático resultan esenciales para toda empresa que pretenda desplegar un negocio innovador, en la medida que permiten automatizar distintos aspectos rutinarios de los procesos y circuitos. Pero la realidad es que todavía son caros de construir, entrenar, validar y curar, ya que para gestionar el proceso se requieren científicos de datos, cuyos salarios no cuentan precisamente entre los más baratos. Esto se complica aún más cuando los datos no están estructurados (cosa que en realidad ocurre en el 90% de los casos). Por eso es tan importante optimizar estos procesos, y por ello desde Arbusta nos ocupamos de desarrollar servicios tecnológicos con eje en este paradigma, y también buscamos  informar todo sobre HITL para empresas.

TALENTO IT

HITL es un paradigma que involucra al talento IT en la medida en que combina el machine learning supervisado (que trabaja con conjuntos de datos etiquetados o seleccionados para entrenar algoritmos mediante el ajuste de parámetros) con el aprendizaje activo (que retroalimenta datos en un clasificador). Lo que se busca con este paradigma HITL es corregir las imprecisiones en las predicciones de la máquina; y para ello se requiere la intervención humana. 

CASO DE USO

Muchos científicos de datos utilizan el enfoque conocido bajo la ecuación “80/19/1”, que establece que el 80% del tiempo el algoritmo debe dejarse solo para aprender, mientras que los humanos deben intervenir en el 19% de las veces y el 1% restante se ha de dejar librado al azar. Con el enfoque √HITL, en tanto, las personas intervienen cuando la máquina no está segura de cuál es la respuesta. En esos casos se recurre al criterio humano, que luego se suma al modelo como retroalimentación para optimizarlo. Ahora bien, en lo concreto, ¿cuándo se recurre a la perspectiva humana?:

  • Cuando los algoritmos no entienden la información de entrada, o no saben cómo realizar la tarea. 
  • Cuando el costo de los errores es demasiado alto (en industrias como la de seguros o el sector de la salud, por ejemplo). 
  • Cuando lo que está buscando es bastante inusual o raro. 
  • Cuando todavía hay pocos datos disponibles sobre un tema o negocio. 
  • Cuando la data de entrada se interpreta incorrectamente. 

EN BUSCA DE PRECISIÓN

Como consecuencia de estas intervenciones, el enfoque HITL permite acortar los tiempos de entrenamiento y obtener resultados más precisos. ¿En qué casos concretos? Cuando se trabaja con chatbots en instancias de atención de primer nivel, por ejemplo. En tales circunstancias a veces los clientes describen demasiados detalles, y hace falta la intervención humana. Lograr avances en este punto es clave, particularmente cuando se avizora que el 25% de las operaciones de servicio al cliente y soporte integrarán la tecnología de asistente virtual o chatbot para 2020, en comparación con menos del 2% en 2017.

También se aplica el paradigma HITL al entrenar vehículos autónomos: en este terreno hoy los algoritmos logran respuestas acertadas de conducción en el 90% de los casos, cifra que por cierto es elevada pero no suficiente, dado que hay vidas humanas en juego. Entre otros casos HITL también puede usarse por ejemplo para optimizar los algoritmos de las cámaras de seguridad que reaccionan a un sensor de movimiento (para disminuir la frecuencia de falsas alarmas); o en aplicaciones de mensajería de texto que transcriben voz a texto con alta precisión (para resolver problemas relacionados con una jerga en particular). 

En el caso de los chats y asistentes virtuales el talento IT de Arbusta se enfoca en entrenar las respuestas naturales a ciertos diálogos, entidades e intenciones. También le asignamos metadatos a las imágenes o al video digital, mediante palabras claves o subtítulos. Y además facilitamos el entrenamiento y ajuste en contextos de reconocimiento de texto.

El paradigma HITL está llamado a hacer que las aplicaciones de aprendizaje automático sean más baratas y accesibles. Y en tal sentido, el talento IT de consultoras como Arbusta  tiene mucho valor para agregar. 

MÁS INFORMACIÓN

¿Sabes qué es Arbusta? <

¿Conoces nuestra magia? <