La importancia del data annotation en el trabajo de computer vision

Computer vision se define como el uso de computadoras para realizar automáticamente las tareas que pueden realizar el sistema visual humano. Se refiere al proceso a través del cual una computadora puede reconocer e interpretar imágenes usando algoritmos de inteligencia artificial (IA), y luego construir un resultado aceptable del análisis que la computadora “comprende”. 

Computer vision

Como forma de inteligencia artificial puede clasificar, identificar, verificar y detectar objetos, es decir que esta tecnología habilita a las máquinas a interpretar visualmente el mundo que las rodea. Por lo general, estos datos visuales se encuentran en forma de fotos o videos, pero también pueden incluir datos de cámaras térmicas e infrarrojas.

Para concretar esta tarea las computadoras usan cámaras digitales, desarrollan procesos de conversión de analógico a digital (ADC) y procesamiento de señales digitales (DSP). Y emplean un algoritmo (machine learning algorithm) al que hay que entrenar hasta que pueda interpretar bien las imágenes. 

Casos de uso

La visión por computadora ya se utiliza para contar autos y reconocer zonas de alto tránsito, o para chequear que los empleados fabriles usen tapabocas, por ejemplo. Varias de las principales aplicaciones se dan en el terreno de la manufactura, la extracción de recursos y construcción. En estos campos computer vision es útil para automatizar tareas como detección de defectos, control de calidad, mantenimiento predictivo y medición remota, entre otros. 

En el sector de la salud, ayuda al diagnóstico y a la medición remota. Y en el retail y la seguridad permite el seguimiento de los actores humanos y su comportamiento en tiempo real para entender el comportamiento de compra o detectar la actividad ilegal. Gracias a la visión por computadora, Amazon pudo eliminar por completo el proceso de pago físico en sus tiendas Amazon Go: una vez que el cliente es escaneado en la entrada del local, puede deambular, recoger los artículos que desea y luego retirarse sin tener que hacer cola y pagar; las cámaras rastrean lo que el cliente selecciona y luego el costo de los artículos se carga automáticamente a su cuenta. Por otra parte, esta tecnología -específicamente el reconocimiento facial-  también se puede utilizar para identificar a clientes individuales con el fin de brindarles recomendaciones y recompensas personalizadas.

La visión por computadora se utiliza comúnmente  para acelerar el análisis en tiempo real de imágenes de satélite y evaluar qué regiones se ven afectadas por desastres naturales o actividad humana, efectuar un seguimiento de la vida silvestre, monitorear cultivos o ganado, por mencionar algunos casos. En la agricultura tiene una variedad de usos, incluida la detección de malezas, enfermedades y plagas, análisis de la tierra, detección de fugas de agua, seguimiento de animales y categorización de productos cuando se recogen. 

Computer vision también se utiliza para analizar componentes electrónicos, identificación de firma, reconocimiento óptico de caracteres (optical character recognition), de objetos y de patrones, inspección de materiales, entre tantos otros usos.

Data annotation 

Para entrenar el algoritmo que permita reconocer mejor las imágenes se utilizan técnicas de aprendizaje automático. El entrenamiento constante aumenta enormemente la tasa de predicción del modelo de machine learning. Los algoritmos utilizan los datos de entrenamiento para formar relaciones, ganar comprensión, emitir juicios y evaluar su confiabilidad. 

Cabe destacar, no obstante, que existe un vínculo innegable entre los datos debidamente anotados y el éxito de un proyecto de inteligencia artificial (IA): un estudio encontró que la preparación, limpieza y etiquetado de datos toma hasta el 80% del tiempo de desarrollo de un proyecto de este tipo. La importancia de la anotación de datos se debe al hecho de que la más mínima inexactitud podría tener graves consecuencias. Los modelos de autoaprendizaje requieren una gran cantidad de datos anotados para entrenar antes de comenzar a funcionar. 

Al hablar de computer vision, la anotación de imágenes (image annotation) es crucial. Mediante este proceso se asignan etiquetas de tareas específicas a las fotografías. Para obtener los mejores resultados se deben anotar fotografías para preparar datos de entrenamiento altamente precisos. Pero esta tarea no la puede hacer cualquiera: se requiere experiencia y comprensión contextual, además de dominio de metodologías y herramientas concretas.  En síntesis, los recursos humanos son componentes críticos del proceso de data annotation, particularmente cuando se realizan tareas específicas de etiquetado. 

Cuando se trata de image annotation, el instinto puede ser automatizar. Sin embargo el aprendizaje automático no supervisado aún no es adecuado para la anotación automática de imágenes porque las máquinas tienen dificultades para asignar e identificar los objetos en ellas. En este caso, la anotación manual de imágenes impulsada por humanos es más eficaz, y, por otro lado, ofrece una opción escalable con tiempos de respuesta rápidos. De lo que se trata, en definitiva, es de encontrar el equilibrio entre la automatización y la intervención humana que mejor se adapte a las necesidades del proyecto específico.

Según el caso también habrá que decidir si conviene un equipo interno o subcontratar la anotación y el etiquetado de datos.  En líneas generales, lo más beneficioso es confiar en una organización que se especialice en este tema por varios motivos, entre ellos, que es ideal para grandes volúmenes de datos involucrados en proyectos a corto plazo. Además,  si este trabajo lo realiza un ingeniero, puede resultar costoso, ya que esta labor implica numerosas horas de trabajo.

En Arbusta nos proponemos como socios de las organizaciones en estos procesos de data annotation y de entrenamiento de algoritmos, para ayudarles a beneficiarse con las ventajas que aporta la visión por computadoras y otras disciplinas derivadas de la IA.  Brindamos servicios IT ágiles y competitivos para los procesos de transformación digital de las empresas que requieren soluciones híbridas humano-máquina. Nos enfocamos en los procesos que requieren de intervención humana, es decir, de la incorporación de inputs a lo largo del ciclo de aprendizaje automático de un algoritmo, para acelerar su desarrollo y mejorarlo, así como también servicios de recolección de datos (Data set collection) y entrenamiento (Data Annotation) de modelos de IA. 

MÁS ACERCA DE ARBUSTA

> Conoce Arbusta<

> Nuestra magia <