Qué es la Anotación de Datos (Data Annotation)

11/09/2020

machine-learning-tarragona-200909
Si estás pensando en hacer una aplicación con objetos gráficos como fotografías o vídeo y necesitas construir tu conjunto de datos, esto es lo que necesitas: Anotación de Datos.

Quizás uno de los campos en los que más se nota el uso de Machine Learning es en aplicaciones gráficas, desde la mejora automática de fotografías, el filtro de "belleza", hasta la transformación de vídeos del siglo XIX a formato Full HD.

Si te encuentras en el desarrollo de una aplicación de este tipo necesitarás contar con datos etiquetados o categorizados, esto es que los datos posean una descripción relacionada con los mismos.

Por ejemplo, si deseas realizar un sistema que identifique si una foto corresponde a un perro o a un gato, necesitas entrenar al sistema con los datos adecuados. Esto lo puedes lograr poniendo, por ejemplo, el tipo de animal en el nombre del archivo. Así "perro-123.png" y "gato-124.png" corresponden a la foto de un perro y de un gato respectivamente, para que el sistema luego lo extraiga y lo utilice como etiqueta de entrenamiento.

Para ello deberás modificar el nombre de cada archivo para reflejar su contenido. De cada archivo. De cientos de archivos. Y no cometer ningún error en el proceso.
 

Anotación de Datos: Definición

La anotación de datos es la técnica de etiquetar los datos. Esta técnica se utiliza en diferentes formatos como imágenes y vídeos, y también en textos, utilizando otras herramientas y técnicas.

Etiquetar los datos no sólo hace que los datos tengan una categoría de referencia sino también que los objetos sean reconocibles por las librerías de visión por ordenador (Computer Vision), como por ejemplo OpenCV.

El tipo a utilizar dependerá del objeto y del tipo de modelo a utilizar. Por ejemplo, en el caso anterior se ha definido la categoría en el nombre del archivo, suponiendo que en cada uno hay un sólo objeto (perro o gato). Pero este método es poco válido cuando en el archivo hay más de un objeto, como por ejemplo un perro y una pelota. Es decir que necesitarás otro tipo de anotación de datos.
 

Tipos de Anotaciones de Datos

Cuadros delimitadores (Bounding boxes)

Uno de los tipos más comunes de anotación de datos son los cuadros delimitadores. Esto es representado por un rectángulo que se utiliza para identificar la ubicación del objeto. Se utilizan las coordenadas de los ejes X e Y en las esquinas superior izquierda e inferior derecha del rectángulo. El propósito principal de este tipo de anotación de datos es detectar los objetos y sus ubicaciones.
 

Líneas y splines

Las splines son líneas curvas con unos controles simples que permiten definir su geometría, mientras que las líneas son simples líneas rectas. Es muy utilizado para definir zonas y detectar carriles de calles y carreteras, por lo que es muy utilizado en algoritmos de aprendizaje para vehículos autónomos.
 

Segmentación semántica

Este tipo de anotación juega un rol muy importante en imágenes donde el contexto de la misma y la relación de los objetos entre ellos es un factor crucial. Es una forma de anotación que asigna cada píxel de la imagen a una clase (automóvil, camión, carretera, parque, peatón, etc.), y así cada píxel tiene un sentido semántico.
 

Cuboides 3D

Los cuboides 3D tienen una gran semejanza con los cuadros delimitadores, pero proporciona información adicional sobre la profundidad del objeto. Usando cuboides 3D, se puede entrenar un algoritmo de Machine Learning para proporcionar una representación 3D de la imagen. La imagen puede ayudar aún más a distinguir las características vitales, como el volumen y la posición, de un objeto en un entorno 3D.
 

Segmentación poligonal

La segmentación poligonal se utiliza para identificar polígonos complejos para determinar la forma y ubicación del objeto con la máxima precisión. Es una evolución de los cuadros delimitadores, donde se ajusta la identificación de forma muy precisa al objeto.
 

Puntos de referencia (Landmark)

Esta técnica se basa en crear puntos en la imagen para identificar el objeto y su forma. Se pueden emplear desde algunos puntos para identificar un objeto pequeño hasta múltiples puntos para marcar el contorno de algunos detalles. Es común su uso en mapas y objetos, pero juega un papel clave en el reconocimiento facial, identificando partes del cuerpo, posturas y expresiones faciales.


Este es un campo muy importante para la preparación de los datos, ya que del tipo de técnica que elijas y de la calidad de los datos procesados, dependerá en gran medida el funcionamiento de tu modelo.

   

Artículos relacionados

0 comentarios