Facebook sabe cuántas personas hay en una foto y qué hacen, aunque no se lo indiques: así usa la IA para reconocer imágenes

Facebook sabe cuántas personas hay en una foto y qué hacen, aunque no se lo indiques: así usa la IA para reconocer imágenes
1 comentario Facebook Twitter Flipboard E-mail

Facebook ha hecho público el funcionamiento de su sistema para reconocer contenido de imágenes a través de inteligencia artificial. Según indica la compañía, el principal propósito de utilizar esta tecnología es permitir a personas con problemas de accesibilidad el escuchar una descripción de lo que hay en la foto, incluso sin que haya texto alternativo escrito por el usuario asociado a la misma.

Explican del mismo modo cómo, desde el año 2016, Facebook cuenta con una tecnología de texto alternativo automático (AAT), capaz de generar descripciones para las fotografías. Junto a la explicación, llega la noticia de que la última versión de este sistema AAT acaba de recibir importantes mejoras de cara al reconocimiento de imágenes.

Un vistazo a…
FACEBOOK guarda un registro de TODAS las WEBS que visitas así puedes DESACTIVARLO

Así sabe Facebook lo que hay una foto, aunque no le demos esos datos

Facebook Ia 2

AAT (Alternative Automatic Text) es una tecnología de Facebook que permite reconocer objetos en una imagen. Se utiliza una red neuronal, según Facebook, entrenada con millones de parámetros y ejemplos. De esta forma, la red neuronal es capaz de saber si hay personas o no en una foto, cuántas hay, los objetos que hay presentes, animales, etc.

ATT es capaz de reconocer prácticamente cualquier escena, e incluso de decirnos a qué distancia está cada persona dentro de la foto

Tal es el sistema de IA que ha implementado Facebook que incluso reconoce los entornos, pudiendo decir si la fotografía está tomada en interior, en exterior, en un monumento concreto, prácticamente cualquier situación puede ser reconocida.

Facebook Ia 3

Facebook ha mejorado esta tecnología, siendo incluso capaz de detectar el tamaño relativo de los objetos. Es decir, ATT es capaz de decirte que hay una imagen con cinco personas, una de ellas en el centro, otras en los laterales y otra detrás, analizando la posición de cada una de ellas respecto a la posición que ocupa en el espacio.

ATT, en su primera fase de desarrollo, era capaz de reconocer 100 conceptos, como 'árbol', 'montaña', 'aire libre' y demás, todos bastante simples. A día de hoy son más de 1200 los conceptos que reconoce la red neuronal, y es que utilizan datos de aplicaciones como Instagram. Facebook reconoce que su modelo se entrena con imágenes públicas tanto de Facebook como de Instagram, utilizando los hashtags de las mismas. Gracias a esta gigantesca base de datos es capaz de reconocer tonos de piel, género, eventos como bodas (por la ropa que llevan los usuarios), tipos de comida, etc.

Pese a que Facebook asegura que esta red neuronal tiene como propósito ayudar a personas con discapacidad visual, no deja de ser llamativa la cantidad de datos que recopila para saber exactamente qué hay en cada fotografía.

Más información | Facebook

Comentarios cerrados
Inicio