Facebook ha utilizado miles de millones de fotos públicas de Instagram para entrenar su algoritmo de inteligencia artificial (IA) y categorizar imágenes por sí mismo. Estas fotos contenían 17,000 hashtags proporcionados por los usuarios de Instagram. Normalmente, entrenar a las computadoras para hacer cosas que los humanos hacen, como identificar lo que hay en una foto, implica proporcionarles una gran cantidad de datos. Sin embargo, estos datos deben ser etiquetados por humanos, lo que lleva tiempo y dinero. Facebook ha desarrollado una nueva técnica que le permite evitar tener que hacer que los empleados se sienten y categoricen cada imagen.
“El factor limitante más importante para avanzar en la visión por computadora, al igual que en muchos campos de la IA, es que dependemos casi por completo de conjuntos de datos etiquetados a mano y curados por humanos”, dijo Mike Schroepfer, director de tecnología de Facebook, en la conferencia de desarrolladores F8 de Facebook en San José, California. “Esto significa que si una persona no ha dedicado tiempo a etiquetar algo específico en una imagen, incluso los sistemas de visión por computadora más avanzados no podrán detectarlo en tiempo de ejecución porque no lo ha visto en el conjunto de datos de entrenamiento”. Schroepfer agregó: “Hemos desarrollado una tecnología innovadora que utiliza imágenes con hashtags disponibles públicamente a una escala sin precedentes. Nos hemos entrenado con 3.5 mil millones de imágenes de entrenamiento utilizando un conjunto de imágenes públicas sin ninguna imagen curada por humanos en ese conjunto de datos”. El conjunto de datos de Instagram es 10 veces más grande que una gran cantidad de fotos que Google utilizó para entrenar algoritmos de imágenes, según Wired.
Srinivas Narayanan, director de ingeniería del grupo de aprendizaje automático aplicado de Facebook, agregó: “Ahora hemos creado el mejor sistema de visión por computadora del mundo. Obtiene la puntuación más alta de todos los tiempos, con un 84.5% de precisión en ImageNet, un conjunto de datos ampliamente utilizado para la evaluación”. Schroepfer dijo que Facebook ya está utilizando el sistema de visión por computadora en su plataforma para detectar “contenido no deseado” que debe ser eliminado. Esto probablemente incluye cosas como desnudos y contenido relacionado con el terrorismo.
Esta nueva técnica de Facebook tiene el potencial de revolucionar la forma en que se entrena a los sistemas de inteligencia artificial. Al eliminar la necesidad de etiquetar manualmente cada imagen, se ahorra tiempo y recursos, lo que permite a Facebook desarrollar algoritmos más avanzados y precisos. Además, el uso de imágenes públicas de Instagram como conjunto de datos de entrenamiento amplía enormemente la cantidad de información disponible para el sistema de visión por computadora.
Si bien esta tecnología tiene aplicaciones prometedoras en la detección de contenido no deseado, también plantea preocupaciones sobre la privacidad y el uso de imágenes sin el consentimiento de los usuarios. Facebook debe asegurarse de que se respeten los derechos de privacidad de los usuarios y de que las imágenes se utilicen de manera ética y responsable.
En resumen, Facebook ha utilizado miles de millones de fotos de Instagram para entrenar su inteligencia artificial y desarrollar un sistema de visión por computadora líder en el mundo. Esta nueva técnica tiene el potencial de revolucionar la forma en que se entrena a los sistemas de IA y abre nuevas posibilidades en la detección de contenido no deseado. Sin embargo, también plantea preocupaciones sobre la privacidad y el uso ético de las imágenes.