Si no te has dado cuenta, este es un año de elecciones presidenciales. Puedo recordar muchos años anteriores de elecciones en los que me he quejado de las distorsiones escandalosas de los hechos, pero este año ha sido especialmente difícil de soportar. La verdad es que las estadísticas recopiladas por fuentes confiables y objetivas a menudo desmienten esas distorsiones, y casi todas esas fuentes y números se pueden encontrar en Internet. Pero ¿adivina qué? Esa información no siempre es tan fácil de descubrir como podrías pensar. Gran parte de ella está enterrada en archivos PDF y archivos delimitados por comas. Ni los votantes ni, lamentablemente, muchas organizaciones de noticias tienen el tiempo o la inclinación para buscar esa información. Durante años he visto varios intentos de recopilar datos públicos relevantes para los temas clave del día y ponerlos a disposición en Internet en forma gráfica e interactiva. El último esfuerzo, que se lanza hoy, parece prometedor: Data USA es una plataforma gratuita y abierta creada en colaboración por Deloitte, MIT Media Lab y Datawheel, una empresa derivada de Media Lab.
Data USA es una impresionante obra de arte. Elije una ubicación, industria u ocupación en Estados Unidos, y obtendrás docenas de gráficos interactivos en los que puedes profundizar para obtener más detalles. Se ofrecen ocho tipos de visualizaciones, incluyendo mapas interactivos de los Estados Unidos que muestran datos del censo y treemaps que muestran proporciones relativas de un vistazo. Para analistas de negocios, responsables de políticas o estudiantes, esto tiene un valor obvio, pero las visualizaciones están tan bien ejecutadas que cualquiera puede divertirse con ellas. Según Matt Gentile, principal en Deloitte y líder de análisis del gobierno federal, el objetivo de Data USA es “contar una historia” utilizando múltiples conjuntos de datos relacionados. Gran parte del esfuerzo, dijo, se centró en obtener expertos en el tema y científicos de datos para proporcionar marcos contextuales para diversas áreas temáticas. En su lanzamiento, Data USA se centra en empleos, habilidades, educación y salud, y gran parte de los datos subyacentes se recopilan del Buró del Censo, el Departamento de Trabajo, el Departamento de Comercio y el Departamento de Educación.
Data USA cuenta con varias innovaciones, incluyendo una extensión de la biblioteca de visualización de datos JavaScript de código abierto D3 llamada D3plus, desarrollada y mantenida por los cofundadores de Datawheel, César Hidalgo, Alex Simoes y Dave Landry. Además, Data USA genera automáticamente descripciones textuales junto a las visualizaciones, proporcionando contexto y beneficios de SEO sin esfuerzo manual. Todos los datos en Data USA son accesibles a través de API y el código es de código abierto. La idea es lanzar una plataforma que se mantenga a lo largo del tiempo, a medida que los desarrolladores la mejoren e integren sus propios conjuntos de datos.
Aunque Data USA destaca por proporcionar contexto, no es la primera plataforma que ofrece visualización de datos abiertos al público en general. El Banco Mundial, por ejemplo, ofrece una cantidad enorme de datos gratuitos sobre 213 países, 20 temas cada uno, actualizados de forma continua. Aunque es un proyecto comercial, Statista también ofrece una gran cantidad de visualizaciones gratuitas; tiene una amplia variedad de información empresarial global. Google lanzó su Explorador de Datos Públicos en 2010 utilizando tecnología que adquirió de la Fundación Gapminder de Hans Rosling, pero hasta donde puedo ver, Google ha perdido interés en este proyecto.
Data USA tiene la tecnología de visualización más avanzada que he visto hasta ahora para este tipo de proyecto, y el marco contextual está bien ejecutado, pero ¿es sostenible? En parte, eso depende de si se forma una comunidad de código abierto vibrante en torno a ella. Gentile admitió que aún no tiene un plan para cómo se actualizarán todos esos conjuntos de datos de forma continua. Desde mi punto de vista, este tipo de servicio parece absolutamente esencial para la democracia. Aunque han surgido algunos proyectos interesantes en los últimos años, en general, el periodismo en la web todavía parece estar atrapado en la era impresa, publicando versiones HTML de páginas de revistas o periódicos. Si me preguntas, en la era de Internet, en un momento en el que el mundo es más complicado que nunca, las noticias deberían ser mucho más parecidas a la inteligencia empresarial. Los datos están ahí y deberían estar disponibles instantáneamente en forma gráfica para cualquiera que los desee. Si no podemos ponernos de acuerdo en los hechos, ¿en qué podemos ponernos de acuerdo?


