IBM ha presentado cuatro nuevas adiciones a su cartera de servicios de datos en la nube alojados en su plataforma Bluemix PaaS, lo que ayuda a la plataforma en la nube a satisfacer a la nueva generación de científicos de datos ciudadanos. De las cuatro nuevas ofertas, IBM Compose Enterprise es la más práctica y familiar. Se centra en uno de los aspectos menos glamorosos del análisis de datos basado en la nube: implementar y gestionar bases de datos en la nube a través de un DBaaS. Compose Enterprise es un conjunto de servicios de bases de datos existentes que IBM agregó a Bluemix después de adquirir Compose, Inc., lo que permitió configurar aplicaciones de bases de datos como MongoDB, PostgreSQL, Redis y Elasticsearch como servicios. Compose Enterprise va un paso más allá y proporciona un único punto de acceso.
Con IBM Graph, Bluemix obtiene su primer servicio de base de datos de gráficos dedicado. Las bases de datos de gráficos se utilizan para analizar las conexiones entre los nodos de datos, como en las redes sociales, pero IBM ve el análisis de gráficos como una herramienta empresarial donde los datos se pueden “[tratar] en su estado natural en lugar de dividirlos en estructuras formales”. IBM podría haber elegido utilizar la base de datos de gráficos de código abierto Neo4j, pero en su lugar optó por Apache TinkerPop. Esto podría deberse a la licencia de código abierto: Neo4j es GPLv3, mientras que TinkerPop es Apache (y por lo tanto menos restrictivo). Adam Kocoloski, CTO de IBM Analytics Platform y Cloud Data Services, explicó en un correo electrónico que la decisión se basó en tener “una comunidad verdaderamente abierta que la respalde, representada por el proceso de la Fundación Apache”. El lenguaje Cipher de Neo4j “está disponible para el público, pero Neo Technology sigue siendo propietario de cualquier código que sea contribuido por la comunidad”. TinkerPop, en cambio, utiliza un lenguaje llamado Gremlin que es “un lenguaje de consulta abierto líder en la industria que ofrece una serie de beneficios sobre [Cipher]”.
IBM Predictive Analytics y IBM Analytics Exchange están estrechamente relacionados. El primero es esencialmente un servicio de aprendizaje automático respaldado por una versión alojada/SaaS del paquete de software de análisis predictivo SPSS de IBM. Además de atraer a nuevos clientes a SPSS, el plan de IBM es proporcionar un entorno donde los futuros científicos de datos puedan ensamblar modelos de aprendizaje automático existentes en nuevos casos de uso. Por su parte, Analytics Exchange proporciona conjuntos de datos “de alta calidad, abiertos y propietarios” de “datos gubernamentales, económicos y ambientales” que se pueden integrar en aplicaciones existentes. Este último movimiento está en línea con la tendencia de las plataformas en la nube de agregar galerías de algoritmos y datos para complementar sus ofertas de PaaS. Microsoft Azure, por ejemplo, tiene su propia galería de fuentes de datos para aprovechar, y Amazon Web Services alberga un conjunto pequeño pero útil de fuentes de datos públicas.


