Recientemente, el medio de noticias y análisis de tecnología CRN publicó su sexta edición anual de Big Data 100 en 2018, una lista de proveedores de soluciones que están innovando en el espacio. La lista tiene como objetivo ayudar a los proveedores a identificar los mejores socios. Lo que es diferente este año es que la lista se divide en cuatro categorías tecnológicas distintas, que incluyen análisis de negocios, ciencia de datos y aprendizaje automático, sistemas de big data y herramientas de gestión e integración de datos. CRN ha publicado los 45 proveedores de gestión de datos y de integración de datos más “cool” incluidos en la lista a través de una presentación interactiva.
En Solutions Review, seguimos a los proveedores de soluciones que tienen el mayor impacto en la empresa. Como tal, hemos revisado las clasificaciones completas de CRN, disponibles aquí, y hemos seleccionado las 7 herramientas de gestión de datos que consideramos más importantes. Para obtener un desglose más detallado de las principales soluciones de gestión de datos, consulte nuestra Guía del Comprador para Plataformas de Gestión de Datos.
1010data
1010data tiene su sede en Nueva York y ofrece capacidades integradas para la gestión de bases de datos y análisis de datos. El producto estrella de la compañía, Insights Platform, también cuenta con modelado y visualización de datos, informes y desarrollo de aplicaciones. 1010data reúne datos dispares para proporcionar una vista detallada, y la solución se adapta a cualquier tamaño. Además, las capacidades de almacenamiento de datos columnares de la herramienta presentan los datos de manera ordenada. 1010data ha recaudado $35 millones en capital de riesgo desde su fundación en 2000.
Bedrock Data
Bedrock Data es un proveedor de soluciones de gestión de datos con sede en Boston que ofrece sus capacidades a través de dos líneas principales de productos. El primero, Bedrock Data Fusion, permite a las organizaciones automatizar los flujos de datos en aplicaciones SaaS. Sync de Bedrock Data proporciona a los usuarios la capacidad de mantener los datos alineados en todas las aplicaciones sin necesidad de programación o desarrollo. Sync cuenta con más de 50 conectores preconstruidos y sincroniza automáticamente cada cinco minutos. La compañía fue fundada en 2012.
MarkLogic
MarkLogic ofrece una base de datos operativa y transaccional de NoSQL para empresas que está diseñada para integrar, almacenar, gestionar y buscar datos. Las organizaciones pueden ingresar datos estructurados y no estructurados con un modelo de datos flexible que se adapta a los cambios en los datos. También almacena nativamente datos JSON, XML, texto y geoespaciales. El Índice Universal de MarkLogic permite a los usuarios buscar en todos los datos, y las API permiten el desarrollo y la implementación de aplicaciones. La base de datos cuenta con transacciones ACID, escalabilidad y elasticidad, y seguridad certificada.
MemSQL
MemSQL tiene su sede en San Francisco y ofrece un almacén de datos en tiempo real que ingiere datos de forma continua para realizar análisis. La herramienta puede ingresar y transformar millones de eventos por día mientras analiza miles de millones de filas de datos utilizando SQL estándar. MemSQL se puede implementar en las instalaciones, en la nube a través de Amazon Web Services o Microsoft Azure, o como un servicio que incluye compatibilidad con middleware, integración y software de inteligencia empresarial existentes. MemSQL está disponible en dos ediciones: Developer (no apta para implementaciones de productos) y Enterprise.
Podium Data
Podium ofrece un Data Lake administrado de clase empresarial en poco tiempo e incluye un conjunto completo de características de gestión esenciales para garantizar la organización, transparencia, gobernanza y seguridad. El entorno de desarrollo de Podium es rápido y fácil de usar, no requiere habilidades especializadas en Hadoop y se adapta fácilmente a las necesidades comerciales en evolución. El proveedor afirma que la implementación de un Data Lake empresarial seguro y administrado lleva menos de una semana.
Qubole
El producto principal de gestión de datos de Qubole es su Plataforma de Datos Autónoma, una solución que se autogestiona y se autooptimiza mediante el envío de alertas e Informes y Recomendaciones (AIR) basados en agentes en la nube conectados a las políticas y preferencias de datos del cliente. Qubole utiliza una combinación de heurísticas y aprendizaje automático para garantizar la continuidad de la carga de trabajo. La compañía tiene su sede en Santa Clara, California. Desde su creación en 2011, Qubole ha recaudado $75 millones en capital de riesgo.
StreamSets
StreamSets ofrece lo que ha denominado “la única plataforma DataOps de la industria” que permite a las organizaciones construir, ejecutar, operar y proteger arquitecturas de movimiento de datos. La plataforma combina las capacidades de Data Collector de código abierto con Control Hub, una herramienta nativa de la nube que ayuda a los usuarios a gestionar el movimiento de datos. La compañía fue fundada por el ex Jefe de Producto de Informatica, Girish Pancha. StreamSets tiene su sede en San Francisco.
Tamr
Tamr ofrece un producto de unificación de datos a escala empresarial que utiliza aprendizaje automático para preparar y unir datos de diferentes silos. Sus soluciones principales incluyen análisis de adquisiciones y abastecimiento, integración de datos de clientes y dominio de datos. La compañía fue nombrada recientemente en la nueva Guía de Mercado de Gartner para Preparación de Datos, un informe que cubre mercados de software nuevos y emergentes. Con sede en Boston, Massachusetts, Tamr fue fundada en 2012 por tres veteranos de la industria de bases de datos.
Waterline Data
Waterline Data ofrece una solución de catalogación de datos que utiliza aprendizaje automático para descubrir y gestionar datos empresariales. La herramienta permite a las organizaciones “huellas dactilares” automáticas e incrementales de los datos e inferir su linaje mediante el análisis de los valores de los datos para datos relacionales, en la nube y de Hadoop. La compañía fue fundada en 2013 por Alex Gorelik. Waterline Data tiene su sede en Mountain View, California.
Zaloni
Zaloni es un proveedor de capacidades de gestión de Data Lake con sede en Durham, Carolina del Norte. El producto estrella de la compañía es la Plataforma de Gestión de Datos de Zaloni (ZDP). La solución opera los datos a lo largo de todo el proceso, desde la fuente de datos hasta el consumidor. ZDP automatiza tareas y procesos repetibles de gestión de datos y proporciona una gestión centralizada de todas las fuentes de datos empresariales, ya sea en las instalaciones, en la nube, en múltiples nubes o en un entorno híbrido. Zaloni es compatible con todas las principales distribuciones de Hadoop, la mayoría de los motores de procesamiento de datos y los modelos de implementación aplicables.
Para obtener más información sobre estas herramientas de gestión de datos y cómo pueden ayudar a su empresa, consulte la lista completa de CRN Big Data 100.