Las soluciones de gestión de datos se encuentran en la intersección del big data y el análisis empresarial. El mercado de gestión de datos ofrece un amplio espectro de capacidades utilizadas para analizar datos de diversas fuentes cada vez más diversas. Las técnicas tradicionales de almacenamiento de datos se están eliminando gradualmente con la adopción de los data lakes, y la conectividad en la nube ha surgido como un factor diferenciador en un número creciente de implementaciones. A medida que las regulaciones se vuelven más estrictas y los marcos de cumplimiento se vuelven más comunes, las organizaciones se interesan cada vez más en herramientas de gestión de datos dedicadas, asegurando que mantengan sus datos de una manera que los proteja de amenazas internas y externas. Quizás el caso de uso más importante para la gestión de datos en los próximos cinco años será el nuevo Reglamento General de Protección de Datos (GDPR) de Europa. En un intento de ayudarlo con lo que puede convertirse en una tarea desalentadora de seleccionar el producto adecuado, estas son las 28 mejores plataformas de gestión de datos para 2018.

1010data

1010data es un proveedor de servicios administrados y la plataforma Insights de la compañía es conocida por manejar grandes volúmenes de datos con relativa facilidad. El proveedor ofrece funcionalidad tradicional de gestión de datos, así como características consideradas como capacidades básicas de los proveedores de software en mercados horizontales. El producto de 1010data está dirigido a empresas en los sectores de servicios financieros, venta al por menor, telecomunicaciones, gobierno y atención médica. Solutions Review nombró a 1010data como una herramienta de análisis de datos minoristas a considerar en octubre de 2017.

Amazon Redshift

Amazon Redshift está integrado con otros servicios de AWS y tiene comandos incorporados para cargar datos en nodos paralelos desde Amazon S3, Amazon DynamoDB o servidores locales. Los usuarios pueden lograr esto a través de la integración de AWS Data Pipeline, Amazon Kinesis y AWS Lambda con Redshift como destino. Los usuarios también pueden cargar datos en tiempo real en Amazon Redshift utilizando Amazon Kinesis Firehose. Amazon es un jugador dominante en el mercado de la nube, y una amplia gama de opciones de implementación brinda a las organizaciones la capacidad de seleccionar solo las capacidades que necesitan.

Ataccama ONE

Ataccama ONE es un producto integral de gestión de datos maestros que ofrece una lista intrigante de capacidades para muchos casos de uso. El producto se puede implementar en entornos locales (entornos tradicionales, Hadoop, Spark), en la nube (Spark basado en la nube, Amazon y Azure, SaaS multiinquilino) o a través de un modelo híbrido. Ataccama se asoció recientemente con Deloitte para una solución de cumplimiento de GDPR. Además, la compañía fue nombrada en el Cuadrante Mágico de Gartner tanto para Soluciones de Gestión de Datos Maestros como para Herramientas de Calidad de Datos el año pasado.

Cloudera

Cloudera ofrece una plataforma de almacenamiento y procesamiento de datos basada en el ecosistema Apache Hadoop, así como un sistema propietario y herramientas de gestión de datos para diseño, implementación, operaciones y gestión de producción. Cloudera se diferencia de otros proveedores de distribución de Hadoop al continuar invirtiendo en capacidades específicas, como mejoras en Cloudera Navigator (que proporciona gestión de metadatos, linaje y auditoría), al mismo tiempo que se mantiene al día con el proyecto de código abierto de Hadoop.

Commvault

Commvault ofrece una amplia gama de productos para casos de uso de protección de datos. La compañía es considerada uno de los principales proveedores de soluciones en el amplio mercado de copias de seguridad y recuperación ante desastres. En los últimos meses, el proveedor ha comenzado estratégicamente a posicionarse como una herramienta de gestión de datos. Commvault es una de varias compañías en el mercado que ha lanzado una solución dedicada de cumplimiento de GDPR, algo que esperamos ver más en las próximas semanas y meses.

EnterWorks

EnterWorks fue adquirida por Black Dragon Capital en 2015. La inversión ha permitido a la compañía acelerar su hoja de ruta de productos y expandir su equipo. EnterWorks se enfoca en el cliente, pero principalmente para usuarios altamente técnicos y orientados a los procesos comerciales. El producto también cuenta con excelentes capacidades de gestión de proyectos. EnterWorks fue nombrada una de las 30 compañías de más rápido crecimiento para observar por Silicon Review en octubre de 2017.

Google

Google está acumulando silenciosamente uno de los mejores portafolios de productos de gestión de datos en el mercado. El almacén de datos sin servidor de BigQuery proporciona a las organizaciones datos a través de transmisión en tiempo real para análisis en tiempo real. La solución también ofrece amplias capacidades de cifrado, seguridad y replicación de datos para copias de seguridad y recuperación automáticas. Google tiene un reconocimiento amplio en el espacio tecnológico general, lo que hace que la plataforma sea una selección fácil para muchas organizaciones.

HPE

HPE diseña arquitecturas de TI que pueden manejar volumen, operar rápidamente y procesar datos de prácticamente cualquier fuente. Vertica es una de las plataformas más flexibles en el espacio, y las opciones de infraestructura abierta, tecnología y implementación de la solución le permiten procesar grandes volúmenes de datos de manera efectiva. Según la firma de análisis Gartner, más de un tercio de la base de clientes de referencia de HPE utiliza Vertica en tamaños de implementación superiores a 100TB, lo que demuestra la capacidad del producto para manejar grandes volúmenes de datos.

Hortonworks Data Platform

Hortonworks Data Platform es una distribución segura y de código abierto de Apache Hadoop basada en una arquitectura centralizada (YARN). Hortonworks ofrece a los usuarios la capacidad de ejecutar la plataforma en el centro de datos y en la nube pública de su elección. La herramienta incluye una variedad de motores de procesamiento que permiten a los usuarios interactuar con los datos de varias formas, y las aplicaciones de análisis de big data pueden interactuar con datos desde lotes hasta SQL interactivos o acceso de baja latencia con NoSQL.

IBM

La solución de gestión de datos híbridos de IBM ofrece a las organizaciones la opción de seleccionar cualquier tipo de base de datos o almacén de datos o software de código abierto. La solución recopila, administra y proporciona información sobre datos en entornos locales, privados y públicos en la nube, o integrados en datos estructurados y no estructurados. IBM proporciona aprendizaje automático y ciencia de datos incorporados para que los usuarios puedan ejecutar análisis en datos en su entorno nativo, y el motor SQL común con virtualización de datos incorporada permite una gestión escalable de datos.

Informatica

Informatica ofrece una amplia cartera de herramientas de gestión de datos en diversas implementaciones. La base de clientes del proveedor supera las 7,000 organizaciones. Informatica destaca por su interoperabilidad entre su creciente lista de soluciones de software, y el producto Big Data Management cuenta con un Analizador de Big Data, Relate 360, Intelligent Data Lake, Enterprise Information Catalog e Intelligent Streaming. La firma de análisis Gartner nombró a Informatica líder en los mercados de Gestión de Metadatos y Gestión de Datos Maestros a finales del año pasado.

MapR

La Plataforma de Datos Convergentes de MapR admite una amplia gama de aplicaciones y casos de uso, incluidas aplicaciones confiables y en tiempo real, y transmisión global de eventos con almacenamiento a escala web. El proveedor también ofrece sus productos a través de modelos de suscripción en la nube con Amazon Web Services, Microsoft Azure y otros. MapR obtuvo derechos de patente sobre tecnologías clave y componentes subyacentes de su Plataforma de Datos Convergentes en enero de 2017. La compañía lanzó un nuevo conector para Teradata poco después.

MarkLogic

MarkLogic ofrece una base de datos NoSQL empresarial operativa y transaccional diseñada para integrar, almacenar, administrar y buscar datos. Las organizaciones pueden ingresar datos estructurados y no estructurados con un modelo de datos flexible que se adapta a los cambios en los datos. También almacena nativamente datos JSON, XML, texto y geoespaciales. El Índice Universal de MarkLogic permite a los usuarios buscar en todos los datos, y las API permiten el desarrollo y la implementación de aplicaciones. La base de datos cuenta con transacciones ACID, escalabilidad y elasticidad, y seguridad certificada.

MemSQL

MemSQL cuenta con una implementación flexible, con la capacidad de implementarse en el centro de datos y en la nube. En octubre de 2017, la compañía anunció una importante actualización de su producto estrella, MemSQL 6, que agrega nuevas características de extensibilidad para permitir el aprendizaje automático, mejoras a gran escala para consultas analíticas y un conjunto más amplio de operaciones en línea. MemSQL ofrece excelentes capacidades de transmisión de datos en tiempo real y ahora proporciona un aislamiento de consulta más eficiente para grandes volúmenes de datos y muchos usuarios.

Microsoft

La solución de gestión de bases de datos de Microsoft ofrece una instalación, configuración, integración y implementación sencillas. Microsoft ayuda a instalar y configurar el dispositivo APS, ofreciendo a los usuarios un ecosistema de socios, incluido Mariner, que ayuda con la planificación, implementación y soporte. Usando PolyBase, ahora admite la capacidad de consultar datos utilizando SQL en el almacén de datos tradicional, además de datos almacenados en la región de Hadoop, ya sea en el dispositivo o en un clúster de Hadoop separado.

Oracle

En 2014, Oracle adquirió la nube de marketing de BlueKai y la combinó con sus capacidades existentes de gestión de datos para ayudar a las organizaciones a personalizar sus programas de marketing y experiencia del cliente. El producto de gestión de datos cohesivo de Oracle brinda a las empresas la capacidad de construir perfiles de usuario completos, combinando información de fuentes de primera y tercera parte, incluidos medios, publicidad, redes sociales y fuentes móviles.

Panoply.io

Panoply.io automatiza las tareas de gestión de datos asociadas con la ejecución de big data en la nube. Smart Data Warehouse no requiere esquema, modelado o configuración. Panoply cuenta con un canal de integración sin ETL que puede conectarse a fuentes de datos estructurados y semiestructurados. También ofrece almacenamiento columnar y copia de seguridad automática de datos en un marco de almacenamiento redundante S3. Panoply recibió una extensión en su primera ronda de financiamiento de riesgo en diciembre de 2017, que incluyó a C5 Capital en su lista de patrocinadores que ya incluye a Intel Capital, Blumberg Capital y 500 Startups.

Pivotal

El producto de gestión de datos de Pivotal cuenta con un popular marco de código abierto, y todas las contribuciones de Greenplum forman parte del proyecto Greenplum Database y comparten el mismo núcleo de la base de datos, incluida la arquitectura MPP, las interfaces analíticas y la seguridad. La solución ofrece integración con repositorios de datos en la nube y data lakes a través de tablas externas que proporcionan acceso a datos almacenados fuera de Greenplum como si estuvieran almacenados en tablas de base de datos regulares. Pivotal también incluye complementos de continuidad empresarial como detección inteligente de fallas, copia de seguridad incremental y recuperación ante desastres.

Relay42

Relay42 es una plataforma de gestión de datos completamente agnóstica de proveedores. Se integra con cualquier canal que las organizaciones hayan probado y elegido como el más adecuado para ellas. Esto significa que cualquier herramienta de tecnología de marketing o publicidad elegida, ahora y en el futuro, se puede optimizar, maximizando su rendimiento en conjunto con el ecosistema de marketing más amplio.

RiverSand

Un beneficio importante de la suite de soluciones de RiverSand es su integración. Todos sus módulos se han desarrollado utilizando la misma interfaz, modelo de datos y marco de aplicación. Esto ofrece a las organizaciones un nivel de cohesión a medida que implementan procesos comerciales flexibles dentro de la suite de soluciones. Por ejemplo, la calidad de datos de RiverSand, la gestión de activos digitales y la funcionalidad de publicación dinámica están integradas con su solución de gestión de datos maestros para aumentar la productividad en todo el proceso de producción del catálogo de un minorista. Riversand recaudó su primera ronda de capital de riesgo ($35 millones) el verano pasado.

SAP SE

SAP SE es una empresa multinacional de software. La compañía desarrolla software empresarial, incluido software de comercio electrónico y gestión empresarial, asesora sobre el uso organizativo de sus aplicaciones de software y brinda servicios de capacitación. SAP comercializa sus productos y servicios en todo el mundo. Las soluciones de bases de datos permiten a las empresas crear, distribuir y mantener datos maestros completos y precisos con el software de gestión de datos maestros de SAP. La plataforma SAP HANA ofrece opciones de implementación en la nube, en las instalaciones y híbridas a los clientes, con beneficios que incluyen una huella de datos más pequeña, mayor rendimiento, análisis más rápidos y acceso más rápido a los datos.

SAS Data Management

SAS Data Management es especialmente útil al analizar grandes volúmenes de datos complejos. Sin embargo, la solución tiene una curva de aprendizaje y es mejor para usuarios con experiencia en software y lenguaje SAS. SAS se basa en un marco de calidad de datos, y el glosario de negocios incorporado, así como las capacidades de gestión de metadatos y visualización de linaje de SAS y de terceros, mantienen a todos los usuarios sincronizados. Fundada en 1976 y con sede en Cary, Carolina del Norte, SAS sigue siendo uno de los principales actores en el mercado general de datos y análisis.

Semarchy

Semarchy es único en su capacidad para dominar cualquier tipo de datos (cliente B2B y B2C, datos de productos, datos de referencia, metadatos, ubicación, organizador, proveedor). La herramienta está diseñada en el Lenguaje de Diseño Material de Google, y una actualización reciente de la interfaz proporciona una experiencia de usuario mejorada. xDM automatiza inteligentemente la generación de tablas físicas, el marco de certificación de datos, el proceso de enriquecimiento y estandarización, e integración de manera inteligente.

Snowflake

Snowflake tiene una oferta única de almacén de datos como servicio y su propia arquitectura de datos SQL que afirma hacer más que las alternativas. La compañía recaudó $110 millones en financiamiento de riesgo en 2017. Además, Snowflake fue nombrada en varios informes de analistas de la industria en los últimos doce meses, incluido el Cuadrante Mágico de Gartner sobre Soluciones de Gestión de Datos para Análisis y la lista Forbes Cloud 100. Snowflake ha realizado una serie de mejoras en su cartera de productos recientemente, incluido Snowpipe, una herramienta de carga de datos automatizada, un almacén de datos en la nube para servicios financieros y un nuevo complemento Sharehouse.

Stibo Systems

Stibo Systems ofrece la lista más completa de capacidades de manipulación de datos de cualquier proveedor de soluciones en el espacio. La compañía también destaca por características avanzadas como seguridad basada en roles, inicio de sesión único y seguimiento de auditoría. Stibo se asoció recientemente con Dun & Bradstreet, lo que permitió a la compañía incorporar toda la base de datos comercial en el producto STEP. En junio de 2017, Solutions Review nombró a Stibo Systems una herramienta de software de integración de datos para minoristas a considerar.

Talend

Talend ha fortalecido sus capacidades de gestión de datos en el último año y recientemente anunció el lanzamiento de una nueva solución de gestión de metadatos que brinda a las organizaciones un acceso más fácil a los data lakes y otros proyectos de big data. Talend Metadata Manager ofrece un marco de gobierno para crear, controlar, atribuir, definir y administrar datos empresariales para que los usuarios puedan extraer y propagar valor adicional. La funcionalidad de preparación de datos de la compañía y el soporte para entornos multi-nube son adiciones bienvenidas. Talend también ha presentado una nueva herramienta de gobierno y cumplimiento para ayudar a las organizaciones a prepararse para el Reglamento General de Protección de Datos (GDPR).

Teradata

El portafolio de gestión de datos de Teradata incluye productos y servicios en almacenamiento de datos, análisis de big data y aplicaciones de marketing. La compañía ofrece lo que consideramos las capacidades de base de datos y almacenamiento de datos más puras de cualquier proveedor en el espacio. Teradata cubre casi todos los casos de uso empresarial, y su capacidad para integrarse con Hadoop y otras fuentes de datos lo hace cada vez más flexible. Entre una serie de premios e inclusiones en muchos informes de analistas, Teradata fue nombrada uno de los principales proveedores en el reciente Big Data 100 de CRN.

Zaloni

La Plataforma de Gestión de Datos de Zaloni automatiza la ingestión, organización y preparación de datos para los data lakes. La solución proporciona acceso a los usuarios para administrar procesos de gobierno y cumplimiento, rastrear el linaje de datos, automatizar el flujo de trabajo para monitorear la calidad de los datos y hacer cumplir la privacidad de los datos y la seguridad basada en roles. Zaloni fue nombrada en varios informes de analistas en los últimos meses, incluido el Big Data 100 de CRN, la Constellation ShortList para la Gestión de Data Lake y el Top 100 de América del Norte de Red Herring. Solutions Review también incluyó al proveedor entre sus proveedores de herramientas de Data Lake para observar en marzo pasado.