Los Data Lakes han sido objeto de debate en la comunidad de análisis de datos. Algunos los ven como una solución revolucionaria, mientras que otros los consideran un desastre en potencia. Pero, ¿qué hay de cierto en todo esto?
En un informe publicado por Gartner en julio de 2014, se plantean argumentos en contra de la validez de la arquitectura de los Data Lakes basados en Hadoop. Según el informe, los desafíos incluyen cambios culturales, falta de habilidades y problemas de gobernanza de datos. Sin una gobernanza adecuada, el lago de datos corre el riesgo de convertirse en una colección de datos desconectados o silos de información en un solo lugar. Sin duda, esto puede generar preocupación.
Sin embargo, no todos están en contra de los Data Lakes. En un artículo publicado en agosto de 2014, el consultor Wayne Eckerson afirmó que las arquitecturas de análisis del futuro podrían girar en torno a Hadoop, describiéndolo como una plataforma escalable y flexible que puede satisfacer la mayoría de los requisitos de análisis de datos empresariales. De hecho, hay organizaciones que están adoptando los Data Lakes y utilizando clústeres de Hadoop como su plataforma principal para recopilar, procesar y analizar datos en bruto.
En SearchDataManagement y SearchBusinessAnalytics se han publicado una serie de historias que destacan las experiencias de algunos usuarios de Data Lakes. Se examinan los desafíos que enfrentaron tres empresas al construir y gestionar sus Data Lakes, así como las soluciones que encontraron. También se exploran los despliegues de Data Lakes en Allstate, una compañía de seguros, y en Solutionary, un proveedor de servicios gestionados. Además, se presentan opiniones de consultores y analistas de la industria sobre el concepto de los Data Lakes.
En una entrevista, Wayne Eckerson detalla los obstáculos y conceptos erróneos que pueden dificultar el desarrollo de los Data Lakes. Mike Gualtieri de Forrester Research discute lo que se necesita para que los Data Lakes sean más viables, y el consultor Joe Caserta advierte sobre la importancia de no ignorar los principios tradicionales de TI al diseñar una arquitectura de Data Lake basada en Hadoop. Andy Hayler de The Information Difference pide más ejemplos de casos de uso de big data viables para evitar que la adopción de los Data Lakes se estanque.
En resumen, los Data Lakes tienen el potencial de ser una herramienta poderosa para el análisis de datos empresariales. Sin embargo, es importante abordar los desafíos de gobernanza y asegurarse de tener las habilidades adecuadas para gestionarlos. Con una planificación cuidadosa y una implementación adecuada, los Data Lakes pueden ser una bendición en lugar de una maldición.
¿Qué opinas sobre los Data Lakes? ¿Crees que son el futuro del análisis de datos o simplemente una moda pasajera? ¡Déjanos tus comentarios!


