El big data y el análisis de datos están avanzando hacia etapas más maduras de implementación. Esta es una buena noticia, especialmente para las empresas pequeñas y medianas que están implementando esta tecnología y han estado luchando por definir una arquitectura para el big data en sus empresas. La incertidumbre sobre cómo definir una arquitectura general para el big data y el análisis es una de las razones por las cuales las empresas medianas y pequeñas se han rezagado en sus implementaciones de big data y análisis. En muchos casos, han optado por esperar en la línea de banda para ver cómo se desarrollarían tendencias como la computación híbrida, los data marts y las bases de datos maestras, y el control sobre la seguridad y el gobierno. Finalmente, parece haber una arquitectura de datos de mejores prácticas emergente que todos pueden seguir. En esta arquitectura:
- Se utilizan servicios en la nube para almacenar y procesar big data.
- Se utiliza la computación local para desarrollar data marts locales en toda la empresa, donde las empresas realizan su propio análisis.
Echemos un vistazo más de cerca a la lógica detrás de esta arquitectura de big data y análisis:
El papel de la nube
Si tu empresa es pequeña o mediana, resulta costoso comenzar a comprar grupos de servidores que procesen en paralelo el big data en tu centro de datos, sin mencionar contratar o capacitar a profesionales muy costosos que sepan cómo optimizar, actualizar y mantener un entorno de procesamiento en paralelo. Las empresas que optan por procesar y almacenar sus datos en el lugar también tienen inversiones considerables en hardware, software y almacenamiento. Todo esto produce una economía que apunta a externalizar tu hardware, software, procesamiento y almacenamiento de big data en la nube.
Computación local
La gobernanza (por ejemplo, preocupaciones de seguridad y cumplimiento) es una de las razones por las cuales las empresas siguen siendo reacias a confiar todos sus datos críticos en la nube, donde es más difícil supervisar la administración de estos datos. En consecuencia, muchas empresas optan por mover los datos a sus propios centros de datos locales una vez que los datos se han procesado en la nube. También hay una segunda razón por la cual muchas empresas optan por mantener sus datos procesados en el lugar: la preocupación por las aplicaciones y algoritmos propietarios desarrollados para extraer estos datos, ya que muchos proveedores de la nube tienen una política que permite compartir las aplicaciones que sus clientes desarrollan en la nube con otros clientes. Al mantener sus aplicaciones internamente y desarrollar un conjunto de datos maestro en el lugar del cual se pueden derivar data marts más pequeños, las empresas mantienen un control directo sobre sus datos y aplicaciones.
En resumen, la arquitectura de big data y análisis está evolucionando hacia una combinación de servicios en la nube para el almacenamiento y procesamiento de datos, y la computación local para el desarrollo de data marts internos. Esta combinación permite a las empresas pequeñas y medianas aprovechar los beneficios del big data y el análisis sin incurrir en costos prohibitivos o comprometer la seguridad y el control de sus datos. Si tu empresa está considerando implementar una arquitectura de big data y análisis, esta guía puede ayudarte a tomar decisiones informadas y aprovechar al máximo esta tecnología en constante evolución.