Demasiado a menudo, los líderes de TI posponen sus iniciativas de ciencia de datos hasta que puedan construir una sólida capa de ingeniería de datos. Esperan a que haya un almacén de datos disponible antes de planificar proyectos de análisis de datos, asumiendo que el análisis avanzado es esencial para obtener un valor empresarial transformador y que grandes volúmenes de datos organizados de manera ordenada son un requisito previo para ello. Nada está más lejos de la verdad. Aquí hay cuatro cosas a tener en cuenta si no tienes big data pero te gustaría emprender iniciativas de ciencia de datos.
1. Los problemas empresariales deben determinar el tipo de análisis que necesitas
Según las estimaciones de Gartner, alrededor del 80% de los proyectos de ciencia de datos no logran ofrecer resultados empresariales. Una razón clave de esto es que los líderes no eligen los problemas empresariales adecuados para resolver. La mayoría de los proyectos de análisis de datos se eligen en función de los datos disponibles, las habilidades disponibles o las herramientas disponibles. Estas son recetas para el fracaso; un proyecto de análisis de datos nunca debe comenzar ni con datos ni con análisis. La mejor manera de comenzar el viaje de la ciencia de datos es reflexionar sobre la estrategia organizativa. Descubre los problemas más importantes que tus usuarios objetivo desean resolver y valida si abordarlos entregará el impacto empresarial deseado. Los desafíos empresariales elegidos dictarán el enfoque de análisis que debes adoptar y, por lo tanto, los datos que necesitas. No tener datos para comenzar incluso puede ser una ventaja: cuando comienzas desde cero, no estás cargado con el legado del pasado. Por otro lado, las organizaciones con una trayectoria mucho más larga a menudo luchan con costosas transformaciones digitales. Considera el caso de Moderna, que construyó una cultura digital desde su inicio en 2010. Construyó una plataforma de datos y análisis al servicio de sus prioridades empresariales que giraban en torno al desarrollo de medicamentos basados en ARNm. Este enfoque específico fue fundamental para permitir que Moderna creara el plan para la vacuna COVID-19 en solo dos días.
2. Tu enfoque de análisis dicta los datos que obtienes
Las organizaciones pueden pasar meses construyendo almacenes de datos solo para descubrir que los datos que han recopilado no son lo suficientemente buenos para realizar los análisis que necesitan. Los algoritmos de aprendizaje automático a menudo necesitan datos de un tipo, volumen o granularidad específicos. Intentar construir una capa de ingeniería de datos perfecta sin tener claridad sobre cómo se utilizará es un esfuerzo desperdiciado. Cuando tienes visibilidad sobre la estrategia organizativa y los problemas empresariales que se deben resolver, el siguiente paso es finalizar tu enfoque de análisis. Descubre si necesitas análisis descriptivos, diagnósticos o predictivos y cómo se utilizarán los conocimientos. Esto aclarará los datos que debes recopilar. Si obtener datos es un desafío, divide el proceso de recopilación para permitir un progreso iterativo con la solución de análisis.