El surgimiento de la ciencia de datos y su impacto en la actualidad

En la última década, el término “big data” y “ciencia de datos” se han convertido en palabras de moda, pero no son conceptos nuevos. La idea de la ciencia de datos abarca muchos campos diferentes y ha estado ganando terreno lentamente en la corriente principal durante más de cincuenta años. De hecho, muchos consideraron el año pasado el quincuagésimo aniversario de su introducción oficial. A lo largo de los años, varios nombres y fechas han sido fundamentales en el desarrollo de esta disciplina.

En 1962, John Tukey escribió “El futuro del análisis de datos”, un artículo publicado en The Annals of Mathematical Statistics, una importante revista de investigación estadística. En este artículo, Tukey cuestionó la relación entre la estadística y el análisis de datos, y planteó la importancia de la interpretación de los resultados y la planificación de la recopilación de datos. Su trabajo sentó las bases para la ciencia de datos tal como la conocemos hoy en día.

Otro nombre importante en el desarrollo de la ciencia de datos es Peter Naur, quien en 1974 publicó “Concise Survey of Computer Methods”, donde utilizó repetidamente el término “ciencia de datos”. Naur definió la ciencia de datos como “la ciencia de tratar con datos una vez que han sido establecidos, mientras que la relación de los datos con lo que representan se delega a otros campos y ciencias”. A partir de este punto, la ciencia de datos comenzó a ganar popularidad y a ser cada vez más mencionada en diferentes contextos.

En 1977 se fundó la Asociación Internacional de Computación Estadística (IASC), cuya misión era vincular la metodología estadística tradicional, la tecnología informática moderna y el conocimiento de los expertos en el campo para convertir los datos en información y conocimiento. En este mismo año, Tukey publicó otra obra importante titulada “Exploratory Data Analysis”, donde argumentó que se debía enfatizar el uso de los datos para sugerir hipótesis y que el análisis exploratorio de datos debía trabajar junto con el análisis confirmatorio de datos.

En la década de 1990, la ciencia de datos comenzó a tomar forma con la aparición de grandes volúmenes de datos y el desarrollo de herramientas y técnicas para analizarlos. En 1994, se empezaron a utilizar los primeros métodos de marketing moderno basados en datos. En 1996, el término “ciencia de datos” apareció por primera vez en una conferencia en Japón, y al año siguiente se planteó la pregunta de si la estadística era igual a la ciencia de datos. En 1999, se mencionaron los desafíos técnicos de analizar grandes volúmenes de datos y la necesidad de desarrollar modelos más precisos y herramientas especializadas.

En la década de 2000, la ciencia de datos se consolidó como una disciplina independiente y se popularizó el término “científico de datos”. En 2010, la ciencia de datos se había infiltrado completamente en el lenguaje común y se habían incrementado significativamente las ofertas de trabajo para científicos de datos. En 2013, se hizo evidente el crecimiento exponencial de los datos, con estadísticas que mostraban que el 90% de los datos del mundo se habían creado en los dos años anteriores.

En la actualidad, la ciencia de datos está estrechamente relacionada con el aprendizaje automático y se espera que el aprendizaje profundo sea clave para avanzar en nuevas áreas. Además, se está promoviendo la apertura de datos y la creación de soluciones de datos de código abierto que permitan a personas sin experiencia en el campo participar en la revolución de la ciencia de datos.

A pesar de que la ciencia de datos parece algo común en nuestro mundo actual, su importancia y naturaleza exacta han evolucionado junto con la tecnología. Esta disciplina ha revolucionado la forma en que se analizan y utilizan los datos, y su impacto seguirá creciendo en el futuro.

Te puede interesar