Skip to main content
Antes de continuar, conviene ilustrar mejor la distinción entre tres conceptos clave que aparecen con frecuencia y que a menudo se usan de forma indistinta: el dato, la información y el conocimiento.

Dato, información y conocimiento

Consideremos el valor 70 cm. Aislado, este número es simplemente un dato sin contexto. Si especificamos que 70 cm es la altura de un quokka adulto, el dato se convierte en información que nos permite contextualizar un hecho — en este caso, la talla de un marsupial concreto. Si además entendemos que un quokka de esa altura es más grande que la mayoría de su especie y, por tanto, una rareza o excepción, hemos adquirido conocimiento específico sobre ese animal. Esta progresión desde un dato simple hasta una comprensión más profunda ilustra la importancia de interpretar y contextualizar adecuadamente los datos. La complejidad de transformar datos en información útil y luego en conocimiento significa que no es simplemente una cuestión de interpretación. Requiere procesos meticulosos y herramientas adecuadas para extraer significado y valor.

Del big data a los datos cotidianos

En la era moderna, el término big data se ha vuelto cada vez más familiar. Se refiere a enormes conjuntos de datos que superan la capacidad de procesamiento de los sistemas tradicionales, demandando nuevas técnicas y herramientas para su análisis. Esta emergencia del big data ejemplifica cómo la problemática de gestionar grandes volúmenes de datos ha evolucionado con el tiempo. Lo que una vez fue considerado un desafío casi insuperable, ahora es parte de nuestra rutina diaria gracias a los avances tecnológicos. Es esencial destacar, sin embargo, que la capacidad de extraer información no se limita únicamente a esos enormes conjuntos de datos. Ya sea en el ámbito del big data o en escalas menores, ahora podemos obtener, procesar y analizar información de manera eficiente. Estamos en una época en la que, independientemente del tamaño de los datos, tenemos el poder y las herramientas para transformarlos en conocimientos valiosos.

Glosario de términos clave

Servidor conectado a internet donde se guarda y accede a información o programas sin necesidad de tenerlos ni procesarlos en el propio ordenador. Servicios como Google Drive, Dropbox o OneDrive son ejemplos de almacenamiento en la nube.
Término que hace referencia a una gran cantidad de datos que es complicada de manejar con herramientas convencionales. El big data se caracteriza habitualmente por las denominadas “tres V”: volumen (cantidad masiva de datos), velocidad (generación y procesamiento muy rápidos) y variedad (múltiples tipos y formatos de datos).
Conjunto de datos recopilados en uno o varios archivos. Un dataset puede ser, por ejemplo, una tabla con las estadísticas de todos los jugadores de una liga de béisbol, o un archivo con los datos de calidad del aire recogidos por sensores urbanos durante un año.
Archivo digital donde se guardan y organizan archivos o programas para que sean accesibles a otras personas. Los repositorios de datos abiertos, como los portales de datos de los gobiernos, permiten descargar datasets de forma libre y gratuita.
Proceso de organizar, corregir y mejorar datos para que estén listos para ser usados. La curación incluye tareas como eliminar duplicados, corregir errores tipográficos, estandarizar formatos de fecha o completar valores ausentes.
Proceso de buscar patrones o información útil en una gran cantidad de datos. La minería de datos aplica técnicas estadísticas y de aprendizaje automático para descubrir relaciones ocultas que no serían evidentes a simple vista.

Build docs developers (and LLMs) love