Skip to main content

Un ejemplo real: Moneyball

¿Has visto la película Moneyball: Rompiendo las reglas? Narra la historia real del gerente general del equipo de béisbol Oakland Athletics, que, junto con un economista, empleó la estadística para fichar a los mejores jugadores sin sobrepasar un presupuesto modesto. En esencia, esta estrategia se basa en la ciencia de datos: utilizando una base de datos que incluía las habilidades de los jugadores, se identificó a los mejores candidatos para cada posición sin exceder el presupuesto disponible. El equipo no competía con los grandes presupuestos de las franquicias más poderosas — competía con mejores preguntas y mejores datos. Este es uno de los muchos ejemplos de esta disciplina, y con él se entiende fácilmente su potencial: tomar decisiones más inteligentes a partir de evidencia, no de intuición.

Definición

Podemos definir la ciencia de datos como un campo interdisciplinario que abarca una variedad de procesos dedicados a la gestión y el análisis de datos, independientemente de su volumen. La ciencia de datos combina conocimientos de varias disciplinas:
  • Estadística y matemáticas — para modelar datos y extraer patrones.
  • Informática y programación — para procesar y automatizar el análisis.
  • Conocimiento del dominio — para interpretar los resultados con sentido crítico.

La importancia de conocer tus datos

Aunque la ciencia de datos sea un trabajo de exploración, no se realiza nunca a ciegas. Una cuestión fundamental es comprender qué representan los datos con los que se trabaja. ¿Serías capaz de analizar datos de la bolsa de Tokio sin entender cómo funciona ese mercado? Por más avanzado que sea tu dominio en las técnicas de análisis, siempre es esencial:
  • Entender qué información pueden brindar los datos.
  • Estar familiarizado con el contexto del que provienen.
  • Formular las preguntas más pertinentes antes de comenzar.
  • Identificar problemas en los datos durante el proceso.
  • Interpretar correctamente los resultados al final.
En Datosfera Lab trabajarás siempre sobre datasets reales y con un contexto concreto. Antes de analizar cualquier conjunto de datos, dedica tiempo a entender qué representa cada columna, de dónde provienen los datos y qué preguntas quieres responder.

Continúa aprendiendo

Los datos y sus formatos

Descubre los tipos de datos estructurados y no estructurados, y los formatos más habituales en ciencia de datos.

Recopilación de datos

Aprende a recoger, solicitar y buscar datos públicos para tu proyecto.

Limpieza de datos

Importa y prepara tu dataset antes de analizarlo, eliminando errores e inconsistencias.

Build docs developers (and LLMs) love