Skip to main content
Con los datos preparados y revisados en la hoja de cálculo, llega el momento del análisis. Antes de responder a la pregunta central del proyecto, conviene hacer una exploración general para comprender y contextualizar mejor los datos y los resultados que obtendrás a continuación.
La exploración general no pretende dar respuestas definitivas, sino darte una panorámica del dataset: cuántos datos tienes, cómo están distribuidos y qué peculiaridades presenta la muestra.

Flujo de trabajo

En Datosfera Lab desarrollamos el análisis entre las sesiones 6 y 7:
1

Seminario de introducción a las técnicas de análisis

Presentación de las principales técnicas de análisis de la herramienta escogida, trabajando en conjunto sobre el dataset de prueba para practicar antes de abordar los datos del proyecto.
2

Puesta en común de hallazgos previos

El equipo comparte las cuestiones y observaciones que hayan llamado la atención durante las fases de recogida y limpieza de datos, para tomarlas como punto de partida de la exploración.
3

Elección del método de análisis principal

A partir de la exploración inicial y del objetivo del proyecto, el equipo decide qué método estadístico o analítico usará en la fase siguiente.
4

Exploración y análisis del dataset

El equipo realiza la exploración y el análisis de forma autónoma, con coordinación y apoyo para guiar el proceso y asegurar su correcta realización.
5

Validación de resultados

Antes de dar por cerrado el análisis, se validan los resultados para detectar posibles errores de cálculo o interpretaciones incorrectas.

Por qué explorar antes de analizar

Imagina que tu objetivo es conocer cuántas horas estudian de media los alumnos por curso. Antes de calcular promedios, necesitas saber cuántas personas han respondido la encuesta. Puede ocurrir que algunos cursos tengan una tasa de respuesta alta mientras que en otros solo han participado dos o tres personas. Sin ese contexto, un promedio puede parecer representativo cuando en realidad se basa en muy pocos datos. Conocer el tamaño del estudio y el porcentaje de respuestas por grupo te permite valorar si los datos son suficientemente representativos para sacar conclusiones sólidas.

Preguntas guía para la exploración

Usa estas preguntas para estructurar tu revisión inicial del dataset. No todas serán relevantes para todos los proyectos, pero recorrerlas te ayudará a no pasar nada por alto:

¿Qué representan los datos?

Describe con tus propias palabras qué mide o registra cada fila del dataset. ¿Es una persona encuestada, un evento, una transacción, una observación? Entender la unidad de análisis es el primer paso para interpretar correctamente cualquier resultado.
Cuenta el número total de filas (registros) del dataset. Este número define el tamaño de tu muestra y condiciona la solidez de las conclusiones que puedes extraer.
Cuenta el número de columnas y anota qué tipo de dato contiene cada una: texto, número, fecha, categoría. Identificar los tipos de variables te ayudará a elegir el método de análisis más adecuado para cada una.
Revisa qué columnas tienen valores ausentes y en qué proporción. Si una variable tiene muchos valores en blanco, puede no ser adecuada para el análisis principal o requerir un tratamiento específico.
Comprueba si el dataset incluye alguna variable categórica que permita agrupar los registros (por ejemplo, curso, género, departamento, año). Estos grupos suelen ser la base de comparaciones y segmentaciones en el análisis.
Busca valores que se alejen mucho del resto en las columnas numéricas. Ya habrás revisado esto durante la limpieza, pero en la exploración conviene volver a comprobarlo con los datos ya limpios y calcular si esos extremos son razonables dentro del contexto del proyecto.
Calcula el valor máximo y mínimo de cada variable numérica. Esto te da el rango real de los datos y te ayuda a detectar posibles errores que hayan pasado inadvertidos, así como a dimensionar correctamente los ejes de las visualizaciones posteriores.
Anota las respuestas a estas preguntas en un documento compartido del equipo. Este “diario de exploración” será muy útil para redactar la sección metodológica cuando presentes los resultados.

Build docs developers (and LLMs) love