Skip to main content
Cuando ya te hayas familiarizado con los datos a través de la exploración general, darás paso al análisis principal. A diferencia de la exploración, aquí partes de un objetivo y una pregunta claros a los que quieres dar respuesta. Por eso este análisis es mucho más dirigido y el método debe haberse definido de antemano.
No empieces el análisis principal sin haber fijado antes qué pregunta quieres responder. Un análisis sin objetivo claro produce resultados que son difíciles de interpretar y comunicar.

Validación por expertos

Una cuestión que no debe pasarse por alto es la validación por parte de personas expertas en el tema que estás analizando. Si estás analizando la evolución del número de matriculaciones de un centro educativo, una vez tengas los resultados debes consultarlos con la persona responsable del centro. No solo para que confirme si hay errores en el análisis, sino para que aporte una lectura valiosa que tú, como analista de datos, quizás no puedas dar por falta de contexto.
La validación experta no es una revisión de los cálculos técnicos — eso lo compruebas tú. Es una interpretación del significado de los resultados desde el conocimiento del dominio.

Métodos estadísticos básicos

Existen varios métodos estadísticos básicos que pueden usarse en múltiples contextos. La elección depende del tipo de pregunta que quieres responder y del tipo de variables con las que trabajas.
La estadística descriptiva resume y describe las características principales de un conjunto de datos. Es el punto de partida de casi cualquier análisis.Las medidas más utilizadas son:
  • Media: valor promedio de una variable numérica. Usa PROMEDIO() en tu hoja de cálculo.
  • Mediana: valor central cuando los datos están ordenados. Menos sensible a valores extremos que la media. Usa MEDIANA().
  • Moda: valor que aparece con más frecuencia. Útil para variables categóricas. Usa MODA().
  • Desviación típica: mide cuánto se dispersan los valores alrededor de la media. Usa DESVEST().
  • Valores mínimo y máximo: usa MIN() y MAX().
Calcula estas medidas para cada variable numérica relevante y compáralas entre grupos si el dataset lo permite.
Agrupar los datos por una variable categórica (curso, año, región, género…) permite comparar subconjuntos y detectar diferencias significativas entre grupos.En una hoja de cálculo puedes hacerlo con:
  • Tablas dinámicas: la herramienta más potente para agrupar, resumir y cruzar variables sin escribir fórmulas. Disponible en Google Sheets (Insertar → Tabla dinámica), LibreOffice Calc y Excel.
  • PROMEDIO.SI() / CONTAR.SI() / SUMAR.SI(): fórmulas que calculan una métrica solo para las filas que cumplen una condición (por ejemplo, la media de notas solo para los alumnos de 2.º curso).
A veces el análisis requiere centrarse en un subconjunto de los datos: solo los registros de un año concreto, solo las respuestas de un grupo específico o solo los valores por encima de cierto umbral.Usa los filtros automáticos de tu hoja de cálculo para explorar subconjuntos de forma visual, o crea una hoja auxiliar con los datos filtrados mediante fórmulas como FILTRAR() (disponible en versiones recientes de Google Sheets y Excel).
Contar cuántas veces aparece cada valor en una variable categórica (o en rangos de una variable numérica) te da la distribución de esa variable.
  • Para variables categóricas: usa CONTAR.SI() para cada categoría posible, o una tabla dinámica con recuento.
  • Para variables numéricas: agrupa los valores en intervalos (por ejemplo, notas de 0-2, 3-4, 5-6, 7-8, 9-10) y cuenta cuántos registros caen en cada intervalo.
Las distribuciones son la base de los gráficos de barras y los histogramas que crearás en la fase de visualización.
Si tu pregunta implica comparar dos o más grupos (por ejemplo, ¿estudian más horas los alumnos de bachillerato que los de la ESO?), calcula las mismas métricas para cada grupo y ponlas en paralelo.Para comparaciones simples, una tabla con los promedios, medianas y tamaños de cada grupo es suficiente. Muestra siempre el tamaño de cada grupo (número de registros) para que quien lea los resultados pueda valorar su representatividad.

Interpreta los resultados con contexto

Un resultado numérico sin contexto raramente tiene valor. Cuando presentes los resultados del análisis, responde siempre a estas tres preguntas:
  1. ¿Qué dice el número? Describe el resultado en términos concretos y comprensibles.
  2. ¿Es esperable o sorprendente? Compáralo con lo que cabría esperar según el contexto del proyecto.
  3. ¿Qué puede explicarlo? Propón hipótesis sobre las causas, especialmente si has detectado diferencias entre grupos o valores inesperados.
Evita afirmar causalidad a partir de datos correlacionales. Que dos variables varíen juntas no significa que una cause la otra. Describe los patrones que observas y deja que las personas expertas aporten la interpretación causal.

Siguiente fase

Con el análisis completado y validado, el siguiente paso es transformar los resultados en visualizaciones que los comuniquen de forma clara y accesible.

Introducción a la visualización

Aprende los principios básicos para elegir el tipo de gráfico adecuado a cada análisis.

Elaboración de visualizaciones

Crea gráficos efectivos con tu hoja de cálculo o con herramientas especializadas.

Build docs developers (and LLMs) love