Problemas con los datos

Valores ausentes

Los valores ausentes son celdas vacías donde debería haber un dato. Pueden deberse a que la persona no respondió una pregunta, a un error en la recogida de datos o a un fallo en la exportación del archivo.Cómo detectarlos: filtra por celdas en blanco en cada columna o usa una fórmula como CONTAR.BLANCO() para contar cuántos hay.Qué hacer: si el campo es obligatorio y el dato falta, valora si la fila completa debe excluirse del análisis. Si es un campo opcional, puedes conservar la fila y simplemente tener en cuenta que ese valor no está disponible.

Duplicados

Los duplicados aparecen cuando un mismo registro está presente más de una vez. Esto ocurre frecuentemente cuando alguien rellena un formulario dos veces o cuando se combinan datos de varias fuentes sin depurarlos.Ejemplo: imagina que trabajas con los datos de una encuesta y descubres que tres personas han enviado sus respuestas dos veces. Esos duplicados deben eliminarse, porque de lo contrario esas personas tendrán más peso del que les corresponde en el análisis.Cómo detectarlos: la mayoría de las hojas de cálculo tienen una función de eliminar duplicados (en Google Sheets: Datos → Limpieza de datos → Eliminar duplicados). También puedes usar la función CONTAR.SI() para identificar valores repetidos en una columna clave.

Inconsistencias de formato y texto

Las inconsistencias aparecen cuando el mismo valor se ha introducido de formas distintas. Son especialmente frecuentes en respuestas abiertas o campos de texto libre.Ejemplo: en una pregunta de sí/no, puedes encontrar las variantes SÍ, sí, SI, Si, SII! o incluso s. Todas representan la misma respuesta, pero la hoja de cálculo las tratará como valores distintos al agrupar o contar.Cómo resolverlo: unifica todas las variantes en un valor normalizado. Puedes usar buscar y reemplazar para corregirlas de forma masiva, o la función MINUSC() / MAYUSC() para homogeneizar el uso de mayúsculas antes de comparar.

Errores de codificación de caracteres

Si los caracteres especiales del español (tildes, eñes, comillas tipográficas) se importaron incorrectamente, aparecerán como símbolos extraños: Ã© en lugar de é, Ã± en lugar de ñ, etc.Causa: el archivo fue guardado con una codificación (por ejemplo, Latin-1) pero se importó con otra (UTF-8), o viceversa.Cómo resolverlo: la solución más fiable es repetir la importación seleccionando la codificación correcta. Si ya tienes el dataset en la hoja de cálculo y no quieres volver a importar, puedes usar buscar y reemplazar para corregir los caracteres afectados uno a uno.

Valores atípicos

Un valor atípico (o outlier) es un dato que se aleja significativamente del resto de los valores de su columna. No siempre es un error: puede ser un caso real y legítimo, pero merece revisión antes de incluirlo en el análisis.Ejemplo: en los datos de calificaciones de un examen, todo el alumnado tiene entre 4 y 8 puntos, pero una persona tiene 15. Dado que la escala máxima es 10, ese valor es claramente erróneo y debe corregirse o eliminarse. En cambio, si una persona saca 10 cuando la media es 5, eso es atípico pero perfectamente válido.Cómo detectarlos: ordena cada columna numérica de mayor a menor y de menor a mayor para identificar los extremos. También puedes calcular la media y la desviación típica para detectar valores que se alejen más de lo esperado.

Introducción

Recopilación de Datos

Limpieza y Análisis

Visualización

Herramientas y Recursos

Proceso de revisión

Problemas más habituales

Build docs developers (and LLMs) love

Introducción

Recopilación de Datos

Limpieza y Análisis

Visualización

Herramientas y Recursos

​Proceso de revisión

​Problemas más habituales

Build docs developers (and LLMs) love

Proceso de revisión

Problemas más habituales