Skip to main content
El procesamiento de datos abarca todas las operaciones que transforman datos brutos en información lista para analizar: importación, limpieza, normalización, filtrado y enriquecimiento. Datosfera Lab prioriza herramientas libres y gratuitas que no requieren conocimientos de programación.

Herramientas disponibles

LibreOffice Calc

Suite de oficina de código abierto compatible con formatos de Microsoft Office. LibreOffice Calc es su hoja de cálculo, ideal para abrir archivos CSV, XLS y ODS sin depender de software propietario. Funciona sin conexión a internet.

Google Sheets

Hoja de cálculo en la nube de Google. Permite trabajar colaborativamente en tiempo real, compartir datos con el equipo y conectar fácilmente con otras herramientas de Google. Requiere una cuenta de Google.

OpenRefine

Herramienta especializada en limpieza y transformación de datos desordenados. Permite agrupar valores similares, aplicar transformaciones masivas, reconciliar datos con Wikidata y exportar en múltiples formatos. Se ejecuta localmente en el navegador.

QuickStatements

Herramienta del ecosistema Wikimedia para subir lotes de datos estructurados a Wikidata de forma eficiente. Permite crear, modificar o eliminar declaraciones en múltiples ítems de Wikidata en una sola operación.

AntConc

Software de análisis lingüístico de corpus de texto. Útil para proyectos que trabajan con grandes volúmenes de texto: permite buscar concordancias, calcular frecuencias de palabras, analizar colocaciones y generar listas de palabras clave.

¿Qué herramienta usar para cada tarea?

La elección de la herramienta depende del tipo de datos, el tamaño del conjunto y las transformaciones que necesitas aplicar. Esta tabla te ayuda a elegir:
TareaHerramienta recomendada
Abrir y explorar un CSV pequeñoLibreOffice Calc o Google Sheets
Trabajo colaborativo en tiempo realGoogle Sheets
Limpiar datos con muchos valores inconsistentesOpenRefine
Enriquecer datos con información de WikidataOpenRefine + reconciliación
Subir datos masivamente a WikidataQuickStatements
Analizar frecuencias y patrones en textosAntConc

Flujo de trabajo típico

1

Importar los datos

Abre tu archivo CSV o XLS en LibreOffice Calc o Google Sheets. Verifica que las columnas y tipos de datos se hayan importado correctamente.
2

Exploración inicial

Revisa el número de filas y columnas, identifica valores nulos o vacíos y comprende qué representa cada campo antes de hacer cambios.
3

Limpieza con OpenRefine

Importa el dataset en OpenRefine para aplicar transformaciones masivas: normalizar texto, corregir errores ortográficos, agrupar valores equivalentes y eliminar duplicados.
4

Enriquecimiento (opcional)

Si tu proyecto involucra entidades (personas, lugares, organizaciones), usa la función de reconciliación de OpenRefine para vincularlas con Wikidata y agregar identificadores únicos.
5

Exportar el dataset limpio

Exporta el resultado como CSV y guárdalo en tu carpeta de datos limpios. Este archivo será la entrada para la fase de análisis y visualización.

Build docs developers (and LLMs) love