Herramientas disponibles
LibreOffice Calc
Suite de oficina de código abierto compatible con formatos de Microsoft Office. LibreOffice Calc es su hoja de cálculo, ideal para abrir archivos CSV, XLS y ODS sin depender de software propietario. Funciona sin conexión a internet.
Google Sheets
Hoja de cálculo en la nube de Google. Permite trabajar colaborativamente en tiempo real, compartir datos con el equipo y conectar fácilmente con otras herramientas de Google. Requiere una cuenta de Google.
OpenRefine
Herramienta especializada en limpieza y transformación de datos desordenados. Permite agrupar valores similares, aplicar transformaciones masivas, reconciliar datos con Wikidata y exportar en múltiples formatos. Se ejecuta localmente en el navegador.
QuickStatements
Herramienta del ecosistema Wikimedia para subir lotes de datos estructurados a Wikidata de forma eficiente. Permite crear, modificar o eliminar declaraciones en múltiples ítems de Wikidata en una sola operación.
AntConc
Software de análisis lingüístico de corpus de texto. Útil para proyectos que trabajan con grandes volúmenes de texto: permite buscar concordancias, calcular frecuencias de palabras, analizar colocaciones y generar listas de palabras clave.
¿Qué herramienta usar para cada tarea?
La elección de la herramienta depende del tipo de datos, el tamaño del conjunto y las transformaciones que necesitas aplicar. Esta tabla te ayuda a elegir:
| Tarea | Herramienta recomendada |
|---|---|
| Abrir y explorar un CSV pequeño | LibreOffice Calc o Google Sheets |
| Trabajo colaborativo en tiempo real | Google Sheets |
| Limpiar datos con muchos valores inconsistentes | OpenRefine |
| Enriquecer datos con información de Wikidata | OpenRefine + reconciliación |
| Subir datos masivamente a Wikidata | QuickStatements |
| Analizar frecuencias y patrones en textos | AntConc |
Flujo de trabajo típico
Importar los datos
Abre tu archivo CSV o XLS en LibreOffice Calc o Google Sheets. Verifica que las columnas y tipos de datos se hayan importado correctamente.
Exploración inicial
Revisa el número de filas y columnas, identifica valores nulos o vacíos y comprende qué representa cada campo antes de hacer cambios.
Limpieza con OpenRefine
Importa el dataset en OpenRefine para aplicar transformaciones masivas: normalizar texto, corregir errores ortográficos, agrupar valores equivalentes y eliminar duplicados.
Enriquecimiento (opcional)
Si tu proyecto involucra entidades (personas, lugares, organizaciones), usa la función de reconciliación de OpenRefine para vincularlas con Wikidata y agregar identificadores únicos.