Skip to main content
El almacenamiento organizado de datos es un paso fundamental en cualquier proyecto de ciencia de datos. Contar con un espacio compartido y accesible para todo el equipo facilita la colaboración, evita la pérdida de archivos y garantiza que todos trabajen con las versiones más recientes de los datos.

Opciones de almacenamiento

Google Drive

Plataforma de almacenamiento en la nube de Google. Permite subir, organizar y compartir archivos de cualquier tipo. Incluye integración directa con Google Sheets, Docs y otros servicios de Google Workspace. Ideal para equipos que ya usan cuentas de Google.

Wikimedia Commons

Repositorio de archivos multimedia libres vinculado al ecosistema Wikimedia. Útil para almacenar y publicar conjuntos de datos e imágenes que serán de acceso público bajo licencias libres.

GitHub / GitLab

Plataformas de control de versiones que también permiten almacenar conjuntos de datos pequeños y medianos. Especialmente útiles cuando el equipo trabaja con scripts o código además de los datos.

Internet Archive

Biblioteca digital sin fines de lucro que permite subir y preservar archivos de forma gratuita y permanente. Adecuado para datos que deben permanecer accesibles a largo plazo.

Buenas prácticas para organizar tus archivos

Una estructura clara de carpetas ahorra tiempo y evita confusiones, especialmente en proyectos colaborativos. Considera organizar tus carpetas por fase del proyecto:
Proyecto_Datosfera/
├── 01_datos_brutos/        # Archivos originales sin modificar
├── 02_datos_limpios/       # Versiones procesadas y listas para analizar
├── 03_analisis/            # Hojas de cálculo y scripts de análisis
├── 04_visualizaciones/     # Gráficos y exportaciones finales
└── 05_documentacion/       # Notas, metodología y referencias
Cuando uses Google Drive para trabajo en equipo, crea una unidad compartida (no compartas desde tu unidad personal). Las unidades compartidas pertenecen al equipo, no a una cuenta individual, lo que evita que los archivos se pierdan si alguien abandona el proyecto.

Convenciones de nombrado de archivos

Adopta convenciones consistentes para nombrar archivos desde el inicio del proyecto:
  • Usa guiones bajos (_) en lugar de espacios: datos_encuesta_2024.csv
  • Incluye fechas en formato ISO (AAAA-MM-DD): datos_2024-03-15.csv
  • Añade un sufijo de versión cuando sea necesario: datos_limpio_v2.csv
  • Evita caracteres especiales como tildes, ñ o símbolos
Guarda siempre una copia de los datos originales sin modificar en una carpeta separada. Cualquier transformación o limpieza debe hacerse sobre copias, nunca sobre el archivo fuente original.

Build docs developers (and LLMs) love