Este laboratorio complementa el ciclo general de Datosfera Lab con una mirada más analítica y teórica. Los materiales de cada sesión están pensados para trabajar en conjunto: primero la reflexión conceptual, luego la práctica con herramientas.
Sesión 1: Presentación del laboratorio
La primera sesión introduce el marco teórico de los estudios críticos de datos y presenta la metodología de trabajo del laboratorio.Sesión 2: Recopilación de datos digitales
Esta sesión cubre técnicas para recopilar datos de plataformas digitales usando herramientas especializadas de la Digital Methods Initiative (DMI).Zeeschuimer — captura de datos de plataformas
Zeeschuimer es una extensión de Firefox desarrollada por la DMI que captura datos de plataformas como TikTok, Instagram y Twitter mientras navegas por ellas.Descargar Zeeschuimer de GitHub
Accede al repositorio de Zeeschuimer en GitHub y descarga el archivo ZIP de la extensión desde la sección de releases.
Abrir la página de depuración de Firefox
En Firefox, navega a la siguiente URL para acceder al gestor de extensiones en modo desarrollador:
Instalar la extensión
Descomprime el archivo ZIP descargado. En la página de depuración, haz clic en Cargar complemento temporal y selecciona el archivo
manifest.json dentro de la carpeta descomprimida de Zeeschuimer.Usar la extensión
Abre una nueva pestaña en Firefox. La extensión de Zeeschuimer aparecerá en la barra de herramientas. Navega por la plataforma que quieres capturar y la extensión registrará automáticamente los datos en formato NDJSON.
Convertir los datos a CSV
Usa Zeehaven para convertir los archivos NDJSON generados por Zeeschuimer a formato CSV, compatible con hojas de cálculo y otras herramientas de análisis.
Scraper de Google — Digital Methods Initiative
El scraper de motores de búsqueda de la DMI permite recopilar resultados de búsqueda de Google de forma sistemática.YouTube Data Tools
Herramienta de la DMI para recopilar datos de YouTube: videos, comentarios, canales y redes de relación entre videos.Recursos del investigador Bernhard Rieder (DMI)
Bernhard Rieder es investigador de la Universidad de Ámsterdam y uno de los principales desarrolladores de las herramientas de la DMI.- Canal de YouTube de Bernhard Rieder — tutoriales y charlas sobre métodos digitales y análisis de plataformas
- Engines of Order: A Mechanology of Algorithmic Techniques — libro de referencia sobre el funcionamiento político y técnico de los algoritmos
Lectura de referencia
Sesión 3: Visualización de datos
Esta sesión introduce herramientas de visualización para transformar los datos recopilados en representaciones visuales comprensibles. Herramientas de visualización usadas en esta sesión:- Tableau Public — plataforma de dashboards e infografías interactivas
- Gephi — software para visualización y análisis de redes
- Cosmograph — visualización de redes de gran escala en el navegador
Sesión 4: Análisis de texto
Esta sesión aborda herramientas de procesamiento y posprocesamiento de texto para el análisis de corpus. Herramienta principal:- AntConc — software gratuito para análisis lingüístico de corpus de texto. Permite calcular frecuencias, buscar concordancias, analizar colocaciones y generar listas de palabras clave.
Sesión 5: Transcripciones y análisis de frecuencias
La última sesión combina la descarga automática de transcripciones de videos de YouTube con el análisis de frecuencias léxicas mediante bigramas. Herramientas:- Descarga de transcripciones de YouTube con Whisper — cuaderno de Google Colab que usa el modelo Whisper de OpenAI para transcribir automáticamente el audio de videos de YouTube.
- Repositorio para generación de bigramas — código compartido por el Profesor Víctor Ábrego para el análisis de bigramas a partir de corpus de texto.
Los materiales del repositorio de bigramas fueron compartidos por el Profesor Víctor Ábrego. Si usas este código en tu proyecto, incluye el reconocimiento correspondiente.