Este proyecto forma parte de los Cursos de Verano UNED - 35.ª edición, Humanidades Digitales y descolonización.
Se basa en el trabajo realizado en el marco del proyecto Unlocking the Colonial Archive realizado en colaboración con Lancaster University y la Biblioteca Virtual Miguel de Cervantes. La presentación se encuentra disponible en el siguiente enlace.
Para este taller se han seleccionado un subconjunto de la colección Relaciones Geográficas of Mexico and Guatemala proporcionada por Benson Latin American Collection, LLILAS Benson Latin American Studies and Collections, The University of Texas at Austin.
En concreto se han seleccionado 10 obras a través de sus manifests en formato JSON. La licencia de las obras es Dominio Público.
Para realizar este taller es necesario instalar las siguientes herramientas:
- OpenRefine 3.6.0
- Extensión RDF Transform, se descarga y se descomprime en la carpeta webapp/extensions de la carpeta de instalación de OpenRefine
Los Jupyter Notebooks incluidos en este taller se pueden ejecutar en un navegador (p.ej. utilizando Binder) sin necesidad de instalar ningún software adicional. Sin embargo, para desarrollar y ejecutar los Jupyter Notebooks en un ordenador personal es necesario instalar:
-
En primer lugar, ejecuta el Jupyter Notebook notebooks/Extraccion_UCA2CSV.ipynb que transforma los datos originales (manifests en formato original JSON) a un fichero CSV (fichero de texto con columnas separadas por comas). Un fichero CSV es posible procesarlo fácilmente con la librería pandas.
-
El segundo paso consiste en modelar los datos extraídos con el vocabulario Schema.org que proporciona clases y propiedades para describir los recursos. Para ello utilizamos la herramienta OpenRefine para leer el fichero CSV y generar como resultado un fichero en formato RDF.El fichero openrefine/history.json incluye los pasos necesarios para transformar los datos proporcionados en el fichero CSV a RDF utilizando el vocabulario Schema.org. Como resultado obtenemos el fichero output/UNED_metadatos_csv.ttl
Nota: De forma opcional, y en el caso que la aplicación openrefine no funcione correctamente, es posible ejecutar el código del notebook notebooks/CSVtoRDF.ipynb
- El tercer paso se basa en la reutilización de los datos generados en el paso anterior. El notebook notebooks/SPARQLAnalysisDataset.ipynb muestra algunos ejemplos para consultar el repositorio generado.
Esta obra está bajo una Licencia Creative Commons Atribución 4.0 Internacional.
- Gustavo Candela, Javier Pereda, Dolores Sáez, Pilar Escobar, Alexander Sánchez, Andrés Villa Torres, Albert A. Palacios, Kelly McDonough, and Patricia Murrieta-Flores. 2023. An Ontological Approach for Unlocking the Colonial Archive. J. Comput. Cult. Herit. 16, 4, Article 74 (December 2023), 18 pages. https://doi.org/10.1145/3594727
- Seth van Hooland, Ruben Verborgh, y Max De Wilde, "Limpieza de datos con OpenRefine", traducido por María-Jesús Colmenero-Ruiz, Programming Historian en español 1 (2017), https://doi.org/10.46430/phes0017
- https://humanidadesdigitaleshispanicas.es/compartir-pantalla-con-gustavo-candela-14-de-noviembre-de-2023/
- https://humanidadesdigitaleshispanicas.es/cafe-con-gustavo-candela-4-de-abril-de-2023/
- https://data.nls.uk/projects/the-national-librarians-research-fellowship-in-digital-scholarship-2022-23/