Humanidades Digitales y patrimonio cultural: proyectos y tendencias
COMITÉ CIENTÍFICO DE LA EDITORIAL TIRANT HUMANIDADES Manuel Asensi Pérez Catedrático de Teoría de la Literatura y de la Literatura Comparada Universitat de València
Ramón Cotarelo Catedrático de Ciencia Política y de la Administración de la Facultad de Ciencias Políticas y Sociología de la Universidad Nacional de Educación a Distancia
M.ª Teresa Echenique Elizondo Catedrática de Lengua Española Universitat de València
Juan Manuel Fernández Soria Catedrático de Teoría e Historia de la Educación Universitat de València
Pablo Oñate Rubalcaba Catedrático de Ciencia Política y de la Administración Universitat de València
Joan Romero Catedrático de Geografía Humana Universitat de València
Juan José Tamayo Director de la Cátedra de Teología y Ciencias de las Religiones Universidad Carlos III de Madrid
Procedimiento de selección de originales, ver página web: www.tirant.net/index.php/editorial/procedimiento-de-seleccion-de-originales
Anna Isabel Peirats Navarro José Antonio Calvo Gómez
Coordinadores
Humanidades Digitales y patrimonio cultural: proyectos y tendencias
tirant humanidades Valencia, 2023
Copyright ® 2023 Todos los derechos reservados. Ni la totalidad ni parte de este libro puede reproducirse o transmitirse por ningún procedimiento electrónico o mecánico, incluyendo fotocopia, grabación magnética, o cualquier almacenamiento de información y sistema de recuperación sin permiso escrito de los autores y del editor. En caso de erratas y actualizaciones, la Editorial Tirant Humanidades publicará la pertinente corrección en la página web www.tirant.com.
© Varios autores y autoras. Coordinadores: Anna Isabel Peirats Navarro (Universidad Católica de Valencia San Vicente Mártir) y José Antonio Calvo Gómez (Universidad Católica de Ávila)
© TIRANT HUMANIDADES EDITA: TIRANT HUMANIDADES C/ Artes Gráficas, 14 - 46010 - Valencia TELFS.: 96/361 00 48 - 50 FAX: 96/369 41 51 Email:tlb@tirant.com www.tirant.com Librería virtual: www.tirant.es DEPÓSITO LEGAL: V-3699-2023 ISBN: 978-84-1183-008-9 MAQUETA: Disset Ediciones Si tiene alguna queja o sugerencia, envíenos un mail a: atencioncliente@tirant.com. En caso de no ser atendida su sugerencia, por favor, lea en www.tirant.net/index.php/empresa/politicas-deempresa nuestro Procedimiento de quejas. Responsabilidad Social Corporativa: http://www.tirant.net/Docs/RSCTirant.pdf
COMITÉ CIENTÍFICO DEL VOLUMEN Daniele Solvi Università della Campania “Luigi Vanvitelli”
Francesca Manzari Sapienza-Università di Roma
Rafael Alemany Ferrer Universitat d’Alacant
Giovanni Paolo Maggioni Università degli Studi del Molise
Rubén Gregori IVEMIR-UCV, Universidad Católica de Valencia
Llúcia Martín Pascual Universitat d’Alacant
Marco Guida Pontificia Università Gregoriana, Roma
Rafael Roca Guitart Universitat de València
Renana Bartal Israel, Tel-Aviv University
Índice Serán ceniza, más tendrán sentido: orígenes de las humanidades digitales en España................................................................................................................... Francisco Marcos Marín
13
1. 1971-1974 La situación inicial..............................................................................
13
El Centro de Cálculo de la Universidad Complutense.....................................
14
La Real Academia Española............................................................................................
14
Problemas presentes en 1971.........................................................................................
15
2. 1973, las primeras publicaciones propiamente lingüísticas.......................
17
3. 1974-1992................................................................................................................
20
4. Referencias............................................................................................................
32
Software y otras tecnologías para el desarrollo de proyectos de humanidades digitales ............................................................................................................... Rubén Alcaraz Martínez
35
1. Introducción...........................................................................................................
35
2. Sistemas de gestión de colecciones digitales..............................................
36
2.1 Omeka Classic.................................................................................................................
37
2.2 Omeka S............................................................................................................................
40
2.3 CollectiveAccess............................................................................................................
42
2.4 Dédalo................................................................................................................................
45
2.5 ResearchSpace...............................................................................................................
48
3. Herramientas para la creación de exposiciones virtuales, narrativas y storytelling ....................................................................................................
50
3.1 Timeline JS, Storymap JS y Storyline JS..............................................................
50
3.2 Shorthand.........................................................................................................................
52
3.3 ArcGIS StoryMaps........................................................................................................
54
3.4 MapsAlive.........................................................................................................................
55
4. Software de visualización de datos.................................................................
56
4.1 Tableau................................................................................................................................
56
4.2 Highcharts........................................................................................................................
58
4.3 Datawrapper...................................................................................................................
60
4.6 D3..........................................................................................................................................
61
5. Software para la creación y gestión de vocabularios controlados...........
64
10
5.1. Tematres............................................................................................................................
64
5.2. Protégé..............................................................................................................................
65
6. Cartografía digital................................................................................................
67
6.1. Google Maps...................................................................................................................
67
6.2. Leaflet................................................................................................................................
69
7. Transcripciones y minería de datos..................................................................
70
7.1. Scripto.................................................................................................................................
70
7.2. FromThePage..................................................................................................................
72
7.3. OpenRefine.....................................................................................................................
73
8. Otros directorios de recursos...........................................................................
74
9. Referencias............................................................................................................
75
Digitalización del Patrimonio Cultural Inmaterial para su preservación y transmisión: El Proyecto Europeo «MEDITELLER»............................................. David Sánchez Sánchez
79
1. Introducción...........................................................................................................
79
2. Precedentes para el proyecto...........................................................................
81
3. Digitalización del PCI en zonas rurales...........................................................
83
4. La narrativa digital para la transmisión de valores culturales tradicionales..............................................................................................................
85
5. Plan de audiencias y formación de operadores culturales.........................
87
6. Digitalización para la democratización cultural............................................
90
7. Comunicación y divulgación de resultados para la cohesión transnacional..............................................................................................................
91
8. Referencias............................................................................................................
94
Dialogyca BDDH: una base de datos y biblioteca virtual de método filológico..................................................................................................................................... Germán Redondo Pérez
97
Referencias................................................................................................................
121
Preservación, difusión y reutilización del patrimonio digital: experiencias y estrategia en la Biblioteca Nacional de España................................................. Alicia Pastrana García, José Carlos Cerdán Medina, Elena Sánchez Nogales
123
Introducción..............................................................................................................
124
1. Las colecciones digitales de la Biblioteca Nacional de España.................
124
1.1. La digitalización de las colecciones analógicas............................................
125
Índice
1.1.1. Líneas de digitalización................................................................................
126
1.1.2. El proceso de digitalización......................................................................
127
1.2. Acceso a las colecciones digitalizadas..............................................................
129
2. Documentos nacidos digitales.........................................................................
130
2.1. La salvaguardia del patrimonio nacido digital..............................................
131
2.2. La legislación sobre depósito legal y el patrimonio nacido digital...
132
2.3. El Archivo de la Web Española............................................................................
134
2.3.1. Herramientas para el archivado web..................................................
135
2.3.2. Un viaje por las colecciones del Archivo de la Web Española......................................................................................................................
137
2.3.3. La colaboración como base del éxito del proyecto....................
140
2.4. El depósito de publicaciones en línea.............................................................
141
2.5. El acceso a las colecciones nacidas digitales................................................
142
2.6. Patrimonio nacido digital y memoria...............................................................
144
3. Reutilización de datos y colecciones digitales..............................................
145
3.1. Preservar, dar acceso, difundir: un paso más con BNElab y el impulso de la reutilización digital......................................................................
145
3.2. Reutilización de datos .............................................................................................
147
3.3. Reutilización de colecciones y otros recursos digitales: nuevos entornos para el enriquecimiento y la cooperación................................
151
3.3.1. Enriquecimiento colaborativo en ComunidadBNE.....................
152
3.3.2. Patrimonio, memoria y educación: BNEscolar..............................
153
3.4. Presente y futuro.........................................................................................................
157
4. Referencias............................................................................................................
159
Los principios FAIR y el Proyecto Humboldt Digital. Una confrontación...... Antonio Rojas Castro
161
1. Introducción...........................................................................................................
161
2. Relectura crítica de los principios FAIR...........................................................
162
2.1 La crítica en las Humanidades Digitales.............................................................
163
2.2 ¿Qué son los principios FAIR?................................................................................
166
3. Conceptualización del proyecto......................................................................
169
4. Retos de implementación .................................................................................
173
4.1. Facilidad de encontrar................................................................................................
174
4.2. Accesibilidad...................................................................................................................
175
4.3. Interoperabilidad..........................................................................................................
177
Índice
11
12
4.4. Reutilización...................................................................................................................
178
5. Conclusiones.........................................................................................................
180
6. Referencias............................................................................................................
182
CLARE (Corpus Latinum Referens): Un proyecto digital al servicio de la investigación y la docencia.......................................................................................... Marco Antonio Coronel Ramos (UVEG), Mercedes García Ferrer (Grupo GALATEA)
185
1. Introducción...........................................................................................................
185
2. CLARE....................................................................................................................
188
3. Un ejemplo de uso de CLARE en la investigación.......................................
191
4. Referencias............................................................................................................
198
Humanidades Digitales aplicadas a la enseñanza del inglés como lengua extranjera: estrategias metacognitivas para la mejora de listening y speaking..................................................................................................................................... Mª Paz Marín García, Lluïsa Astruc
199
1. Humanidades Digitales Aplicadas a la Enseñanza del Inglés como Lengua Extranjera: Estrategias Metacognitivas para la Mejora de Listening y Speaking.......................................................................................
199
1.1 Fundamentos Teóricos................................................................................................
200
2. Método...................................................................................................................
204
2.1 Diseño .................................................................................................................................
204
2.2 Participantes ...................................................................................................................
209
2.3 Instrumentos...................................................................................................................
209
2.4 Procedimiento................................................................................................................
209
3. Resultados.............................................................................................................
210
4. Discusión................................................................................................................
214
5. Conclusiones.........................................................................................................
216
6. Referencias............................................................................................................
216
Índice
Serán ceniza, más tendrán sentido: orígenes de las humanidades digitales en España Francisco Marcos Marín
Professor Emeritus University of Texas, San Antonio
Se recogen en este capítulo los movimientos iniciales y proyectos de humanidades digitales sobre la lengua española entre 1971 y 1993. Se trata, sobre todo, de proyectos españoles desarrollados principalmente en relación con universidades y centros de investigación de Madrid. Se hace referencia también a otros centros y otros proyectos, sobre todo cuando se iniciaron o desarrollaron en colaboración con esos centros madrileños. Lo que se intenta presentar es sobre todo un testimonio prosopográfico, en línea con otros trabajos del autor (Marcos Marín, 2009, pp. 387-415), con la intención de ofrecer una imagen que pueda ser utilizada desde el punto de vista histórico, como un retrato de un momento de la historia cultural de España y de la lengua española y del trabajo de grupo que ello supuso. Todo intento histórico suele ir acompañado de una periodización. La que se propone, simplemente para invitar a la reflexión e ir logrando resultados más descriptivos, es muy básica y se divide en tres momentos: 1) 1971-1974 La situación inicial; 2) 1973, las primeras publicaciones propiamente lingüísticas en el campo computacional; 3) 1974-1992, un período que puede ser dividido fácilmente pero que, por el momento, sirve para presentar el avance definitivo de esta rama de la ciencia y su metodología, que permitió el paso al desarrollo mucho mayor que se vive desde 1993 y que queda fuera de estas páginas. 1. 1971-1974 La situación inicial
En el inicio destacan dos instituciones, el Centro de Cálculo de la Universidad de Madrid, Complutense, única en ese momento en la capital y la Real Academia Española, que indirectamente abrió una vía al desarrollo digital.
El Centro de Cálculo de la Universidad Complutense.
En 1971 la empresa IBM cedió al Centro de Cálculo de la Universidad de Madrid un equipo compuesto por ordenadores usados y que estaban siendo descatalogados: 1.
Una calculadora IBM 1401, con una configuración de memoria de 16 K, en bloques de ferrita. Dejó de venderse en 1971 y se usaba para leer las fichas perforadas y pasarlas a cinta magnética.
2.
Una calculadora IBM 7090, que ya usaba transistores, no tubos de vacío, y que, aunque podía leer 250 fichas por minuto, recibía ya la información en cintas magnéticas generadas en la 1401. Su memoria era de 32 K. El registro de palabra de las instrucciones era fijo: 36 bits y el máximo de almacenamiento por acumulación (para sumas, por ejemplo) era de 38 bits.
3.
Una impresora capaz de imprimir 600 líneas por minuto y el equipo auxiliar correspondiente.
El Centro inició también la publicación de un Boletín, en el que investigadores asociados con propuestas propias trataron en ocasiones cuestiones lingüísticas, especialmente Ernesto García Camarero, que fue primero subdirector y luego director del Centro. En el proceso de contacto y ampliación de posibilidades se puso en contacto con la Facultad de Filosofía y Letras y la cátedra de Rafael Lapesa, lo que permitió la formación de un primer grupo de investigación entre el Centro y la Facultad. La Real Academia Española
Por su parte, la Academia contrató al Profesor de la Universidad de Quebec, Ignacio Soldevila, para iniciar el proceso de redacción del Diccionario con medios electrónicos. La Universidad de Quebec había iniciado trabajos de creación de diccionarios con apoyo electrónico y se pensó que la incorporación de ordenadores podría agilizar el trabajo, que estaba pensado en principio para el Diccionario general, no para el histórico. El proyecto no cuajó e Ignacio Soldevila regresó a Quebec más adelante; pero la semilla estaba sembrada y la RAE empezó un contacto con otras instituciones, como el Centro de Pisa, en Italia.
14
Francisco Marcos Marín
Problemas presentes en 1971
De la descripción precedente del material informático disponible se puede deducir que las diferencias entre las posibilidades computacionales en aquellos años y las actuales son abismales. En primer lugar estaba el proceso de entrada de datos, inicialmente en tarjetas perforadas de 80 caracteres, incluyendo los de control, creadas con máquinas que sólo disponían del teclado estándar norteamericano, reducido: sólo letras mayúsculas, sin eñe ni acentos. Estas fichas se copiaban en cintas magnéticas que se procesaban después.
Figura 1
La capacidad de los ordenadores para procesar tenía dos limitaciones internas y una externa. Las limitaciones internas eran la memoria y los procesadores.
Serán ceniza, más tendrán sentido: orígenes de las humanidades digitales en España
15
Figura 2
En la imagen superior se muestra una matriz de memoria de 32×32 con la que se obtenía un total de 1.024 bits, es decir un kilobit. Para hacernos una idea, en 1960 la densidad era de 32 kilobits por metro cúbico y el precio era aproximadamente de un dólar por bit1. Entre 1970 y 1971 se empezó a solucionar este problema, porque en octubre de 1970 Intel lanzó su chip DRAM (Dynamic Random Access Memory) Intel 1103, culminación de la técnica de fabricación de semiconductores en circuitos integrados con 1 kilobit de capacidad; pero los centros de cálculo españoles tuvieron que ir sustituyendo sus máquinas poco a poco.
1
16
https://clipset.com/asi-era-1-kilobit-de-memoria-hace-50-anos/ [6 mayo 2022].
Francisco Marcos Marín
Figura 3
En resumen, puede decirse que las memorias mejoraron tras 1971, así como la capacidad de los procesadores. Otra limitación, ésta de carácter externo era la necesidad de crear lenguajes formales que fueran aplicables con comodidad a los trabajos lingüísticos. Estos se hicieron en primer lugar en Fortran, un lenguaje para el cálculo matemático, sobre todo, y en Cobol, un lenguaje para aplicaciones administrativas. Faltaba mucho tiempo para el PL1 o el C++, por no hablar de los lenguajes lógicos posteriores o Java. 2. 1973, las primeras publicaciones propiamente lingüísticas
En el verano de 1972 la RAE envió a FMM2 al Istituto di Lingüística Computazionale de Pisa, Italia. Antonio Zampolli3, un maestro muy llorado, consiguió
2 3
Prefiero utilizar estas siglas en lugar de estar repitiendo “el autor de estas páginas” o paráfrasis de esa frase. http://www.ilc.cnr.it/it/content/antonio-zampolli-il-fondatore-dellilc [18/11/2022]
Serán ceniza, más tendrán sentido: orígenes de las humanidades digitales en España
17
reunir los veranos en Pisa a los lingüistas generales y computacionales más famosos de la época, de Lyons a Chomsky, entre los primeros o Martin Kay, como programador lógico, entre los segundos, así como lexicógrafos como Bernard Quemada, que ya trabajaba en el Trésor de la Langue Française. Un sistema de medias becas permitió a varios investigadores españoles, de varias universidades, acudir a Pisa, donde también se encontraron con mexicanos como Luis Fernando Lara y su equipo, que trabajaban en el Diccionario del español de México. Esta colaboración con Pisa y presencia en los cursos de verano se mantuvo a partir de entonces. El Centro de Cálculo de la Complutense había ofrecido la posibilidad de colaboración a la Facultad de Letras y se formó un equipo integrado por I. del Campo, I. González, Ma. T. Molina, del mundo de la informática y FMM del de la lingüística. Se uniría esporádicamente otro filólogo, M. Ariza. Se plantearon dos objetivos complementarios: 1.
El análisis sintáctico automático como ayuda para la elaboración electrónica de diccionarios.
2.
Un mapa electrónico de la Península Ibérica, para poder situar electrónicamente en él datos de investigaciones dialectales, diacrónica y sincrónicas.
Los artículos correspondientes a estas investigaciones se publicaron en el llamado entonces Boletín del Centro de Cálculo de la Universidad de Madrid, 23, septiembre de 1973. Por lo que sé, el proyecto de un mapa electrónico para trabajos lingüísticos fue el primero de su clase en el mundo. El lenguaje de programación utilizado fue también novedoso, se trataba de SNOBOL, un intento de añadir más posibilidades lingüísticas a la programación en COBOL. Algunos ejemplos pueden dar idea de los objetivos buscados y los resultados que se podían alcanzar con todas las limitaciones de aquellos días. Se observará en la gramática la inclusión de rasgos morfológicos, sintácticos y semánticos y en las reglas el planteamiento transformacional propio del momento.
18
Francisco Marcos Marín
Figura 4
Figura 5
Para mostrar las aplicaciones del mapa a la filología se digitalizaron los datos de una investigación realizada por M. Ariza sobre la geografía lingüística y la toponimia de la ciruela4:
Figura 6
4
Corríjase en el mapa PRUNUM.
Serán ceniza, más tendrán sentido: orígenes de las humanidades digitales en España
19
Figura 7
3. 1974-1992
Entre 1974 y 1984 se produjo en la lingüística computacional en España un período que podría llamarse silencioso. Se publicaron artículos, se escribieron tesis o se dieron cursos y conferencias; pero más que de proyectos, puede hablarse de líneas de investigación en distintas universidades, sobre todo relacionados con graduados de las universidades de Madrid y Barcelona. Es una época de consolidación de posiciones administrativas, como profesores universitarios. Uno de los campos que se desarrolló más pronto fue el de la Lexicografía. Manuel Alvar Ezquerra fue a estudiar a París con Bernard Quemada y, tras consolidar su situación profesional al regreso a España, empezó a trabajar en diccionarios basados en corpus con fines comerciales. La idea de diccionarios basados en corpus ya había sido desarrollada en México durante muchos años; pero en España supuso algo nuevo y contó con el suficiente apoyo editorial para poder hacerse realidad. Por otro lado, conviene recordar que España ingresó en la entonces llamada Comunidad Económica Europea el 12 de junio de 1985. Este hecho supuso la integración de lingüistas españoles en programas europeos, la posibilidad de adquirir material informático ultramoderno y de participar en coloquios y actividades en
20
Francisco Marcos Marín