Materia: Métodos Digitales Alumno: Fernando Moisés Ávila Ortega Matrícula: A01053173 Práctica con Google Ngram Viewer
1. Busca el bigrama "Digital humanities" en el corpus seleccionando el periodo entre el año 2000 y 2019:
¿Cuándo ha sido más utilizada? ¿Cuál es su tendencia? En la gráfica podemos ver que la frase “Digital humanities” comienza a usarse a finales del 2005, y se ve como su uso va en aumento, sin embargo, se puede ver que a partir del 2012, comienza una creciente tendencia a la alza, alcanzando su punto más alto en 2018 y hacia 2019, comienza a descender el uso paulatinamente. 2. Prueba a cambiar los grados de suavizamiento (smoothing) para mejorar los hallazgos: ¿encuentras nuevos puntos altos o bajos destacados? Haz una captura de la gráfica resultante.
Smooting 0:
Al elegir el smooting 0, se puede observar que no se promedia la información obtenida por la herramienta, lo que permite ver con más claridad la tendencia a la utilización en el corpus de la frase “Digital humanities” mostrando una mayor utilización entre los años 2015 y 2016, teniendo un descenso importante en e año 2017, y repuntando lentamente en el 2018. Smooting 10:
Contrario al smoothing 0, el smooting 10 nos da un promedio en segmentos de cada 10 años. Esta gráfica es más parecida a la primera que tenía un smooting de 3. Me atrevería a decir que a mayor promedio de datos en la separación temporal, la frase tiende a mostrar un aumento en su utilización más uniforme y a la alza.
3. Debajo el gráfico tienes la correspondencia de la búsqueda en libros de Google Books ordenados por periodos temporales. Consulta las franjas que te llamen más la atención. ¿En qué tipo de publicaciones destaca el término?
Elegí el año 2018 porque en la primera gráfica es el año en que más se utilizó la frase. Al consultar la correspondencia de la búsqueda en libros de Google books. Pude observar que tiende a aparecer con mayor frecuencia en libros de historia y desarrollo de la disciplina, Manuales de métodos y técnicas para la disciplina y estudios de caso.
4. Introduce ahora un nuevo término en el buscador Ngram. En este caso será otro bigrama: "computer science". Observa los resultados al compararlos con la anterior búsqueda:
¿Cuál de los dos se emplea más? Utilizando un smooting de 0, ya que como mencioné anteriormente no hace un promedio de los datos. La frase que más se usa desde un inicio y a lo largo de los años seleccionados, es “computer science” ¿Cómo se relacionan sus ascensos y descensos a lo largo del tiempo? Como se muestra en la captura de la gráfica anterior, pude decirse que no hay una relación muy estrecha entre ambos bigramas, si acaso se alcanza a ver la cresta de utilización en ambos, en el año 2016. Aunque es casi imperceptible para “Digital humanities”. Lo que sí es claro, es que el que muestra mayor variación de utilización en el periodo temporal, es el primero.
5. De nuevo, consulta el tipo de publicaciones en los que más se emplea el término.
¿Puedes extraer nuevas observaciones? No como tal, salvo algunas diferencias, al igual que en “Digital Humanities”, “Computer science”, en el año 2018, tiende a aparecer con mayor frecuencia en libros de historia y desarrollo del tema, Manuales de métodos y técnicas y estudios de caso. 6. Repite el mismo proceso con el término "Humanities". También puedes utilizar operadores en la búsqueda y, por ejemplo, buscar conjuntamente "Digital humanities + Humanities": ¿Tiene en este último caso más presencia en el corpus que "computer science"? Sí, en el caso de "Digital humanities + Humanities", observamos una mayor utilización desde el año 2000 con una ventaja de casi tres rangos porcentuales por encima de “computer science” ¿Y si le añadimos a este último "Big data"? Lo que ocurre es muy interesante ya que arrancan con la misma frecuencia de utilización y se mantienen juntas las frases, hasta el año 2012, que “computer science + big data” muestra un ascenso acelerado y notorio de más de ocho rangos porcentuales. Al combinar nos bigramas, el concepto se fortalece y aumenta su utilización quizás por la actualidad que representa la definición de “big data”.
7. Plantea tú mismo alguna nueva búsqueda utilizando términos relacionados con el curso; por ejemplo: "text mining", "sentiment analysis" en comparación con "Digital humanities"; o cualquier comparación que te resulte interesante. Haz una captura de la gráfica resultante.
8. También puedes comparar las búsquedas en los repositorios de diferentes idiomas. ¿Tiene la misma curva "Digital Humanities" que "Humanidades digitales"? En el corpus del 2019 para inglés y español, podemos observar casi la misa curva de comportamiento de la frase para un idioma y otro, del uso casi nulo a partir del 2000, mostrando su aparición, aproximadamente en 2006, teniendo un comportamiento constante al alza
y con curvas de ascenso y descenso notorias a partir del 2016 y hasta la fecha. Me gustaría anotar que en el corpus del español anterior (2012) el término “Humanidades digitales” no arroja ningún resultado, contrario a lo que ocurre en el corpus del inglés 2012. Captura los resultados:
9. Por último, plantea una búsqueda avanzada (https://books.google.com/ngrams/info (Enlaces a un sitio externo.)) en la que por ejemplo se tenga en cuenta la posición sintáctica del término a analizar o su inflexión. Haz una captura de la gráfica resultante. Para este paso, lo que utilicé fue el asterístico (*) para encontrar las diez palabras más frecuentes antes de la palabra “humanities” en el corpus del inglés del 2019. Encontrando los siguientes resultados:
En cuanto a su posición sintáctica es notoriamente más utilizada como sujeto de la oración como se nota en “the Humanities”, con gran porcentaje de utilización desde el 2000 y mostrando un descenso notorio a lo largo de los años, pero no por ello deja de estar en primer lugar porcentual de utilización. Seguida de la frase “and humanities” que la coloca en la misma categoría de sustantivo, en conjunto con otras, lo que se supone por la conjunción “and”. En el caso de que aparece después de una preposición como en “in”, “for” y “of” la categoría gramatical sigue siendo la misma, pero en estos tres casos los porcentajes de uso se mantienen casi en el mismo rango porcentual, al menos para el año 2018. Finalmente cuando se junta con otra palabra para crear un concepto como en “digital, medical, start y ransom” + “humanities” su porcentaje de utilización es constantemente bajo en el periodo temporal elegido.