Cómo el big data está resolviendo las mayores broncas de la crítica literaria

big data shakespeare

Si le hubieran dicho en vida a William Shakespeare que 400 años después alguien iba a utilizar las matemáticas para dejar de atribuirle una obra como suya seguramente no hubiera entendido nada. Pero es, simplificando mucho las cosas, lo que ha pasado.

Precisamente cuando se conmemora el cuarto centenario de la muerte de William Shakespeare, y en medio de toda la vorágine de eventos programados para celebrar su vida y obra, los expertos han utilizado y aplicado técnicas de Big Data para concluir que algunas de las que se creían que eran sus obras no lo son.

Sí, porque aunque tendemos a pensar que estas tecnologías tienen su campo de acción en las ramas más técnicas y matemáticas, lo cierto es que el Big Data también se puede aplicar a las humanidades y los resultados son asombrosos.

No fue Shakespeare, fue su rival Marlowe

Es cierto que sobre la obra Henry VI siempre ha habido dudas sobre si en determinadas partes había intervenido más de un autor, especialmente Christopher Marlowe.

shakespeare

Ahora, se han aplicado herramientas tecnológicas para hacer un análisis del texto y determinar si, por la manera de utilizar el lenguaje (como el uso frecuente de ciertos artículos y ciertas palabras) se podría concluir que estábamos ante letras escritas por nombres como Marlowe. Touché. Es así como se ha deducido que Marlowe parece haber escrito la mayor parte de “Enrique VI, Parte 1”, mientras que correspondería a Shakespeare la mayoría de la Parte 3. La autoría principal en la Parte 2 es más difícil de identificar. Al menos por ahora.

Teorías de la conspiración ¿confirmadas por el Big Data?

Lo cierto es que no es el único caso en el que se están aplicando tecnologías y técnicas más propias de los campos biomédicos en las letras.

Así, la universidad de Glasgow también está aplicando su “Glasgow Polynomics” a las esferas de humanidadas. Por un lado, para verificar que el testamento de Shakespeare que se exhibe en Londres como parte de las celebraciones de estos 400 años es el suyo, gracias a los análisis efectuados en el papel y la tinta del documento.

También se ha aplicado esta tecnología polinómica a algunos textos esotéricos, donde algunos creen ver la influencia de las drogas. E incluso se llevó a cabo un estudio sobre los rastros químicos encontrados en tubos de arcilla excavados en Stratford-Upon-Avon que, sin embargo, no tenían ningún signo de cannabis.

Los estudiosos de la literatura se encuentran, pues, en estos momentos, diseccionando textos para buscar pistas que se refuercen con metadatos (que provengan de los detalles biográficos del autor y de hechos históricos) para confirmar o desterrar algunas hipótesis y polémicas. Así, por ejemplo, se intenta descubrir si Ofelia estaba embarazada de Hamlet cuando se suicidó.

paper-old

Los investigadores pueden aislar frases en el texto que sugieren esta idea y aplicar otros datos para probar su tesis. Se preguntan, por ejemplo, porque se quedó con la hierba ruda cuando distribuyó flores y hierbas a los miembros de la corte. Cabe señalar que esta planta (la ruda) fue un abortivo común en los tiempos isabelinos. Las divagaciones de Ofelia, aparentemente impulsadas por la locura, también se prestan a una interpretación de que Hamlet la había llevado a un sexo premarital. Y Hamlet también ofrece pistas para pensar en ello.

Básicamente, los estudiosos de Shakespeare están encadenando una multitud de pistas fragmentadas hasta que pueda formularse como cierta una hipótesis creíble. Un sistema de trabajo que tampoco difiere mucho de gran parte de la ciencia, que también ha ido recopilando pistas obtenidas de la experimentación abstracta hasta que aparece una narración que no genere controversias entre la comunidad científica para darla como buena.

¿Qué pasa si aplicamos técnicas del cáncer en las letras?

Al igual que se buscan pistas sutiles en los genomas para intentar ver características comunes que ayuden en la detección de cáncer, la investigación con Big Data en humanidades implica la convergencia de metodologías basadas en datos. Estas técnicas, que algunos denominan “Shakespearenomics”, están empezando a dar fruto sorprendentes.

Recientemente, Sung-Hou Kim, un científico de la Universidad de California en Berkeley, y su equipo aplicaron una técnica conocida como “perfil de características frecuentes” (FFP, feature frequency profiling) para buscar relaciones entre diferentes tipos de texto. Su método ya se había demostrado para hacer descripciones muy claras y precisas de las relaciones entre los diferentes tipos de organismos basados ​​en sus secuencias genómicas.

face-letter

Después de aplicar y clasificar los hallazgos en función de la frecuencia en la que aparecieron, y tras aplicarles una serie de puntuaciones sobre la relación entre los diferentes textos, se terminó agrupando los libros en tipos diferentes (textos religiosos, novelas del siglo XIX, filosofía, mitología, ciencia y ficción infantil).

Luego compararon los escritos de Shakespeare y algunos de sus contemporáneos. La mayoría de los textos de Shakespeare se agruparon entre sí, mientras que los atribuibles a Marlowe y Bacon estaban separados. Por lo menos una obra acreditada a Shakespeare (Pericles) parecía seguir a un FPP diferente, arrojando dudas sobre su procedencia, mientras que otra (Los dos nobles parientes) para el que siempre ha planeado la duda sobre su autoría, apareció en el grupo de Shakespeare.

No diga tragedia, diga comedia

En octubre de 2011, Michael Witmore, director de la Shakespeare Folger Library, dio a conocer los resultados de unos inusuales experimentos que llevaba realizando desde hace mucho tiempo, examinando las obras de Shakespeare desde el primer folio con herramientas de análisis retórico. La primera conclusión sugiere que el lenguaje de las tragedias difiere mucho del empleado en las comedias.

De esta forma, el Big Data concluye que algunas de las tragedias clásicas, como Otelo, podrían haber sido escritas originalmente con claves cómicas. De hecho, se cree que esta obra es excepcionalmente rica en el vocabulario cómico de Shakespeare, dado que incluye varios elementos reciclados de Noche de Reyes, que tradicionalmente siempre se ha considerado como comedia.

imagination

Sonetos en forma de ADN y otras rarezas

Lo cierto es que el gran autor en letra inglesa también es la inspiración para la combinación de letras y ciencias, dando lugar a extraños experimentos.

Por ejemplo, los sonetos de Shakespeare fueron traducidos por el equipo de Nick Goldman en el Instituto Europeo de Bioinformática, en las cercanías de Cambridge, a un código basado enteramente en las secuencias de nucleótidos que componen el ADN, en otro ejemplo extraordinario de las formas en que las tecnologías basadas en Polyomics pueden impactar en las humanidades.

Las cuatro bases famosas que comprenden el ADN (A, T, C y G) se convirtieron en un código binario complejo pero viable con el que se hizo posible reescribir los sonetos en ese código. Además, era posible sintetizar físicamente hebras de ADN que contenían ese código, enviar el ADN a un centro de secuenciación y luego volver a traducir el código en una copia perfecta de los sonetos. Por lo tanto, el ADN ofrece un medio para almacenar físicamente masas de texto escrito, de manera más compacta y duradera que la requerida para el almacenamiento de la misma información por ordenador.

letter

Recientemente, otro científico joven en los Estados Unidos, J. Nathan Matias, empleó un enfoque de “aprendizaje automático” usando los sonetos de Shakespeare para entrenar a un ordenador sobre cómo predecir qué palabras encadenar para crear un soneto que representa las agonías de un amante despreciado.

Se considera que se trata del primer soneto shakesperiano escrito en colaboración por un artista humano e inteligencia artificial y data de 2014. Pero no es el único, ya que este mismo año, el artista de datos Nicholas Rougeux lanzó una serie de firmas digitales de Shakespeare para cada uno de sus 154 sonetos. Tomó la suma de las letras en cada línea (correspondiente a su rango en el alfabeto inglés) y las dividió por el número de letras en cada una. Luego trazó el valor de cada línea de un soneto en un gráfico digital, hasta que apareció una firma, cuando todas las catorce líneas estaban trazadas. Así es como creó una imagen digital única por cada soneto.

El Big Data y otras herramientas tecnológicas, por tanto, no solo pueden servir para mejorar el diagnóstico de enfermedades a futuro, sino para esclarecer algunos de los enigmas más polémicos de nuestro pasado.

Etiquetas: