Esplorare la letteratura teatrale attraverso la data visualization
- FOCUS
- 20 Maggio 2024
In questo articolo esploreremo le modalità in cui può essere utilizzata la data visualization con l’obiettivo di analizzare un corpus di testi teatrali, per rivelare aspetti nascosti e tracciare linee di tendenza. Utilizzando esempi tratti da un’indagine condotta da Lauren Ackerman, ricercatrice presso la Newcastle University, si vedrà come analizzare e visualizzare una raccolta di testi teatrali prendendo in esame diverse variabili quali la lunghezza delle opere, il conteggio delle battute per personaggio, l’analisi delle occorrenze e delle sottocategorie di genere letterario.
Analizzare un corpus teatrale in ottica data-driven
Uno degli approcci più frequenti per comprendere i testi letterari in ottica data-driven nel contesto delle Digital Humanities è rappresentato dall’analisi quantitativa degli elementi testuali. Questo approccio si rifà al concetto di distant reading teorizzato dal critico letterario Franco Moretti che implica l’osservazione di corpora ampi per dimensioni e per estensione cronologica con l’intento di individuare strutture, pattern, regolarità e irregolarità, volte a comprendere fenomeni letterari su ampia scala, ma anche di rivalutare la configurazione dei singoli testi.
Con questo framework teorico in mente, Ackerman si è servita di un dataset che include dati relativi a tutte le drammaturgie di William Shakespeare per provare a percorrere strade d’indagine inedite in ambito teatrale. Ha iniziato a lavorare sui dati esaminando uno degli aspetti più semplici e immediati: la lunghezza delle opere, basandosi sul conteggio delle frasi che le compongono. Grazie ad una semplice visualizzazione mediante istogramma è possibile evidenziare visivamente che l’opera più lunga tra tutte quelle di Shakespeare è Hamlet, l’unica a superare le 4000 battute; mentre all’altro estremo si trova A Comedy of Errors, con poco più di 2000. Queste osservazioni possono essere impiegate per svolgere studi comparativi o per valutare decisioni relative alla messa in scena e agli adattamenti, tenendo conto del tempo e delle risorse richieste.
Passando al singolo testo, l’analisi quantitativa della frequenza delle battute di ciascun personaggio può dare un’idea di chi occupa più spesso il palcoscenico. Nel caso di Hamlet non sorprende che il protagonista dell’omonima tragedia pronunci circa 1700 battute a fronte di oltre 4000 totali.
La term frequency come indizio tematico
Nel corso della sua indagine Ackerman ha anche esplorato la frequenza delle parole utilizzate in ogni opera; per esempio, ha confrontato la presenza della parola “love” in diversi testi con l’intento di verificare in ottica data-driven la possibilità di individuare grazie a queste occorrenze – perlomeno in maniera intuitiva – quali opere vertevano sul tema dell’amore rispetto a quelle che invece lo trattavano marginalmente. L’istogramma che riporta questi dati sembra confermare in gran parte questa possibilità.
Integrare la critica con nuove variabili: i generi letterari
Un’analisi ancora più specifica rende possibile implementare l’istogramma con l’aggiunta di una variabile rappresentata da una legenda colorata; in questo caso, la ricercatrice ha scelto di attribuire alle opere una sottocategoria per segmentare i confronti in base al genere di appartenenza di ciascuna. Ackerman si è basata sulle tre categorie individuate dagli studiosi a partire dal First Folio: comedy, history, tragedy, con l’aggiunta di romance per le opere tarde.
Dalla visualizzazione emerge che la tematica associata al termine “love” viene discussa con più frequenza nelle categorie comedy e tragedy, ma con minore frequenza in history e romance. A un primo sguardo questo risultato sembra intuitivo e prevedibile, ma ciò potrebbe essere fuorviante; infatti, A Comedy of Errors presenta meno menzioni della parola “love”, ma è anche la pièce più breve e che quindi ha complessivamente meno parole. È necessario dunque aggiungere al dataframe anche la lunghezza complessiva delle battute relative a ciascuna opera per fornire un contesto completo e accurato e garantire delle riflessioni ben documentate.
Sebbene in questo caso i cambiamenti non siano drastici, è possibile notare alcune differenze curiose: A Comedy of Errors sale di un gradino pur rimanendo tra le ultime, mentre Romeo and Juliet passa dal secondo al quarto posto in ordine discendente, superata da A Midsummer Nights Dream e As You Like It.
Infine, è stato possibile stabilire ulteriori sottocategorie per individuare nuove tendenze; per esempio, focalizzandosi sul numero di battute, Ackerman ha limitato l’indagine ai personaggi shakespeariani con più di 700 battute, in modo da verificare se ci fossero dei pattern interessanti in base alla categoria dell’opera di appartenenza. Ad un primo sguardo sembra che il genere della tragedia domini sugli altri, con i personaggi di Hamlet e Iago sopra tutti, ma complessivamente prevalgono le opere storiche. Questo potrebbe essere dovuto al fatto che si tratti delle opere più lunghe? In effetti, è possibile.
Grazie ai casi di studio forniti dalla ricerca shakespeariana condotta da Lauren Ackerman, appare chiaro come l’analisi e la visualizzazione dei dati possano consentire di individuare spunti e tendenze interessanti all’interno di un corpus di opere teatrali. Tuttavia, è essenziale trattare i dati con cautela per non rischiare di giungere a conclusioni fuorvianti. Nell’ambito degli studi umanistici, le riflessioni elaborate a partire dai dati non sono verità definitive, ma fungono piuttosto come punti di partenza per delineare nuove linee di ricerca o formulare ipotesi, sia in ottica di ricerca accademica che allo scopo di valutare aspetti rilevanti in vista della trasposizione e produzione teatrale.