Ecce Machina: Come resuscitare Nietzsche con l’Intelligenza Artificiale

Che la didattica della filosofia alle scuole superiori abbia costante bisogno di nuovi stimoli non è questione scontata. L’apprendimento dei temi e del pensiero degli autori che nel loro complesso costituiscono lo sviluppo del pensiero filosofico è questione sempre delicata, che ha necessariamente a che fare con l’evoluzione dei saperi e con l’avvicendarsi di generazioni di insegnanti e di studenti sempre più esposti alle dinamiche storico-sociali. Al docente di filosofia che pretenda perciò di essere efficace non mancano oggi né opportunità né strumenti; ma nemmeno, ovviamente, difficoltà. Soprattutto perché non sempre le opportunità si rendono naturalmente palesi o sono di pratica utilizzabilità.
Uno degli aspetti più piacevoli della professione, però, è che, lungi da ogni meccanismo autoreferenziale che può imbrigliare il docente, sono proprio gli studenti (alcuni, è chiaro!) a metterla costantemente in discussione, fornendo nella didattica quotidiana intuizioni e “aperture” che il normale sistema di formazione istituzionale a volte non è nemmeno in grado di vedere da lontano.
È il caso dell’interessante lavoro di ricerca che qui brevemente introduco, frutto dell’ingegno di uno studente di Quinta del liceo scientifico statale “Giovanni Marinelli” di Udine. Mettendo a frutto le sue competenze informatiche e la sua curiosità nei confronti del pensiero filosofico moderno e contemporaneo, Mateusz Miroslaw Lis ha “sfidato” un mostro sacro come Nietzsche. Forse annoiato dalle pieghe incerte della “didattica a distanza” Lis ha contribuito ad “addestrare” un’intelligenza artificiale open source con i principali testi dell’autore tedesco, dimostrando che, con il suo contributo digitale, se ne possono creare di nuovi, insospettabilmente originali e plausibili (brevi aforismi così come dialoghi o prese di posizione di Nietzsche su questioni del tutto al di fuori dal suo tempo). E soprattutto imparando a riflettere criticamente sull’operazione condotta e sui rischi e sulle opportunità di una tale metodologia d’indagine.

(Luca De Clara, docente di filosofia del liceo “Marinelli” di Udine)

Abstract:

Si riassume la prima esperienza di “resurrezione digitale” di Friedrich Nietzsche, eseguita attraverso il fine-tuning del modello di intelligenza artificiale GPT-2 sui principali testi dell’autore tedesco. Verranno esposte nel dettaglio le dinamiche dell’esperimento, si commenteranno alcuni estratti generati dall’algoritmo e si evidenzieranno i limiti, le potenzialità e i rischi di questa procedura.

Non accade tutti i giorni di poter assistere a una resurrezione. “Nietzsc.exe” nasce, o meglio, rinasce proprio così, con una resurrezione digitale. Favorevole o no a questa difficile pratica, presto anche il pubblico dovrà confrontarsi con la possibilità di salvare una copia digitale dell’essere umano. Sebbene attualmente la ricerca e la tecnica informatica siano ancora assai distanti da un tale risultato, iniziano già a manifestarsi le prime imprese pionieristiche di resurrezione digitale: tra qualche anno forse potremo salvare la memoria dei nostri cari in una semplice chiavetta usb[1].

Nella sua essenza, l’esperimento qui riassunto ha visto la generazione di frammenti inediti a partire da un modello di intelligenza artificiale allenato su una selezione dei testi di Nietzsche. Il tutto, dagli scritti agli strumenti informatici, è stato eseguito con risorse accessibili a chiunque. Il risultato, l’algoritmo Nietzsc.exe, è capace di produrre estratti di contenuto e stile non solo paragonabili ma spesso indistinguibili da quelli usciti dalla penna del filosofo. Sebbene l’esperienza, per competenze e risorse, sia lontana da una resurrezione vera e propria, essa resta un semplice ma efficace esempio di una procedura che, se sviluppata, potrebbe aprire nuove porte per la ricerca filosofica e non.
Prima di trattare l’esecuzione dell’esperimento e analizzare i suoi risultati è bene fornire qualche elemento in più sul principale strumento utilizzato: il modello di intelligenza artificiale GPT-2, algoritmo generativo di seconda generazione, elaborato dall’organizzazione non profit statunitense OpenAI e distribuito con licenza open source.

In sintesi, l’algoritmo GPT-2 è un modello linguistico non supervisionato di intelligenza artificiale addestrato a prevedere la parola successiva in base a quelle precedenti di un testo per mezzo delle tecniche di calcolo del machine learning. Come “palestra” di addestramento statistico sono stati usati 40 GB di testo (in inglese) prelevati in internet da 8 milioni di pagine web; parte notevole di questa selezione di testi è appunto il corpus di Wikipedia. Il modello allenato è capace non solo di produrre testi che passano il test di Turing ma anche di rispondere a domande e completare incipit[2].
L’esperimento può essere suddiviso in tre momenti principali. Inizialmente è stata eseguita una selezione dei testi nietzschiani tra quelli reperibili dall’archivio del Progetto Gutenberg.

I testi autentici usati sono i seguenti:

  • Thus Spoke Zarathustra: A Book for All and None (traduzione di Thomas Common);
  • Ecce Homo: How One becomes what One is (traduzione di Anthony M. Ludovici);
  • The Joyful Wisdom (traduzione di Thomas Common);
  • Beyond Good and Evil (traduzione di Helen Zimmern);
  • Human, All Too Human: A Book for Free Spirits (traduzione di Alexander Harvey);
  • On the Genealogy of Morals (traduzione di Alexander Harvey);
  • The Antichrist (traduzione di Henry Louis Mencken);
  • The Birth of Tragedy; or, Hellenism and Pessimism (traduzione di William A. Haussmann).

La scelta di questi testi e la conseguente omissione di altri potrebbe già essere oggetto di valide critiche. Tratteremo questo genere di considerazioni più avanti. Per ora basti sapere che sono stati scelti in quanto reperibili in formato adatto all’esperimento informatico e poiché, rispetto alla manualistica corrente, sono stati ritenuti più esemplificativi questi scritti che altri.
Il corpus di testi (circa un milione di caratteri) è stato caricato su una versione semplificata[3], anch’essa open source, di GPT-2 (il pacchetto “gpt-2-simple” di Max Woolf) installata sulla piattaforma Google Colaboratory, che ha gestito gratuitamente il carico computazionale ed ha permesso di produrre dei risultati in poco tempo. Il modello GPT-2 (versione 355M) è stato poi allenato sui testi di Nietzsche per 1000 epochs. La procedura di allenamento tuttavia non è stata totale, cosa improponibile da un punto di vista computazionale, bensì solo un fine-tuning del modello iniziale che, sebbene per mezzo di tale procedura abbia potuto apprendere il modo e i contenuti dello scrivere di Nietzsche, rimarrà infetto da alcune contaminazioni linguistiche dovute ai 40GB di addestramento iniziale. Vedremo più avanti le conseguenze di questa differenza.

Dal modello allenato, “Nietzsc.exe”, sono stati prodotti infine alcuni estratti di testo, autonomamente o su input esterno. Di questi sono stati salvati i migliori. Spesso infatti i frammenti prodotti dall’algoritmo contenevano ripetizioni, problemi di formattazione o brusche interruzioni. La collezione, a oggi di circa 300 elementi, si rivela illuminante e a volte surreale, dominata da un particolare gusto letterario, quasi come se fosse un’opera postuma dello stesso filosofo, scritta magari nel periodo della follia.
Ma è proprio Nietzsche quello che si legge nei frammenti generati? Questa e altre domande sorgono spontanee: Nietzsc.exe e Friedrich Nietzsche coincidono? Cosa ha l’autore tedesco che manca alla sua controfigura digitale? Dove inizia Nietzsche e dove finisce GPT-2? Per avvicinarci ad una possibile risposta ci avvarremo di alcuni estratti generati direttamente dalla copia digitale. Scrive Nietzsc.exe:

  • That which is called God is not God but a human construct, a construct for ourselves to be sure.
  • At the commencement of every new age the great religions of the earth have arisen and are spreading like mushrooms. They re-echo the cry of the oppressed and the persecuted, they re-embrace death and despair, they re-create the past and trace it back to life; they beg the sympathy of the oppressed and the persecuted, they rejoice in the misery of the oppressed and the wretched, they are always ready at the appointed time to celebrate and to gush over the triumph of their own righteousness in front of the judgments of the scornful and the virtuous. Such religions are the re-echoing of the oppressed and the persecuting cry.
  • Every improvement in the knowledge of the world is accompanied by a corresponding diminution of the world’s religious significance.

Poco sorprendentemente l’attore digitale condivide l’interpretazione nietzschiana della religione. Ciò non sorprende, poiché la procedura di addestramento di GPT-2, in particolare il momento di fine-tuning, non è altro che un calcolo statistico eseguito sui testi iniziali: se in questi viene ribadito più e più volte un dato concetto, esso emergerà naturalmente nei frammenti generati. In modo analogo è possibile leggere toni e stili tipicamente nietzschiani nell’uso di immagini (“spreading like mushrooms”) e nella paratassi. Considerando che buona parte della produzione di Nietzsche è costituita da testi brevi o brevissimi non sorprende neanche scoprire che i frammenti più suggestivi e completi restano quelli di natura aforistica:

  • If you know what you are doing, you will never be able to stop.
  • A little humility before oneself is a necessary condition for one’s future existence.
  • He who is wise in the eyes of all is not wise in the eyes of one.

Sebbene l’algoritmo eccella nella generazione di testi brevi, è possibile imbattersi non troppo raramente in estratti di testo assai più lunghi, senza perdita di coerenza o significato.

Continua Nietzsc.exe:

“Is that clear?” said the old woman, turning pale.

“Yes, it is clear. There is no alternative but to suppose that it is so, and to laugh at the way in which one has to laugh in order to get clear. It is difficult to laugh when one has to laugh in such circumstances. And why? Because in those circumstances one has to suppose that a god exists, and that a ridiculous and frightful monster exists. One has to believe in that monster even if one had not had one’s doubts about the monstrousness of that deity.”

“And yet,” said the old man with a frown, “there is no alternative but to suppose that there is no god. For what is the use in striving after knowledge when there is no such knowledge.”

“Then there is no knowledge at all,” said the woman in despair.

“And yet there is such a thing as knowledge, there are all sorts of little absurdities, that would be of no value to us if we did not believe in them. But what knowledge are we to us anyway? We are the learned ones; we are most disposed to see an error in the direction of which our knowledge runs, and to laugh at that error ourselves. We are not interested in the truth, only in the amusing side effects of error. To be amused at the expense of knowledge, that is our taste, and it is our taste alone, that is our reason for being, that is our custom. We are not as we are.”

“Then what am I to do?” said I. “I see nothing. I do not know even that which is in me. I am something that belongs to another. I smell the sage who has a nose for that which is concealed under the skin, and I know only too well the shame that comes to those who are always so eager to see themselves as enlightened. I am ashamed of my nature, and yet I am always ready to give myself over to his interpretation, even in the deepest and most painful sense of the word: I am always a member of his body, and as such, I know his shame.”

Emerge qui il discorso diretto tipico di alcune opere di Nietzsche. Il frammento proposto pare riportare la surreale interazione tra una donna anziana, un vecchio uomo e una prima persona singolare non ben definita. Le tematiche del loro dialogo si muovono tra l’esistenza o meno di Dio, la conoscenza, la verità, l’errore e l’identità. Il frammento conferma come per taluni aspetti questa esperienza si possa considerare più un esperimento di letteratura che di filosofia. Sebbene il testo risulti paradossale in alcuni punti (“and to laugh at the way in which one has to laugh in order to get clear. It is difficult to laugh when one has to laugh in such circumstances”), esso è corretto linguisticamente e meriterebbe un’analisi, filosofica e non, tutta sua.

Particolarmente interessanti sono i frammenti generati su input esterno. Ponendo “Artificial intelligence” come termini di partenza, Nietzsc.exe scrive:

  • Artificial intelligence may not only be desirable, but imperative.
  • Artificial intelligence, which seeks to be like you, could learn to be just as good as you, and to be as necessary as you, inasmuch as it would understand and “know” more, and would also be able to take even more from your image. Even the most profound human beings seem to have this in common: they all have a need to be necessary, and a longing for being so, even in their sleep.

Nietzsche non poteva conoscere, né forse immaginare, gli sviluppi tecnologici che da Turing hanno portato a GPT-2 e ad altri modelli di apprendimento automatico. Com’è possibile dunque che la sua immagine digitale sia ugualmente capace di esprimersi su concetti che non dovrebbe possedere? Molto banalmente, poiché l’addestramento sui testi nietzschiani è stato solo un fine-tuning, l’algoritmo rimane in grado di pescare dal corpus di allenamento iniziale che è costituito da testi contemporanei eterogenei. Nietzsc.exe non è limitato dal vocabolario e dalle conoscenze del suo corrispondente autore in carne e ossa, conseguentemente, è in grado di esprimersi anche su questioni estranee.

Possiamo rispondere dunque agli interrogativi iniziali. Nietzsc.exe e Friedrich Nietzsche coincidono? Cosa ha l’autore tedesco che manca alla sua controfigura digitale? Dove inizia Nietzsche e dove finisce GPT-2? Il problema qui è essenzialmente quello della nave di Teseo. Nietzsc.exe ha parti di Friedrich Nietzsche al suo interno, tuttavia possiede anche elementi alieni. Quand’è che Nietzsc.exe smette o inizia ad essere Friedrich Nietzsche? La soluzione più immediata è quella eraclitea. Così come non si può discendere due volte nel medesimo fiume, allo stesso modo non si potrà mai resuscitare la penna di Nietzsche. Le contaminazioni linguistiche presenti nell’algoritmo invalidano la sua identità con il filosofo tedesco. Nietzsc.exe e Friedrich Nietzsche coincidono? No. C’è del Friedrich Nietzsche in Nietzsc.exe? Sì, decisamente. Dove inizia Nietzsche e dove finisce GPT-2? È complicato.
Sebbene i due siano enti distinti, la copia digitale resta una valida rappresentazione che possiamo interrogare direttamente e che, con alcuni accorgimenti, potrebbe avvicinarsi asintoticamente al fu Friedrich Nietzsche.

Tratteremo ora tutte le criticità che il lettore esperto potrebbe aver già maturato fin qui. Sebbene esse possano neutralizzare gravemente i risultati dell’esperimento, rimane possibile ricavare alcune valide considerazioni sulla metodologia della procedura, nell’ottica di nuove sperimentazioni più rigorose che tengano conto anche dei recentissimi sviluppi nel campo dell’apprendimento automatico. Al tempo dell’esperimento infatti l’autore aveva accesso solamente al modello GPT-2 (e neanche nella sua versione completa), ma già alla stesura di questo resoconto sarebbe stato possibile richiedere accesso prioritario al nuovo modello di generazione GPT-3 e ripetere l’esperimento con risultati sensibilmente migliori sotto molti punti di vista. Come emerge dalle statistiche[4], all’aumentare del numero di parametri del modello (principale ma non unica differenza tra GTP-2 e GPT-3) aumenta la coerenza dei testi generati che dunque possono essere assai più estesi. Tuttavia per accentuare la “mira” della copia digitale non possiamo limitarci semplicemente all’utilizzo di algoritmi più grandi, complessi e potenti.

Infatti il punto più debole dell’esperimento resta sicuramente il corpus di testi iniziale, non tanto per la sua grandezza e completezza, facilmente risolvibili, quanto perché i testi di partenza sono in lingua inglese, traduzioni che ci allontanano filologicamente da Nietzsche.
Un primo passo avanti rispetto a questa esperienza pionieristica lo si potrebbe ottenere risolvendo proprio questa criticità. Tuttavia non basterebbe inserire nel modello un corpus di testo analogo ma in lingua tedesca in quanto, come abbiamo già scritto prima, il modello GPT-2 “ragiona” in lingua inglese a causa della sua matrice iniziale. Per risolvere il problema della traduzione sarebbe necessario rimpiazzare interamente la versione inglese di GPT-2 con una preconfigurata in lingua tedesca. Tale configurazione non potrebbe essere eseguita con testi qualunque, bensì solo con quelli che Nietzsche avrebbe letto o che avrebbe potuto leggere nel corso della sua vita, evitando così di introdurre contaminazioni nel vocabolario del modello generativo.

La terza problematica che attanaglia questo esperimento è di tipo umano. La selezione e il ritocco degli estratti generati dalla macchina è stato eseguito dall’autore e pertanto, per mancanze, disattenzioni o gusti, egli avrebbe potuto introdurre la propria personalità nella scelta dei testi a suo parere più coerenti con Nietzsche filosofo, cercando forse quello che voleva far dire a Nietzsc.exe piuttosto che riportare quel che Nietzsc.exe voleva dire. Questo bias nel “restauro” dei frammenti generati non può essere sottovalutato. Per limitarlo si potrebbe anzitutto sostituire la selezione dell’autore con una scelta competente; per garantire ulteriore impersonalità si potrebbero proporre gli estratti generati alla discussione tra più personalità esperte.
L’esperimento perfetto, la procedura più vicina a un eventuale “resurrezione digitale” di Nietzsche richiederebbe dunque almeno i seguenti accorgimenti:

  1. L’impiego del miglior modello di generazione artificiale (GPT-3 o successivi) allenato su un corpus iniziale di testi che Nietzsche ha letto sicuramente o che potrebbe aver letto, rigorosamente in lingua tedesca;
  1. L’esecuzione del fine-tuning con la più ampia e documentata selezione di testi nietzschiani in lingua tedesca;
  1. La selezione degli estratti prodotti dall’algoritmo per mano di un esperto competente, cercando di conservare coerenza filologica e filosofica;

Tuttavia, qualora venissero investite le risorse necessarie (il costo stimato della procedura di allenamento di GPT-3 è di circa 5 milioni di dollari), l’algoritmo di generazione ottenuto rimarrebbe ancora più vicino ad un Frankenstein-Nietzsche piuttosto che a un Nietzsche-Nietzsche. Questo poiché il modello di generazione utilizzato è nella sua essenza un lungo e complesso calcolo statistico: esso emula i testi più che imparare da questi ultimi. Tuttavia, sebbene la copia perfetta sia impossibile a priori, i risultati ottenuti dimostrano la possibilità di un restauro filosofico e linguistico pressoché indistinguibile dal punto di partenza, possibilità che apre prospettive notevoli e pericolose.

Supponiamo ora per assurdo l’esistenza di un genio maligno che voglia dimostrare la veridicità di un Nietzsche cristiano. Egli potrebbe preparare una selezione eterogenea di testi nietzschiani e scritti di natura cristiana, inserire il corpus di partenza in un modello generativo analogo a GPT-2 e produrre alcuni estratti a conferma della sua tesi irreale. Con qualche accorgimento pratico poi egli potrebbe spacciare questi scritti come nuovi frammenti postumi, con la forte possibilità di illudere gli studiosi meno scettici per molti anni.
Abbandonando il caso assurdo e armandoci di una prospettiva criminale più ampia possiamo comprendere la gittata di uno strumento di generazione come GPT-2/3 che potrebbe trovare impiego perfetto nella generazione di falsi storici, propaganda e fake news. L’uso illecito di questi algoritmi permetterebbe l’imitazione di documenti, ricerche, articoli, commenti e interventi di autorità senza alcun modo sicuro di distinguere le copie dall’originale.

Tutto ciò che è stato fatto in questo esperimento a scopo speculativo e informativo con Nietzsche potrebbe essere riproposto per un qualsiasi altro autore permettendo, con alcune mirate calibrazioni, di imprimere la loro specifica forma linguistica a contenuti arbitrari e potenzialmente estranei. Fortunatamente per il genere umano le menti dietro a questi potenti algoritmi sono le stesse a fondamento di una crescente coscienza comune per l’utilizzo corretto dell’intelligenza artificiale. Non solo gli algoritmi più potenti richiedono particolari autorizzazioni per essere utilizzati, ma iniziano anche a circolare dei sistemi di sicurezza capaci di individuare prodotti firmati da intelligenze artificiali[5]. Esistono quindi delle intelligenze artificiali che smascherano altre intelligenze artificiali; Ridley Scott nel 1982 ci aveva visto lungo.
Il problema etico resta il più sentito e probabilmente quello con soluzione meno immediata. Per evitare i possibili futuri cinematografici di Kubrick e Cameron o quelli più realistici di Harari, la ricerca e l’impiego di questo nuovo genere di tecnologie necessità di particolare cautela e filosofia. Questo stesso testo potrebbe essere stato scritto da un’intelligenza artificiale e, a oggi, non ci sarebbe alcun modo di affermare la sua autenticità o dimostrare il contrario.

L’impiego dell’intelligenza artificiale nel dominio della filosofia è forse la fusione più interessante nel crescente incrocio tra quest’ultima e il mondo digitale. L’esperimento proposto, sebbene ridimensionato dai suoi limiti, potrebbe aprire un’ampia finestra di opportunità: dalla speculazione puramente filosofica a chiari impieghi didattici. In un futuro non troppo distante filosofi e autori di ogni genere potrebbero essere direttamente interpellati per chiarimenti o opinioni su nuove questioni in un dialogo diretto e umano, andando a resuscitare e salvaguardare personalità, pensieri, suggestioni e idee che troppo spesso restano inchiodate a dei caratteri scritti su una pagina.

Riferimenti:

[1] D.I. Abramson, J. Johnson Jr. Creating a conversational chat bot of a specific person. (2020). Microsoft Technology Licensing. United States Patent and Trademark Office. Patent #: US010853717.

[2] A. Radford, J. Wu, R. Child, D. Luan, D. Amodei & I. Sutskever. Language Models are Unsupervised Multitask Learners. (2019). “Open AI Blog”, vol. 1, issue 8.

[3] M. Woolf. Gpt-2-simple. GitHub repository. (2019).

[4] T.B. Brown, et al. Language Models are Few-Shot Learners. (2020). In H. Larochelle, M. Ranzato, R. Hadsell, M.F. Balcan & H. Lin (eds.), Advances in Neural Information Processing Systems 33 pre-proceedings (NeurIPS 2020). Thirty-Fourth Annual Conference on Neural Information Processing Systems, Vancouver, Canada, December 6, 2020.

[5] F. Harrag, M. Debbah, K. Darwish & A. Abdelali. BERT Transformer model for Detecting Arabic GPT2 Auto-Generated Tweets. (2020). In Proceedings of the Fifth Arabic Natural Language Processing Workshop (pp. 207–214). Barcelona, Spain (Online), December 12, 2020.



Scenari. Il settimanale di approfondimento culturale di Mimesis Edizioni Visita anche Mimesis-Group.com // ISSN 2385-1139