A quattro anni dalla sua diffusione su larga scala, segnata simbolicamente dal lancio di ChatGPT, l’intelligenza artificiale è ormai una presenza pervasiva nella nostra vita quotidiana, nel dibattito pubblico e nella produzione culturale. Attorno all’IA si moltiplicano i corsi di approfondimento per non restare esclusi da un mutamento percepito come epocale e insieme crescono le inquietudini per i futuri che questo apre.
Accanto a questi atteggiamenti, si fa strada un’altra prospettiva: un dialogo aperto e creativo con l’intelligenza artificiale. L’arte, ancora una volta, si mostra pioniera di questo movimento, accogliendo l’IA come occasione di sperimentazione, concretizzata in nuovi linguaggi, mostre e musei dedicati al digitale. Non si tratta però di un fenomeno che interessa pochi, siamo reduci da un anno segnato dalla viralità dei brainrot e assistiamo all’uso politico e comunicativo delle immagini artificiali.
Di fronte a queste novità, è però fondamentale ricordare che l’intelligenza artificiale non è un fenomeno astratto né fuori dal tempo, bensì una tecnologia storicamente situata, una tappa della nostra storia del sapere. L’IA si inscrive in una tradizione più ampia e, allo stesso tempo, la interroga. In particolare, la produzione di immagini artificiali rende visibili tensioni profonde nel nostro modo di intendere la conoscenza, la rappresentazione e la creatività, tensioni che spesso restano implicite o considerate come già risolte. Guardare all’IA con distacco critico significa metterne in luce i presupposti e interrogare, insieme, le metamorfosi del presente e ciò che ancora resta da immaginare e costruire.
La creazione artistica con l’IA condensa ed esprime questo movimento. L’IA non ha distrutto l’autorialità, piuttosto ha scosso una specifica tradizione legata all’idea romantica dell’ispirazione individuale, riportando in primo piano il carattere collettivo, processuale e temporale del creare. Generare immagini significa attivare una dimensione latente del visibile, composta su base probabilistica. È questa imitazione, mero copiare? La generazione digitale mette in rilievo quanto lo schema della mimesis continui a influenzare il nostro giudizio sulle immagini. I modelli non si limitano a copiare il reale, ma aprono nuovi possibili, esplorando una forma di generatività inedita, non umana, propriamente tecnologica.
Creare con questi strumenti significa allora interrogare il rapporto fra mimesis e poiesis, tra riproduzione e invenzione, presentando con urgenza questioni etiche, politiche e sociali. Per esplorare queste trasformazioni e le novità introdotte dalla generazione di immagini digitali, dialoghiamo con Alessandra Scotti, ricercatrice presso l’Università di Torino e il centro di ricerca ERATO. È autrice di Etica del visibile. Dalla fotografia all’IA generativa (Orthotes, 2025), testo che interroga filosoficamente le immagini digitali, inserendole in un dibattito più ampio e mettendone in luce il lato invisibile, quel punto cieco, spesso trascurato nell’interazione con i modelli, in cui emergono però le questioni etiche e sociali decisive per comprendere il nostro presente.
A.M. : Nel suo lavoro introduce e discute il concetto di “immagine operazionale”. Potrebbe chiarire che cosa descrive questo concetto e in che modo esso si distingue da altre concezioni dell’immagine?
Il concetto di “immagine operazionale” fu elaborato nei primi anni 2000 dal regista di origini cecoslovacche Harun Farocki. Nei suoi documentari, nelle installazioni video, così come pure negli scritti teorici, Farocki si focalizza sulla politica delle immagini, in particolare nel contesto militare-industriale. Ad esempio, in Eye/Machine presentava al pubblico immagini provenienti dalle telecamere montate sui missili a guida laser dell’esercito degli Stati Uniti durante la Guerra del Golfo. Farocki definiva le immagini operative come “immagini prive di uno scopo sociale, non destinate all’edificazione né alla riflessione” e affermava che esse “non rappresentano un oggetto, ma piuttosto fanno parte di un’operazione”. Le immagini operative sono dunque immagini che non raffigurano né rappresentano, non intrattengono né informano, ma viceversa tracciano, navigano, attivano, sorvegliano, controllano, rilevano e indentificano. Sono strumenti che eseguono funzioni all’interno di un’operazione. In tal senso, possono essere ascritte alle immagini operazionali le diverse tecnologie che accoppiano telecamere o sensori a software di elaborazione delle immagini: dai droni ai veicoli a guida autonoma, dai robot industriali a quelli domestici, l’imaging medico delle TAC e delle risonanze magnetiche, i sistemi di video sorveglianza e quelli informativi geografici e molti altri esempi di sistemi visivi automatizzati. Tali sistemi ampliano notevolmente il “regno delle immagini”, slegandolo dall’intrattenimento e aprendo nuove questioni legate alle tecnologie visive e all’impatto che quest’ultime inevitabilmente hanno sulla cultura visuale contemporanea. La formula, “immagine operazionale”, torna al centro del dibattito quando l’artista Trevor Paglen nel 2014 la inserisce nel contesto di quella che chiama una cultura visuale machine to machine, vale a dire di immagini prodotte da macchine e intercettate da altre macchine in una sorta di circuito chiuso, prevalentemente invisibile all’occhio umano. Le immagini, lungi dal rappresentare semplicemente le cose del mondo, iniziavano a fare cose nel mondo, inaugurando così un nuovo regime visuale, rendendo l’occhio umano per così dire desueto. Come nota Paglen, in Eye/Machine le stesse immagini operazionali sono riconfigurate per far sì che diventino leggibili dagli umani: le macchine non hanno bisogno di frecce gialle animate o di riquadri verdi sovrapposti a immagini video sgranate per calcolare traiettorie o riconoscere corpi e oggetti in movimento. Quei segni sono pensati per gli esseri umani: servono a mostrare agli umani come una macchina “vede”. Mi sembrava dunque interessante far agire questa nozione nell’ambito della computer vision e della produzione algoritmica di immagini, fenomeni dell’attuale economia dei dati, il cui perno concettuale è l’invisibilità operativa. Provare a leggere il concetto di operatività mostrandone il potenziale euristico: l’operazionalità come vettore mediale capace di connettere, dislocare, trasferire da un livello all’altro, di mediare appunto, unire ad esempio il simbolico e il reale, il visibile e l’invisibile, l’astratto e il concreto.

A.M. : Per quali ragioni ha ritenuto teoricamente significativo porre in relazione la fotografia e l’intelligenza artificiale? Quali continuità o discontinuità emergono da questo accostamento?
Ho deciso di approcciare la questione dell’immagine algoritmica facendo un passo indietro: avvertivo che il destino della fotografia fosse in qualche modo imparentato con quello della sintografia e ho cercato di indagarne le ragioni. In primo luogo, l’immagine fotografica rappresenta una sorta di archetipo di immagine tecnica: da Benjamin a Flusser, da Barthes a Sontag, larga parte della filosofia si è interrogata sulla natura di quest’oggetto specifico che chiamiamo fotografia, rispetto alla quale è senz’altro difficile darne una definizione univoca e tuttavia la cui evidenza, come ricorda Silvia Camporesi, pare evocare la tautologia: «una foto è una foto è una foto». In secondo luogo, la fotografia ha conosciuto diverse rivoluzioni e la sua “egemonia” come forma visuale si è accompagnata negli ultimi decenni a costanti trasformazioni tecnologiche. Questo suo carattere intimamente mutevole mi pareva avesse non pochi punti di contatto con l’attuale rivoluzione algoritmica dell’immagine. Quasi centosettanta anni fa Baudelaire salutava la fotografia come il nemico mortale della pittura, «il rifugio di tutti i pittori mancati, scarsamente dotati o troppo pigri per compiere i loro studi», chiosando che se le si concederà di sostituire l’arte in qualcuna delle sue funzioni, «essa presto la corromperà del tutto grazie all’alleanza naturale che troverà nell’idiozia della moltitudine». Anziché muovere un’accusa analoga a chi oggi guarda con sospetto l’utilizzo dell’IA nella pratica artistica, sarebbe forse utile ricordare che la sottrazione ai pittori dell’obbligo della rassomiglianza e dell’assillo realista fu la premessa che consentì la nascita della pittura moderna. Insomma, di provare a mantenere un atteggiamento equilibrato e antidogmatico rispetto alla questione dell’immagine nell’epoca dell’intelligenza artificiale, schivando la costante e ossessiva domanda “dov’è l’umano?”, che diviene naturalmente “chi è l’autore?”. Da ultimo, iniziare con la fotografia mi ha consentito di interrogare la sua presunta obiettività essenziale, l’idea ampiamente sedimentata che la fotografia abbia con il visibile un rapporto più puro, più diretto e più preciso di qualunque altro oggetto mimetico e di osservare l’evoluzione per così dire “mediale” di quest’assioma: se con la fotografia nasce il valore documentale dell’immagine, esso muore con l’avvento delle tecnologie text-to-images, basti pensare ai numerosi deep fake che affollano il web, dall’ormai iconica foto di Papa Francesco in Balenciaga fino all’evoluzione della Fan culture ai tempi delle immagini generate dall’IA, che vede coinvolto l’attore Joe Keery – uno dei volti più amati della serie tv Stranger Things – nella ricostruzione artificiale di un idillio amoroso per opera di una sua fan. In realtà, più che di “fine” del valore documentale si dovrebbe parlare di una sua riconfigurazione istituzionale, poiché nessun realismo dipende dal medium in cui s’incarna. In altre parole, non c’è nulla di scontato nel realismo fotografico: il realismo è semmai un destino dell’immagine e non un dato di partenza deducibile dal medium in cui s’incarna l’immagine.
A.M. : In una prospettiva che dialoga con la fenomenologia di tradizione francese, concepisce l’immagine non soltanto a partire da ciò che essa rende visibile, ma anche, e forse soprattutto, a partire dal suo invisibile, da ciò che in essa rimane latente. A questo riguardo, cosa sono le “immagini stock” e qual è il loro risvolto etico e politico?
Penso che chi si è formato sui testi della tradizione fenomenologica francese, e sulla loro ricezione contemporanea, ha ben presente quel passaggio de Il visibile e l’invisibile in cui Merleau-Ponty parla del puctum caecum, ricordando che “la retina è cieca nel punto in cui si diffondono in essa le fibre che permetteranno la visione”. Per me si è trattato di far interagire questa tradizione con l’iperconsumo di immagini del mondo contemporaneo, provando a chiedersi cosa voglia realmente dire che un’immagine si mostra sempre a partire da ciò che al contempo cela. E quindi ricostruendo il contesto, il non detto della scena, i presupposti fortemente culturalisti del nostro sguardo. In tal senso, le immagini di stock rappresentano un caso paradigmatico. Per immagini di stock si intendono infatti quelle fotografie che vengono acquistate online da webmaster, pubblicitari e, in generale, da chiunque abbia bisogno di un’immagine da inserire all’interno di un contenuto che sta creando, attingendo da database come Adobe stock, Shutterstock, iStock, et varia. Il risultato che è sono ovunque: sulla brochure del nostro dentista, sui cartelloni pubblicitari, nei servizi al tg. Sono dunque “famigliari” e rappresentano lo specchio che la società utilizza per raccontare visivamente sé stessa. Questo tratto di familiarità fa sì che non si presti loro particolare attenzione, considerate al pari di uno sfondo della nostra cultura consumistica. Ora, le piattaforme che consentono di generare immagini attraverso l’IA – da Midjourney a Dall-E fino a ChatGPT – creano sulla base di un repertorio di immagini già acquisito, che funziona come una sorta di nutrimento algoritmico: è interessante notare che l’ingrediente principale della loro dieta è rappresentato da immagini di stock. Diviene dunque filosoficamente pertinente interrogarsi su come le immagini stock contribuiscano al rafforzamento di regimi visivi normativi, che spesso riproducono stereotipi, emarginano identità non dominanti e oscurano le condizioni sociotecniche alla base della produzione algoritmica delle immagini. Sono, in tal senso, davvero la contropartita segreta dell’immagine visibile, e ciò ha delle importanti ricadute etiche e politiche sulla nostra comprensione visuale.
A.M. : In che modo lo spazio latente dei modelli può essere pensato come una forma di “memoria possibile”?
Gli spazi latenti sono spazi vettoriali multidimensionali dove si trovano grandi quantità di oggetti culturali codificati e compressi sotto forma di vettori. Mediante una sorta di “collasso mediale” e di compressione epistemica, tutti i media – siano essi immagini, testi o suoni – sono ridotti a uno solo. Sono pertanto la rappresentazione in forma vettoriale dei dataset utilizzati per l’allenamento dei modelli e, come dicevamo poc’anzi, la capacità di generare immagini è fortemente connessa ai contenuti dei dataset. Gli spazi latenti rappresentano una specie di anti-archivio in cui è pressata tutta la memoria del mondo, una enciclopedia cinese che fa saltare ogni possibile tassonomia, poiché dello stesso oggetto si trovano più variazioni possibili. Questo archivio sui generis trasforma non sono il concetto stesso di archivio – come principio di raccolta ordinata – ma anche il nostro rapporto al tempo. La generative AI, e in particolare i sistemi di visual generation, non operano secondo una logica di memoria storica o archivistica in senso tradizionale. Essi non conservano immagini come tracce del passato, bensì apprendono distribuzioni statistiche a partire da grandi collezioni di dati visivi. Ciò che viene trattenuto non è l’evento iconico in quanto tale, ma la probabilità della sua ricomparsa sotto forma di configurazione visiva plausibile. In questo senso, lo spazio latente può essere inteso come una memoria probabilistica dell’immaginabile: una struttura matematica in cui si sedimentano schemi, relazioni e ricorrenze visive che delimitano l’insieme di ciò che può essere generato, e dunque di ciò che può apparire come possibile. Tale memoria non è orientata al passato, ma al campo del possibile, definendo i confini entro cui l’immaginazione algoritmica può operare senza attrito. È come se si aggiungesse un nuovo strato di memoria, una memoria possibile appunto o controfattuale. Ovviamente si tratta di un’operazione non neutrale, che si origina a partire da dataset culturalmente situati che a loro volta incorporano bias del mondo, dei dati e dell’algoritmo stesso. Al netto di queste distorsioni, la dimensione specifica delle immagini di IA è quella ipotetica, proprio per l’imprevedibilità del risultato a partire dalla consegna linguistica. Non è un caso che la prassi artistica che incorpora l’uso di algoritmi sia stata spesso avvicinata alla stagione del surrealismo, né tantomeno che molti artisti che lavorano con l’IA addestrano l’apprendimento automatico con propri dataset, in un delicato sistema di pesi e contrappesi in cui la dimensione stocastica diviene essa stessa una variabile artistica.
A.M. : Se l’arte non si limita a rappresentare il visibile, ma interroga la latenza delle immagini e le loro condizioni di possibilità, come si ridefinisce questa funzione nell’epoca del digitale? L’arte rischia di diventare una funzione della tecnica, oppure conserva la propria capacità critica e interrogativa?
Indubbiamente lo sviluppo di pratiche artistiche legate all’uso delle intelligenze artificiali ha sollevato tutta una serie di questioni legate al rapporto tra creatività e artificialità, all’autorialità e all’autenticità dell’opera. Uno degli argomenti che viene evocato più di frequente quando si parla di immagini create dall’IA, è che queste sarebbero più vicine a una copia che a un atto di creazione vero e proprio. In realtà, dietro il paradigma della copia, si occulta una domanda più stringente: le IA sono capaci di fare arte? Qui l’interrogativo sul rapporto fra la prassi artistica e l’uso delle intelligenze artificiali ricalca lo stereotipo del questo lo so fare anch’io, ed è senz’altro vero. Generare un’immagine con Midjourney, ad esempio, è un’operazione semplice, che non abbisogna di particolari capacità tecniche. Basta digitare un comando linguistico e la macchina farà il resto. Ma c’è prompt e prompt. Se generare un’immagine è piuttosto semplice, assai più complesso è creare una formula estetica coerente. Connessa alla questione della facilità vi è quella dell’autorialità, secondo cui le visual gen-AI si limiterebbero a scimmiottare stili attingendo dal bacino della storia dell’arte pregressa. Tuttavia, se quest’argomento fosse valido per sé dovremmo bandire dalla storia dell’arte tutti i pittori caravaggeschi perché imitavano il Caravaggio o i manieristi perché si rifacevano a Michelangelo. La copia, così intesa, è parte costitutiva di ogni arte. Un’immagine generata con modelli testo-immagine non nasce dal nulla: si nutre dei materiali su cui l’algoritmo è stato addestrato. Ma lo stesso accade da sempre: nessuna opera è senza genealogia. Caravaggio non avrebbe dipinto come ha dipinto senza la tradizione fiamminga e le conoscenze ottiche del suo tempo; Stravinskij non avrebbe scritto certe partiture senza Bach e il folklore russo; la Nouvelle Vague non esisterebbe senza il cinema classico americano; il rap senza il soul e il funk da cui campiona. Ogni creazione è un innesto di tecniche, memorie e incontri precedenti che la rendono possibile. In questo senso dobbiamo apprendere che automatico e creativo non si escludono e farci carico di ripensare esempi di autorialità collettiva e remixata. Da ultimo, anche la discussione sulla “autenticità” va riposizionata. Se la intendiamo come purezza di origine, perderemo tempo a inseguire fantasmi, perché anche le opere ante IA sono in qualche modo impure, forgiate da tradizioni, scuole, influenze, committenze e mercati. Se la intendiamo come fedeltà a una identità dichiarata nel processo, allora possiamo pretendere che l’artista espliciti le scelte decisive, che i contesti di esposizione informino, che i mercati non vendano opacità, che le scuole insegnino a leggere e a scrivere processi. L’autenticità, in questa epoca, è fedeltà alla complessità dell’operare, ossia una condizione di intelligibilità.
A.M. : Infine, in che senso ritiene necessario elaborare un’etica dell’intelligenza artificiale? Quali sono, a suo avviso, le principali questioni teoriche e pratiche che rendono urgente tale riflessione?
Io credo che la riflessione etica sull’intelligenza artificiale andrebbe orientata almeno su due fronti. Il primo riguarda gli aspetti politici, sociali ed energetici di queste tecnologie, riconoscendo che non si possono pensare indipendentemente da una ragione sociale. A titolo di esempio, si consideri che ogni domanda formulata nel prompt della IA generativa, è responsabile, sommata per mille volte, di tanta CO2 quanto guidare per un metro. È un tema vastissimo, ma ineludibile. Il secondo è quello che ho provato ad articolare nel testo utilizzando la formula “paradigma di visibilità”: le immagini di IA rendono particolarmente evidente la complicità strutturale tra visibile e invisibile perché sorgono da processi che sfuggono all’esperienza percettiva umana: enormi basi di dati, reti neurali e procedure algoritmiche prevalentemente opache che pure suggeriscono e mostrano, influenzando le nostre azioni. È precisamente questa dimensione di invisibilità che deve essere portata al centro dell’analisi per comprendere la posta in gioco etica e politica degli ambienti digitali contemporanei. Le immagini generate dalle macchine non sono solo prodotti visivi, ma atti di selezione: ciascuna traduce una scelta implicita su ciò che può apparire e su ciò che viene escluso dalla scena pubblica. Ne consegue che un’etica delle immagini non può limitarsi a invocare trasparenza, ma deve interrogare i regimi di visibilità incorporati nei sistemi algoritmici: quali soggetti, corpi e prospettive vengono resi rappresentabili, e quali, al contrario, sono sistematicamente relegati fuori campo.

