IA & Poesia 2

L’ultima edizione del Festival Pordenonelegge ha dato ampio spazio a riflessioni e implementazioni pratiche relative all’Intelligenza Artificiale (IA), alla luce della pervasività sempre maggiore che questa tecnologia ha assunto in ogni circuito dell’esistenza, comprese le interrelazioni con il mondo artistico, considerato in tutte le sue forme.

In effetti, non è più possibile parlare di letteratura, cinema, musica o arte senza tenere conto degli impatti, positivi o negativi, dei rischi e delle opportunità che l’IA e i suoi utilizzi stanno portando con sé anche in questi ambiti, rendendo necessari nuovi paradigmi interpretativi e un affinato pensiero critico, indispensabile per districare e valutare un ecosistema ad alto grado di complessità, completamente interconnesso e sempre più lontano dal potere essere analizzato mediante formule semplificatrici e banalizzanti.

In questo contesto, dunque, così sensibile al tema, ha trovato casa il format “Societry. La Società raccontata con la poesia”, da me ideato insieme a Cristina Daglio, Matteo Fantuzzi e Chiara Materazzo nel 2023, qui declinato nello studio del dialogo tra IA e Poesia, partendo da tre prospettive di indagine differenti, quali quella del linguaggio, dell’immagine e della memoria, ponendo di volta in volta a confronto un poeta e un esperto della materia

Nel primo incontro abbiamo ascoltato Vincenzo Della Mea, professore associato di Sistemi di Elaborazione delle Informazioni e autore, per la collana Gialla di pordenonelegge – Samuele editore di Clone 2.0, e il ricercatore in Filosofia e Teoria dei Linguaggi Damiano Cantone (QUI).

Nel secondo incontro abbiamo ascoltato Simona Chiodo, professore ordinario di Filosofia presso il Politecnico di Milano, e Francesco Terzago, poeta e fotografo.

Di seguito i testi che hanno donato per riprendere, anche qui, le loro considerazioni sul tema.

 
 

Creare immagini
di Simona Chiodo

Cominciamo la nostra riflessione sulle immagini prodotte dall’intelligenza artificiale a partire da un caso reale: Edmond de Belamy è un’immagine (in particolare, un ritratto) prodotta da un’intelligenza artificiale generativa su iniziativa del collettivo di artisti Obvious, che è stata venduta da Christie’s nel 2018 per $ 432.500. Il processo dell’intelligenza artificiale generativa è stato il seguente: attraverso una serie di prove ed errori, il cosiddetto “generatore” ha prodotto un’immagine che il cosiddetto “discriminatore” non è stato capace di distinguere dai 15.000 ritratti dipinti da esseri umani tra i secoli XIV e XIX sui quali è stato addestrato. L’immagine prodotta non è una sorta di media dei dati (in particolare, dei ritratti) di partenza, ma un’immagine originale.

Edmond de Belamy

La domanda che potremmo farci è la seguente: Edmond de Belamy è arte? E la risposta che proporrei è negativa, per due ragioni essenziali, se non altro (che ho sviluppato in Chiodo 2024).

La prima ragione è meno complessa: l’artisticità non può essere ridotta all’esteticità (anche quando l’esteticità coincide con un’immagine originale). In altre parole, l’indistinguibilità estetica di due immagini (ad esempio, Edmond de Belamy e un ritratto dipinto da un essere umano) non è sufficiente a fare della prima immagine arte.

La seconda ragione è più complessa e può essere introdotta dalla testimonianza di un’artista, secondo la quale “[l]’intelligenza artificiale [con la quale lavora] è in grado di copiare e di suggerire, ma in ultima analisi tutto inizia e finisce con me. Non mi preoccupa molto l’idea di macchine che dipingano o di GAN [generative adversarial network, che è anche il caso di Edmond de Belamy] che realizzino quella che è essenzialmente carta da parati – arte priva di intenti. Non mi interessa tentare di insegnare a una macchina a disegnare come un essere umano o a produrre immagini che sia impossibile riconoscere come prodotte da una macchina. […] A me, tuttavia, interessa proprio il contrario” (Ridler 2020: 127). Il suggerimento dato dall’artista è che il processo di realizzazione, insieme con le sue ragioni, è essenziale – e fa la differenza tra un’immagine che possiamo definire arte e un’immagine che non possiamo definire arte.

Proviamo a considerare, nel caso di un’immagine che possiamo definire arte, La Celestina, che è un ritratto dipinto da Picasso nel 1904, e, nel caso di un’immagine che non possiamo definire arte, Edmond de Belamy.

La Celestina è il ritratto di una cosiddetta ruffiana. Uno dei suoi occhi è cieco, le irregolarità della sua faccia sono marcate e i suoi colori sono scuri. Non a caso, è stata letta di frequente come il simbolo non solo di un abbruttimento morale, ma anche di un potere pietrificante, come nel caso di una storica dell’arte secondo la quale la donna ritratta da “Picasso aveva un occhio buono e un occhio cattivo. […] Lo sguardo di Celestina era punitivo. Come lo sguardo di Medusa, agiva da simbolo di una donna divoratrice che aveva il potere di pietrificare la sua vittima. […] Come altri artisti mediterranei, Picasso condivideva la paura dell’occhio cattivo, come organo distruttivo che poteva ferire, divorare, rubare o mordere. […] Celestina è pervasa da un’aura di conoscenza e potere speciali sia per il suo aspetto sia per il nome scelto per lei da Picasso, con le sue associazioni numerose” (Holloway 2006: 118-119). Il dialogo indiretto tra Picasso e la storica dell’arte è densissimo (e continua per pagine). In effetti, se ci immaginassimo di chiedere a Picasso per quali ragioni ha deciso di caratterizzare il suo ritratto con la categoria estetica della bruttezza e con colori scuri, potremmo figurarci una risposta pensata e profonda, radicata nella sua esperienza esistenziale (che le parole citate documentano in parte).

Celestine, Picasso

Che cosa succederebbe nel caso di Edmond de Belamy? Anche i suoi colori sono scuri, in aggiunta a contorni sfumati. Potremmo quasi dire che la sua immagine ci fa riflettere sulla nostra malinconia. Ma che cosa succederebbe se ci immaginassimo di chiedere all’intelligenza artificiale per quale ragione ha deciso di caratterizzare il suo ritratto con colori scuri e contorni sfumati? Proporrei la risposta seguente: anche se i suoi colori scuri e contorni sfumati ci facessero riflettere sulla nostra malinconia, la nostra riflessione sarebbe in qualche modo analoga a quando ci succede di riflettere sul passare del tempo della nostra vita di fronte ad albe, tramonti e semafori – in entrambi i casi, non potremmo figurarci risposte pensate e profonde, radicate in esperienze esistenziali, ma niente altro che una sorta di casualità. Da un lato, albe, tramonti e semafori possono farci riflettere per caso, e non per altro, sul passare del tempo della nostra vita. Dall’altro lato, Edmond de Belamy può farci riflettere per caso, e non per altro, sulla nostra malinconia.

In effetti, c’è un senso significativo nel quale Edmond de Belamy risulta da una sorta di casualità: le ragioni dei suoi colori scuri e contorni sfumati non sono date da altro che dal processo automatico delle correlazioni statistiche tra i dati di partenza, cioè tra i 15.000 ritratti dipinti da esseri umani tra i secoli XIV e XIX sui quali il cosiddetto “discriminatore” è stato addestrato.

E, in effetti, il processo automatico citato ci porta a un altro senso, ancora più significativo, nel quale Edmond de Belamy risulta da una sorta di casualità: parlare di automazione significa parlare del verbo greco αὐτοματίζω (automatizo), cioè dell’azione che il dizionario Liddell-Scott-Jones definisce attraverso l’espressione avverbiale “at random” – che ci parla, ancora, di casualità.

Al contrario, La Celestina risulta dal processo opposto alla casualità dell’automazione – La Celestina risulta dalla non casualità dell’autonomia, cioè di un essere umano che, prima, fa esperienza (in qualche caso diretta e in qualche caso indiretta) di una condizione esistenziale umana (ad esempio, dell’abbruttimento morale), poi, ci riflette sopra (in qualche caso consciamente e in qualche caso inconsciamente) e, in ultimo, trova la forma capace di essere un simbolo non solo individuale, ma anche sociale, della condizione esistenziale umana di partenza (in altre parole, La Celestina risulta da uno dei processi privilegiati attraverso i quali gli esseri umani, da millenni, danno senso alla loro esistenza, cioè al loro essere esseri umani).

Allora, perché affidarci a Edmond de Belamy e non a La Celestina per capire di più il senso della nostra esistenza? La risposta che proporrei potrebbe sembrare paradossale: anche Edmond de Belamy ha qualcosa di importante da farci capire sul senso della nostra esistenza, a partire dalla nostra scelta di passare da Picasso all’intelligenza artificiale – che significa passare dall’esercizio dell’autonomia (che pone azioni e responsabilità sulle nostre spalle) all’esercizio dell’automazione (che pone azioni e responsabilità su altre spalle, se non altro in parte). Allora, la cosa importante che Edmond de Belamy ha da farci capire sul senso della nostra esistenza è che è possibile che non sopportiamo più il peso schiacciante della nostra autonomia, a partire dalla responsabilità individuale di azioni che devono essere all’altezza di aspettative (altissime) sia individuali sia sociali – e, allora, l’intelligenza artificiale può essere letta come la nostra possibilità di alleggerirci dai pesi schiaccianti della nostra autonomia sia quando siamo artisti sia quando siamo altri professionisti, ma anche cittadini nella nostra vita quotidiana.

Se consideriamo la nostra realtà globale, caratterizzata da complessità e incertezze estreme (a partire da emergenze sanitarie, emergenze climatiche, crisi geopolitiche, crisi economiche, crisi democratiche, crisi di ideali e guerre), l’autonomia degli artisti in particolare, che sono più responsabili di altri di trovare la forma capace di dare addirittura senso al nonsenso, può essere uno tra i pesi più schiaccianti da sopportare – allora, e ancora, l’intelligenza artificiale può essere letta come la nostra possibilità di alleggerirci addirittura dal peso più schiacciante da sopportare nella nostra realtà complessa e incerta: il peso del dare senso all’esistenza umana, a partire dalla nostra vita quotidiana.

 

Riferimenti bibliografici citati:
Chiodo, S., What AI “art” can teach us about art, “Journal of aesthetics & culture”, 16, 1/2024, pp. 1-13.
Holloway, M., Making time. Picasso’s Suite 347, Peter Lang Publishing, Bern-New York 2006.
Ridler, A., Set di dati e decadenza. Fall of the house of Usher, in A. Barale (a cura di), Arte e intelligenza artificiale. Be My GAN, Jaca Book, Milano 2020, pp. 110-127.

 
 

Superare i fraintendimenti
di Francesco Terzago

Non ho paura dell’IA, ma del fraintendimento tecnologico: del limite che abbiamo nel valutare un nuovo strumento espressivo sulla base della conoscenza di quelli già disponibili e di ciò che il loro utilizzo sortisce, e di come il loro uso, sedimentato nei secoli, ci abbia suggerito alcuni limiti – limiti di forma, limiti espressivi, limiti di intervento sulla materia. L’addestramento passivo, così come lo studio dell’interpretazione di un linguaggio espressivo (pittura, scultura ecc.), può farci operare in modo pregiudiziale quando ci accingiamo ad attraversare geografie inesplorate, come nel caso dell’IA. È un problema di aspettative.

Chiarisco subito un punto. In questo discorso l’utilizzo pigro e di servizio di queste tecnologie, delle IA, non ha per me alcun interesse: per ciò che mi riguarda, non ha modo di rientrare né nello spazio letterario né in quello dell’arte. Se pensiamo che l’IA sostituisca l’illustrazione o la pittura, stiamo osservando la questione con lenti interpretative inadatte.

Dovremmo considerare, sulla base degli aspetti tecnici, le potenzialità dell’IA di produrre nuove forme d’arte e non la capacità che essa ha di generare materiale visivo di servizio, cioè utile alle consuetudini dell’industria della comunicazione o all’editoria di piccolo cabotaggio, quella che non si assume alcun rischio e desidera immettere sul mercato prodotti che paiono, al consumatore, sempre familiari: un’eco sbiadita di ciò che è già disponibile a scaffale.

Cerchiamo di considerare queste tecnologie per ciò che sono. Non credo di dire nulla di nuovo quando sostengo che sia più importante, oggi, interrogarsi non sull’esito in sé dei dispositivi text-to-image (Midjourney) o dei chatbot (ChatGPT), quanto sul processo cyborg che rende possibile i loro output e sulla dimensione progettuale che li coinvolge.

Cyborg nei termini in cui chi utilizza queste tecnologie è influenzato, nelle sue intenzionalità creative, dai risultati che, grazie a esse, potrà perseguire; è contaminato, i suoi processi cognitivi alterati, perfino amplificati. Procediamo per tentativi, in una concatenazione di input e output. Poniamo in essere strategie adattive così da ottenere, con numerosi passaggi, un risultato che possiamo collocare in uno spazio intermedio tra un’eventuale immagine che abbiamo nella nostra mente (il nostro desiderata) e quanto comparirà a schermo.

Una dimensione dialogica – simulazione di dialogo, poiché un dialogo presupporrebbe atti linguistici – che persegue la somiglianza ma, difficilmente, la fedeltà.

In altre parole, quanto si ottiene è un compromesso frutto di un’attività di traduzione: traduzioni concatenate, polisemie, ambiguità segniche e rarefazioni semantiche. Istruiamo l’IA tramite prompt espressi in un linguaggio naturale, indirizzando un processo il cui esito non è scontato e che, tra glitch e allucinazioni, sarà sempre causa di stupore (il problema sarebbe se non lo fosse, perché ciò significherebbe una totale sovrapposizione tra cervello e hardware). Stupore e attesa, come chi, orientandosi con le stelle, cerchi di raggiungere una terra inesplorata e per lui ignota, della quale conosce l’ubicazione grazie a vecchie carte: quando ne raggiungerà la costa si troverà davanti scogliere aguzze, foreste o persino un insediamento. Avrà raggiunto la sua meta, ma le sembianze di quei luoghi potrebbero essere molto differenti da ciò che ha sperato o da ciò che si aspettava; e allora potrà decidere se proseguire la navigazione a poca distanza dalla riva, fino a quando non scorgerà l’insenatura che ha agitato i suoi sogni, oppure scendere sbarcare lì dove le correnti lo hanno sospinto.

 

Somiglianze e divergenze

Consideriamo ora le somiglianze con altri processi: al pari di uno scultore che stringe in mano un martinetto idraulico, o di un artista digitale che operi con Illustrator o Photoshop, subiamo l’influenza dei medium creativi; anche questi strumenti ci contaminano.

Anzi, nei due casi che provocatoriamente ho portato a confronto, il rapporto tra tecnica (téchne) e tecnologia è più insidioso — rispetto a quello delle IA. Sfumato, perché esplicitare il perimetro di un’eventuale sovradeterminazione, quella operata dallo strumento su di noi, chiarire come lo strumento ci colonizzi, trova difficile esplicitazione: è un fatto più spiccatamente di corporeità, non solo di parola. La nostra postura cambia, i nostri muscoli si irrobustiscono, il nostro cervello apprende specifici movimenti e a esercitare la pressione della mola sul marmo, come sulla tavoletta grafica. Per ognuna di queste operazioni non è necessario produrre un prompt o verbalizzare; possono persino svolgersi in un silenzio interiore.

Noi “crediamo” di governare lo strumento perché la forma che otteniamo dalla materia (scultura) è in qualche modo fedele all’immagine mentale che abbiamo in noi, o che abbiamo trasferito su carta o in un bozzetto. Ma quanto influisca su di noi, sull’atto di “pensare la statua”, l’aver acquisito con gradualità i saperi necessari al processo di trasformazione della materia non ci è chiaro. La forma dialogica, gli input-output delle IA, invece, quando consideriamo esclusivamente il rapporto tra testualità e immagine, e tra testualità e testualità, ci suggerisce il confronto delle varie versioni di prompt che si sono succedute; suggerisce un’attività genealogica, una questione di filologia forse più che di informatica.

Ancora, quando utilizziamo uno scalpello, una spatola o un pennello piatto non ci interroghiamo su quali siano le implicazioni di stringere tra le dita quei manici, benché quegli stessi oggetti siano frutto di processi industriali e, pertanto, rispondano essi stessi a necessità di omologazione, a un produttivismo che applica standard diffusi su scala globale. In Cina, in Spagna, in India, negli Stati Uniti sono disponibili gli stessi strumenti, prodotti su larga scala, e in ogni luogo la reperibilità di strumenti identici rende da un lato possibile il trasferimento dei processi e la diffusione di saperi analoghi, dall’altro promuove abitudini di consumo e stabilisce un perimetro, difficile da sondare, all’azione artistica: una curiosità che, nella diacronia, è indagata non dai protagonisti ma da storici dell’arte, studiosi di estetica e archeologi.

 

Poesia e Intelligenza Artificiale: uscire dall’omologazione, sovvertire

Un esempio potrebbe essere trasformare l’utilizzo delle IA in un gesto che non sia di pura necromanzia, cioè limitato a evocare immagini e parole morte, riportandole a una vita apparente e deteriorata, ma capace – attraverso l’elaborazione di specifiche testualità da parte dell’operatore (prompt) – di produrre estetiche significative e distanti dagli usi di servizio, per come sono già stati definiti in questo scritto. Estetiche rese possibili solo in relazione alle caratteristiche intrinseche del dispositivo: non un’eco di qualcosa che è stato utilizzato per alimentare questi stessi sistemi generativi e che ci ritorna, nell’ottundimento delle forme e nell’esasperazione dei colori, privato della sua aura, ma compost e scorie capaci di germinare, di esporre funghi, corpi fruttiferi di miceli invisibili.

Perseguire ciò che è inatteso nell’esercizio della lingua poetica, nel suo alto grado di connotazione, proprio perché questo si pone a grande distanza dalla dimensione denotativa di un codice, o perlomeno di come demoticamente lo intendiamo. Forzare i limiti di simili strumenti, ingannarli, stendere prompt che contengano volutamente informazioni, luoghi e immagini o inesistenti o inaccessibili, o di difficile individuazione sia per la persona umana sia per il programma stesso; oppure simboli decifrabili solo se si considera l’esperienza di autrici e autori dei prompt stessi, la loro corporeità, la loro dimensione relazionale, il loro portato biografico. Sondare così i margini dei database e della capacità espressiva dell’IA; ottenere output al contempo inaspettati, proprio perché preclusi alla nostra stessa capacità predittiva, e archetipali. Comunque risultati distanti dallo spettro di ciò che riteniamo plausibile e che ribadiscono il fatto che l’IA, come ogni altro strumento, produce solo se coinvolta nella nostra intenzionalità e visione progettuale.

 

L’obbedienza di disobbedire

Se io dico a una IA di rappresentare l’albero che ho davanti a me in un dato momento, cioè utilizzo l’enunciato “raffigura l’albero che ho davanti a me” lei potrebbe chiedermi, è il caso di ChatGPT, di fornire l’immagine del referente stesso, come un pittore di paesaggio a cui si stia commissionando uno scorcio suggestivo. 

A questo punto è possibile rispondere “no, immagina tu l’albero che ho davanti a me”.

Quale sarà il risultato di un simile processo nel momento in cui, per di più, davanti a noi non c’è nessun albero?

Partendo da prompt così semplici, essenziali e per nulla particolareggiati, o viceversa esuberanti, in termini stilistici, quale potrà mai essere la raffigurazione di “albero”? Un albero par excellence; banalizzando, una sommatoria di “alberi”? 

Otterremo, e questo lo posso dire dopo aver compiuto un simile esperimento, un’immagine frontale dell’oggetto, una scena diurna, luce diffusa, nessun fiore, solo fronde verdi. 

Se la stagione in cui eseguiamo una simile richiesta è l’inverno e il luogo in cui ci troviamo è la Lapponia, o la Grecia, l’albero che apparirà nell’interfaccia sarà sempre lo stesso – sano, con fronde verdi, fogliame generoso, con uno sviluppo della chioma ordinato e simmetrico. 

Sarà diverso ciò che otterremo a seguito di una frase come questa: “mostrami un albero che rappresenti la mia condizione interiore, la mia sensibilità letteraria/artistica – fa’ questo considerando quello che conosci di me”.

E a questo punto ci potremo spingere ancora più in là, utilizzando testi poetici prodotti appositamente per istruire dispositivi text-to-imagine o chat-bot in modo tale da far emergere, dal crogiolo di possibilità, formule magiche o immagini inattese e che non possono, in alcun modo, contenere l’intero spettro dei significati racchiuso in un testo poetico, testimoniarne le stratificazioni. 

Proprio nell’esplorazione di simili prove di deterioramento, di rovine, di lacerti del messaggio, di emersioni imprevedibili individuare possibilità di poetiche IA. 

 

Di Francesco Terzago leggi anche Arcipelaghi e geografie sommerse