ART AND ARTIFICIAL INTELLIGENCE

Page 1

A cura di Alice Barale

ARTE E INTELLIGENZA ARTIFICIALE BE MY GAN


Indice

Progetto editoriale Vera Minazzi © 2020 Editoriale Jaca Book Srl, Milano tutti i diritti riservati

Alice Barale

7

Caterina Moruzzi

Arte e intelligenza

Alla ricerca della creatività:

artificiale: alcune domande

le gan come paradigma

147

dell’autonomia nel software Prima edizione aprile 2020 Seconda edizione ottobre 2020

Michael Castelle

19

per la composizione musicale

La vita sociale delle reti antagoniste generative ( gan )

Obvious

167

La Famille de Belamy e i Marian Mazzone Le

gan

51

e la questione

Sogni elettrici di Ukiyo: reinterpretazioni e accelerazioni

della creatività nell’arte Vera minazzi

e nell’intelligenza artificiale

195

Gan e musica, on the road Mario Klingemann

75 Alice Barale

215

Memories of Passersby i

75

Imposture Series

89

Uncanny Mirror

97

Hyperdimensional Attractions

103

Infinite Skulls 215 Robbie Barrat/Ronan Barrot Learning to see Memo Akten

224

111

Circuit Training Mario Klingemann

233

Note e bibliografia

239

Who’s who

261

Anna Ridler Set di dati e decadenza: Fall of the House of Usher Georgia Ward Dyer Le gan e la mimesi

129

A hideaway in the wastelands: nuove sfide filosofiche dell’ai art


ARTE E INTELLIGENZA ARTIFICIALE BE MY GAN

nota di lettura

Nella colonna a lato del testo il lettore può trovare dei cross-reference, ossia dei rimandi a contenuti presenti nel libro o sul Web. Il riferimento a immagini del volume è indicato con il numero dell’immagine seguito da una freccia e dal numero di pagina. Per i numerosi rimandi ad articoli scientifici, filmati, interviste, contributi su siti e riviste on line, oppure ai video di artisti e opere di cui si discute nel libro, abbiamo scelto i QRCode per la loro immediatezza (sono disponibili molte applicazioni gratuite per scansionare i QRCode con il telefono cellulare). Per chi non utilizzasse i QRCode, i link sono scritti sotto ai QRCode stessi o nelle note.


Arte e intelligenza artificiale: alcune domande Alice Barale

To my favourite gan

1. Edmond de Belamy - La Famille de Belamy, Obvious 2018. In asta da Christie’s New York a ottobre 2018. Vedi anche 13 p. 181

6

Filmato da Le Figaro live con Pierre Fautrel del collettivo Obvious e Richard Lloyd, International Department Head, Prints & Multiples, Christie’s New York. https://bit.ly/2AZ6c7R

Nell’ottobre del 2018, un evento inaspettato si verifica presso la prestigiosa casa d’aste Christie’s. Viene venduta un’opera destinata a far molto discutere. Ritrae un gentiluomo vestito di nero, con un elegante colletto bianco e un’aria leggermente malinconica o pensierosa. Una preziosa cornice scende un po’ troppo bassa sulla sua testa, come ad accentuare l’incertezza del colore nero che lo circonda e da cui la sua sagoma emerge appena. Come in ogni ritratto “classico”, il gentiluomo ha un nome: Edmond de Belamy1. Probabilmente francese, quindi. A complicare le cose, la firma, ben visibile nella parte chiara, inferiore del quadro: assomiglia più a una formula matematica che a un nome. L’opera, forse, di un matematico-pittore? Certo non privo di un qualche successo, dal momento che il quadro viene venduto a quaranta volte il valore stimato in partenza. Il Ritratto di Edmond de Belamy, però, non è opera di un artista umano, ma di un’intelligenza artificiale2 (in particolare, di una gan: chiariremo tra poco il significato di questa sigla). Di qui la firma, che altro non è che una formula chiave dell’algoritmo con cui è stato realizzato il quadro. È la prima volta che un’opera creata da un’intelligenza artificiale viene messa in vendita sul mercato 7


d’arte mondiale. Il successo ottenuto rende d’improvviso evidente anche al pubblico non specializzato i molti problemi – filosofici, storico-artistici, sociologici – che il nuovo tipo di arte pone. Chi è, infatti, il creatore del quadro: l’algoritmo o gli artisti umani? Vedremo che un tentativo di risposta a questo interrogativo porterà a cambiare, in parte, la domanda stessa. Nel marzo del 2019, l’evento si ripete. Mario Klingemann, uno dei più importanti artisti che lavorano con l’intelligenza artificiale, vende presso l’altrettanto prestigiosa casa d’aste Sotheby’s un’opera – Memories of Passersby i – che consiste in una serie, virtualmente infinita, di ritratti di persone inesistenti, prodotti da una macchina in tempo reale. Cosa significa però, per un’intelligenza artificiale, fare un ritratto? È questo un problema del tutto nuovo, che il lavoro di Klingemann pone con forza. I visi che ci si fanno incontro in quest’opera non sono semplici riproduzioni, ma imitazioni che producono nuove somiglianze e nuove identità appena accennate, passeggere come i visitatori dell’installazione. Questo elemento trasformativo, denso di quelli che Klingemann chiama gli «artefatti» – incongruenze, strane interpretazioni, deformazioni, errori –, è tipico del mezzo utilizzato, l’intelligenza artificiale e in particolare la gan3; è il segno che essa lascia sul ritratto, come «la grana su una fotografia»4. Di fronte ai primi riconoscimenti di queste opere da parte del mondo istituzionale dell’arte, le reazioni della critica e del pubblico sono violente e divise. Come osservano i membri di Obvious, che hanno vissuto da vicino il processo: «Alcuni considerano l’intelligenza artificiale uno strumento pericoloso che rischia di annientare gli artisti; altri la ritengono un elemento al di fuori dalla loro portata, destinato a non avere mai alcun impatto sulla loro vita quotidiana. Vi è chi vi ravvisa un promettente ambito di investimento, e chi la considera una bolla economica. Gli uni la ritengono qualcosa che contraddice le leggi della natura, gli altri il logico percorso di sviluppo della specie umana»5. Che cos’è però l’arte prodotta con l’intelligenza artificiale? Su questo, le idee sono ancora piuttosto confuse. Spesso la ai art viene identificata con la computer (o digital) art. C’è però una differenza essenziale tra le due. Perché si possa parlare di ai art, occorre che l’opera non 8

Memories of Passersby i Mario Klingemann 2018. In asta da Sotheby’s a marzo 2019. 2

p. 76-77

nota 9

Generative Adversarial Nets. L’articolo del 2014 di Ian Goodfellow e del gruppo dell’Università di Montréal sull’ideazione delle gan.

sia semplicemente «computer assisted», ma «computer generated»6. È necessario, cioè, che il programma utilizzato non costituisca «soltanto un mezzo» (come nel caso, ad esempio, di Photoshop, o altre applicazioni pronte all’uso, come Brushes di iPad)7, ma deve avere una parte autonoma nella creazione. Deve, cioè, esserci almeno una parte del processo creativo che sfugga all’artista e venga delegato alla macchina. L’artista – come vedremo in dettaglio in questo volume – propone alcuni dati (immagini, suoni, parole) all’intelligenza artificiale e attende, per scoprire in che modo essa li elaborerà. Poi a sua volta potrà modificarli di nuovo, in uno scambio reciproco che viene a costituire il cuore stesso dell’opera. Se ogni processo creativo è sempre anche una perdita temporanea di controllo da parte dell’artista – un incontro tra l’intenzionalità umana e la sorpresa di quello che l’opera concretamente diviene –, le nuove forme di arte che si stanno sviluppando grazie all’intelligenza artificiale portano la consapevolezza di questo momento al centro dell’attenzione non solo dell’artista, ma anche del pubblico, e trasformano il mezzo del fare artistico in un vero e proprio «partner»8, dando vita a forme del tutto inedite di interazione. Cambia così anche l’immagine dell’artista, che abdica in un certo senso alla sua unicità e diventa parte di un processo più ampio. Per comprendere come questo accada, occorre però fare un passo indietro e rivolgere lo sguardo allo strumento di queste opere, le gan, o Generative Adversarial Networks. Ideate nel 2014 da un giovane studioso, Ian Goodfellow, dopo una serata al pub con gli amici9, le gan consistono in due reti neurali10 che giocano, in qualche modo, l’una contro l’altra. Una, detta discriminator, è istruita a partire da alcuni dati (immagini, oppure testi o suoni). L’altra, il generator, deve produrre una nuova serie di dati, abbastanza simili a quelli iniziali da far sì che il discriminator possa confonderli con essi11. Il clima giocoso che ha ispirato questa invenzione è evidente anche nel paragone di cui Goodfellow si serve per spiegare la sua invenzione: «Il modello generativo si può considerare simile a un gruppo di falsari che tentano di produrre banconote false e di utilizzarle senza essere scoperti, mentre il modello discriminativo è simile alla polizia, che tenta di individuare le banconote contraffatte. In que9


sto gioco, la competizione spinge entrambi i gruppi a migliorare i propri metodi sino al punto in cui i falsi risultano indistinguibili dai modelli autentici»12. Quali sono i dati veri e quali quelli “contraffatti”? Attorno a questa domanda ruota il gioco e l’allenamento reciproco delle due reti. Il generator non ha accesso ai dati di partenza, all’inizio è quasi ubriaco, come i suoi inventori, e si avvicina al risultato finale a tentoni. I dati che arriva a produrre non sono dunque semplici copie, ma – nel caso, ad esempio, delle immagini – nuove immagini, che imitano trasformandole le immagini iniziali. Per la loro capacità di distinguere e generare un’enorme quantità di dati, le gan sono usate oggi in molti campi, dall’analisi di immagini mediche13, alla ricerca sui farmaci14, alle analisi di mercato15, al design di moda16. I risultati nuovi a cui le gan hanno portato in tutti questi casi derivano proprio dalla loro struttura duale, che li rende capaci di un’autonomia nell’apprendere, sconosciuta agli altri sistemi di intelligenza artificiale. Come osserva l’informatico e sociologo Michael Castelle, «le architetture di base delle gan hanno una caratteristica struttura interattiva e duale – basata sulla relazione tra una rete detta “generator” e una rete detta “discriminator” – che le differenzia dai precedenti sistemi per la generazione computerizzata»17. È proprio questo loro carattere relazionale che rende le gan così importanti anche in arte. Grazie al rapporto tra il generator e il discriminator, infatti, il processo di elaborazione dei dati sfugge in misura maggiore al controllo umano, per portare a risultati inaspettati con cui l’artista è portato a interagire. Le gan sono note nel mondo dell’arte per essere «instabili», come afferma l’artista Anna Ridler, e proprio questo costituisce il loro maggiore interesse. L’opera di cui Ridler, in questo volume, ci descrive la genesi, lo straordinario Fall the House of Usher, è un esempio particolarmente chiaro di tale processo. L’artista inizia con il disegnare con inchiostro a china 200 immagini, ispirate alla versione cinematografica del 1929 del famoso racconto di Edgar Allan Poe (in particolare ai primi 4 minuti del film). Queste immagini – che rappresentano di per sé già «una copia di una copia (il film) dell’originale (il libro)»18 – costituiscono il dataset della sua gan, che è spinta a produrre a sua 10

nota 16

Do Androids Dream of Balenciaga SS29? Intervista a Robbie Barrat di Arabelle Sicardi. “ssense.com”

volta una serie di figure simili ai disegni di Anna. Ogni «ricordare» [remembering] è però – come ricorda l’artista – un «dis-ricordare» [misremembering]: via via che l’opera procede, «le cose appaiono e scompaiono, sono ricordate o confuse nel ricordo o nell’immaginazione»19. Nelle immagini tracciate dalla gan c’è una sedia, ad esempio, che a volte c’è e altre volte manca, perché l’artista stessa in alcune immagini si è ricordata di disegnarla e in altre no. Anche le sopracciglia spesso si confondono con gli occhi, perché nelle immagini originali i due elementi erano stati tracciati in modo simile. La gan copia il lavoro umano, e impara a imitarne gli errori e le imperfezioni. E l’artista, da parte sua, si accorge di alcuni aspetti del suo stesso modo di disegnare di cui non era a conoscenza e impara a modificarli. In una terza fase del lavoro, infatti, Ridler riprende le immagini generate dalla gan, e le disegna a sua volta, creando così un secondo dataset. Fare questo è «incredibilmente difficile» perché nelle immagini prodotte dall’intelligenza artificiale «la logica del mondo reale c’era e non c’era (le ombre non erano esatte, le pieghe dei tessuti non cadevano come previsto). Nel disegno lo stile è in continua evoluzione, ma il fatto che io lo utilizzassi da molto tempo ha modificato il mio modo di disegnare e colorare un’immagine. Ora ho iniziato ad aggiungere degli “artefatti” e il mio tratto è mutato. È bizzarro avere a che fare con due gan diverse, ciascuna delle quali racchiude in sé il mio stile in due momenti distinti della mia esistenza»20. L’opera di Anna Ridler ci avvicina a un aspetto dell’arte delle gan che appare fondamentale, dal punto di vista della filosofia e, in particolare, dell’estetica. Se il percepire è sempre anche già al tempo stesso un ricordare – un dare forma a qualcosa, la sensazione, che eccede di per sé sempre ogni forma e ogni sforzo di rammemorazione21 –, la gan, nel suo tentativo di imitare qualcosa che non conosce pienamente, trasformandolo, ci mette di fronte con forza a questo compito. Non a caso il racconto che Anna Ridler sceglie come oggetto della propria opera, Il crollo della casa degli Usher, ha al suo centro proprio il nesso tra memoria e oblio, o deformazione di quello che si ricorda. Il racconto si apre con il legame troppo forte che unisce lo sfortunato amico del protagonista alla sua casa familiare (la casa degli Usher)22, e passa attraverso la triste storia 11


di un palazzo (simbolo, ovviamente, della casa stessa) un tempo pieno di colori, di odori e di suoni: «Nella più verde delle nostre valli, / da buoni angeli visitata, / un tempo un bello e solenne palazzo, / radioso palazzo, ergeva la sua fronte […] Stendardi gialli, di gloria e d’oro, / sul suo tetto sventolavano e garrivano / (ciò, tutto ciò, accadeva negli antichi, / antichissimi tempi lontani), / e ogni dolce brezza che indugiava, / in quel dolce giorno, / lungo i contrafforti piumati e pallidi, / un odore alato disperdeva. /Visitatori di quella valle felice / attraverso due luminose finestre videro / spiriti muoversi musicalmente, / all’intonato ritmo di un liuto / […] Ma creature malvage, in vesti di lutto, /assalirono l’eccelsa dimora del monarca […] / E ora i viaggiatori in quella valle, / attraverso le finestre soffuse di rosso lucore, / vedono vaste forme muoversi fantastiche / al suono di una melodia discorde; / mentre, simile a un fiume rapido e irreale, / attraverso la pallida porta, / una folla ripugnante si riversa precipite, senza sosta, / e ride; ma più non sorride.»23 Il lavoro di Anna Ridler mostra, però, anche la nuova corrente di vita che può riversarsi dalle deformazioni della memoria. Dagli “artefatti”, dagli errori e dalle incongruenze della gan, l’artista impara un nuovo modo di disegnare, e vede riapparire qualcosa, come vedrà chi leggerà il saggio, che non sperava di trovare. Questo nesso tra gan, memoria e trasformazione ha anche un’altra conseguenza importante dal punto di vista filosofico. Il modo in cui le gan modificano, imitandole, le immagini a noi note ci pone di fronte, infatti, al nostro stesso modo di trasformare il passato e la tradizione. In molte delle opere realizzate con questo tipo di intelligenza artificiale, il dataset di partenza è costituito da un certo periodo o da un certo numero di autori della storia dell’arte. L’intervento della gan, con i suoi strani errori e le sue deformazioni, dà vita in questi casi a un’interpretazione giocosa, che permette di istituire nuovi nessi tra le immagini. La tecnica non distrugge, come molti temono, il patrimonio culturale, ma fa al contrario «da ponte»24 tra passato e presente. È questo un tema al centro del saggio qui proposto dal collettivo di artisti francesi Obvious, che dopo la serie de La Famille de Belamy, ispirata alla ritrattistica tipica dell’arte europea del Ri12

nota 27

Up for Bid, AI Art Signed “Algorithm” Gabe Chon, “New York Times”.

nascimento e Barocco, presenta un secondo progetto, che si rifà all’arte giapponese del periodo Edo. Una nuova serie di ritratti si apre allo sguardo dello spettatore che naviga con il cursore su una mappa di luoghi giapponesi inventati. Per realizzare tali immagini, gli artisti hanno istruito la loro gan con diverse opere del periodo prescelto. Le rielaborazioni che l’intelligenza artificiale ha prodotto sono state poi stampate con l’antica tecnica moku-haga, un particolare tipo di stampa su carta con blocchi di legno. Il titolo, Electric Dreams of Ukyio, rinvia all’avvento dell’elettricità che caratterizza questa fase della storia giapponese, e più in generale al problema della tecnica nel suo rapporto con l’immaginario collettivo25. Proprio come il pubblico contemporaneo di fronte alla vendita di Edmond de Belamy, i personaggi giapponesi che ci parlano da questa mappa esprimono le più diverse reazioni di fronte al cambiamento: previsioni catastrofiche, diffidenza, speranza, indifferenza… Il disorientamento del pubblico di fronte a questo nuovo tipo di tecnologia – che ricorda, come notano molti degli autori del presente volume, quello che ha accompagnato l’avvento della fotografia26 – è evidente anche in una polemica molto animata che è seguita alla vendita di Edmond de Belamy di Obvious, e di cui questo libro porta ancora qualche traccia. Nel progettare la Famiglia Belamy, gli artisti del collettivo francese hanno attinto all’algoritmo ideato e condiviso in rete da un giovane studioso e artista americano, Robbie Barrat. Ciò ha suscitato molto scalpore, nello stesso Barrat e in diversi esponenti dell’ai art27, che hanno rimproverato ai colleghi parigini di avere strumentalizzato l’algoritmo del giovane americano a fini commerciali. Chi va considerato – questa la domanda fondamentale che emerge dalla discussione – il vero autore di un’opera realizzata con le gan28? È davvero l’algoritmo, come fa pensare la firma apposta scherzosamente da Obvious alla base delle sue tele? Oppure (come hanno risposto gli artisti del collettivo) l’opera deriva piuttosto da un’interazione tra artista e intelligenza artificiale, in cui l’artista ha diversi e importanti spazi di intervento? In effetti, se consideriamo le immagini che lo stesso Barrat ha realizzato con le gan, scopriamo che sono molto diverse da quelle di Obvious e presentano un interesse del tutto particolare, 13


come vedremo nel proseguimento del volume29. Ma c’è qualcosa, in questa domanda – chi è il vero autore di un’opera di ai? – che va oltre la polemica, per investire il significato stesso di questa forma d’arte, il cambiamento fondamentale che introduce. Interrogato sul proprio lavoro, Barrat ha affermato che la vera opera d’arte per lui sono le gan stesse30. Al centro di questo nuovo tipo di arte non c’è dunque l’opera come oggetto, ma il processo artistico stesso, come interazione sempre inconclusa tra uomo e macchina. Da tale punto di vista – il declino dell’unicità e del carattere “sacro” dell’oggetto-opera d’arte – la ai art porta avanti qualcosa che è iniziato già, come spiega il filosofo Walter Benjamin, con le prime forme di riproducibilità tecnica31. La «riproduzione» da parte di una ai è però qualcosa di diverso da quella di una fotografia o di un film. Avviene secondo modalità nuove, che devono essere ancora indagate a fondo. Già nella fotografia è insita, sin dalle sue origini, una tensione tra realtà e finzione, testimonianza di ciò che è stato e autonoma capacità di dare forma ai propri contenuti 32. Nella riproduzione da parte della ai questa polarità sfugge però, almeno in parte, al controllo dell’artista. La macchina, con i suoi errori di interpretazione e le sue deformazioni (i cosiddetti “artefatti”), acquisisce una nuova autonomia. A ciò rinvia il nuovo termine «neurography» (da «photography» e «neural network») coniato da Mario Klingemann per interrogarsi su questa nuova forma di «ritratti»33. A fare la differenza non è tanto la creatività del mezzo – anche una fotografia può dare forma a qualcosa di nuovo, rendere originariamente «visibile» (con le famose parole di Klee) – ma il carattere infinito del processo trasformativo, che mette in questione la differenza stessa tra l’artista e il suo mezzo. Nell’universo delle gan, infatti – un universo “fluido”, come fluida, quasi «acquarellata»34, è la qualità delle immagini che ne risultano – «tutto è connesso»35: soltanto un piccolo cambio di parametri separa un cane da un fungo, o una casa da un albero. Nel suo lavoro, la ai trasforma e mette in causa ogni identità consolidata, spingendo l’artista a interrogarsi e a rispondere. Il nuovo grado di autonomia della macchina non significa dunque che l’intervento umano diventi indifferente. Il processo della ai art è scandito in fasi, in alcune delle quali – esempi particolarmente chiari sono la scelta del dataset, o la selezione dei risultati più rilevanti tra le migliaia di quelli ot14

nota 30

Artist Robbie Barrat And Painter Ronan Barrot Collaborate On “Infinite Skulls”. Jason Bailey, “Artnome.com”.

ai

p. 237

https://bit.ly/2D6fOP2

Sui diversi approcci nell’uso delle gan da parte degli artisti vedi anche Machine Learning Art: An Interview With Memo Akten, Renée Zachariou,“Artnome.com”.

tenuti – l’intervento dell’artista è determinante. Per questo motivo è sbagliato, come fa notare Anna Ridler, spostare l’attenzione sulla domanda se una ai possa essere davvero creativa. La creatività non è, infatti, mai della ai da sola, ma del “team” uomo-macchina. Più che chiedersi chi è l’artista nel caso della ai art – l’algoritmo o l’uomo – occorre allora forse domandarsi come cambiano, all’interno della nuova pratica, il concetto stesso di artista e di arte. Come promuovere, però, l’autonomia della ai? Come evitare che i risultati ottenuti siano in realtà – questa la critica che Marian Mazzone, storica dell’arte e membro del Rutgers Art & Artificial Intelligence lab, muove a Obvious e a molti altri artisti del campo – sostanzialmente prevedibili? Uno dei primi punti su cui occorre intervenire per sfuggire a tale rischio, secondo Mazzone, sono i dati di partenza forniti al programma. Nel caso degli artisti di Obvious, il dataset di entrambe le loro serie è consistito, come spiegano gli autori stessi, in una serie di immagini molto uniformi tra loro per periodo e per caratteristiche stilistiche. Soltanto però rendendo il dataset più disomogeneo e meno curato è possibile aumentare le componenti random del processo. Obiettivo dell’artista che lavora con l’intelligenza artificiale, secondo l’autrice, dev’essere accrescere la capacità di auto-organizzazione del programma, introducendo più fattori casuali e diminuendo il controllo umano. Sono questi alcuni degli elementi che stanno alla base delle ai-can (ai-Creative Adversarial Networks), una variante della gan ideata dall’équipe di Rutgers. Nelle ai-can, «la macchina viene addestrata attraverso la tensione che si crea tra il compito di seguire gli esempi artistici a essa forniti (minimizzazione della deviazione rispetto alla distribuzione degli elementi artistici) e le penalità che la macchina subisce quando produce una versione di un’immagine utilizzata per l’addestramento che risulta troppo simile all’originale (massimizzazione dell’ambiguità stilistica)». In questo modo, l’intelligenza artificiale si avvicina al massimo, secondo il gruppo di Rutgers, a quella che possiamo considerare una performance “creativa” da parte sua. Ma può un programma di intelligenza artificiale essere davvero “creativo”? Di certo, come osserva la stessa Mazzone, la gan non dispone degli strumenti concettuali per comprendere quello che crea. Può raffigurare in modo interessante un prato, ma del prato le manca il 15


concetto e le manca, soprattutto, l’esperienza. È questo un aspetto su cui si concentra anche Michael Castelle che, dopo aver esaminato gli aspetti più innovativi di questo tipo di ai, ne mette in evidenza i limiti. L’uso dei neural networks, da cui le gan sono costituite, è stato spesso visto come una «ribellione contro il cognitivismo (l’ideologia sottostante alla vecchia, old fashioned intelligenza artificiale simbolica), che concepiva la mente umana come un computer che segue delle regole». I modelli delle reti neurali, però, «continuano in buona parte a operare in modo isolato dal loro contesto materiale e sociale». Proprio l’elemento duale delle gan, che sembra costituire la loro forza, rischia di trasformarsi, secondo Castelle, in una chiusura, in un isolamento dal resto del mondo. Per evidenziare tale limite, Castelle si serve di un paragone tra il modo di apprendere delle gan e la nozione di «habitus» di Pierre Bourdieu. Questo porta lo studioso a soffermarsi su un altro aspetto fondamentale che torna in molti dei saggi raccolti nel presente volume: la tensione, all’interno di questo tipo di arte, tra la riproduzione dei pregiudizi sociali, delle apparenze ormai irrigidite che le immagini veicolano e la loro messa in causa. L’aspetto relazionale delle gan è invece ripreso in senso del tutto positivo da una giovane filosofa e studiosa di estetica musicale, Caterina Moruzzi. Le gan sono state usate sinora soprattutto per produrre immagini, ma negli ultimi anni hanno iniziato a essere utilizzate anche nel campo della musica. Qui però, diversamente che nella sfera delle arti visive, i successi di tale tecnica sono stati per ora minori rispetto a quelli ottenuti con altri tipi di intelligenza artificiale. Moruzzi mette in luce, tuttavia, i rischi presenti nel giudicare la «creatività» di un’opera sulle basi del gradimento che i suoi prodotti riscuotono nel pubblico. Occorre piuttosto concentrarsi sulla sua struttura interna e sulle potenzialità in essa racchiuse. Proprio il rapporto dinamico tra il generator e il discriminator, che è all’origine della maggiore “instabilità” delle gan rispetto alle altre reti neurali e del loro difficile utilizzo in campo musicale, è la chiave al tempo stesso della loro maggiore “autonomia” e del loro maggiore potenziale creativo. A che punto siamo, però, con la musica delle gan e quale futuro si può intravvedere? È questa la domanda affrontata dalla mu16

sicologa e musicista Vera Minazzi in «gan e musica, on the road». Il titolo è già, in parte, una risposta. Piuttosto che focalizzarsi sulle differenze tra la musica prodotta tramite gan e quella ottenuta attraverso altri tipi di intelligenza artificiale, Minazzi inserisce innanzitutto il nesso tra gan e musica all’interno di un più vasto contesto, che è quello della ai music e, risalendo ancora più indietro, della «musica generativa». In questo largo orizzonte, incontriamo Flow Machine, il software sviluppato a partire dal 2012 dal team della Sony Francia, allora diretto da François Pachet, con lo scopo di «comporre musica nello stile di uno specifico autore, evitando il plagio, e usando la copia, ma non troppo!», il «sintetizzatore neurale» ideato da Douglas Eck e dal team Magenta nel 2017, allenato su 300.000 suoni di strumenti per creare a partire da essi suoni nuovi, e i più recenti esperimenti con le gan. Muoversi in tale orizzonte permette di evidenziare un aspetto fondamentale: «I suoni che nascono dalle esplorazioni con le reti neurali profonde – nello spazio latente “fra un flauto e un trombone” – sono in qualche modo suoni rotti, strani, sbagliati, eppure i musicisti che usano queste “palette” di suoni, che ci giocano assieme, sembrano esserne profondamente affascinati». È in questo contesto che vanno visti gli attuali esperimenti musicali con le gan, di cui Minazzi fornisce una panoramica preziosa, proprio perché gli esempi sono ancora quasi del tutto sconosciuti: dalle composizioni per flauto zen del progetto gankyoku, antichissime e nuove al tempo stesso, al design di nuove interfacce musicali di Akito van Troyer e Rebecca Kleinberger, sino agli «spartiti inesistenti» creati dalla gan di Nao Tokui. Un posto di particolare importanza, all’interno del rapporto tra gan e musica, spetta poi al nesso tra suoni e movimenti del corpo. Le gan vengono utilizzate sia per disegnare nuove coreografie a partire dalla musica, sia per produrre nuovi suoni a partire dai movimenti corporei. È l’intera storia della musica a essere ricordata e interrogata in questi esperimenti, paragonati non a caso da uno dei loro autori a quelli di uno stregone: «Le gan spingono ai limiti gli assiomi e l'esperienza della musica generativa, provocano i paradigmi della composizione e dell'esecuzione, dell'improvvisazione e della scrittura, della riproduzione e dell'ascolto». 17


Questo tema del carattere apparentemente magico e “incontrollabile” delle gan è messo a fuoco nelle sue implicazioni filosofiche dall’artista e filosofa Georgia Ward Dyer, che confronta il processo mimetico di questo tipo di ai con il concetto di mimesi formulato negli anni Trenta del Novecento dal filosofo Walter Benjamin. La capacità di scorgere somiglianze, come fanno i bambini quando giocano a essere «non solo un negoziante o un maestro, ma anche un mulino o un treno», ha secondo Benjamin qualcosa di improvviso e di imprevisto, un indice temporale che la avvicina, per certi aspetti, alla magia. Allo stesso modo, le gan e le reti neurali in generale, in campo informatico sono spesso accusate di essere una «scatola nera», in cui il risultato scaturisce in modo inspiegabile: «dal momento che nello stadio attuale della ricerca sull’intelligenza artificiale i metodi sono imposti dalla “forza bruta” di molteplici calcoli matematici svolti in parallelo su vasta scala, non è possibile risalire ai meccanismi causali che legano uno specifico input a uno specifico output – non è cioè possibile identificare il fantasma all’interno della macchina, poiché esso si cela nell’intera architettura e non può quindi essere ricondotto a un’unica istanza». Tuttavia, proprio il carattere di «black box» delle gan conferisce loro un insostituibile potenziale critico: le rende capaci di sottrarsi alle esigenze di quel che è già previsto (dal mercato, dalla cultura, dai nostri pregiudizi) e di accompagnare l’artista nella ricerca di nuove e significative somiglianze. È questa forza giocosamente critica – “avversaria” e “generativa” al tempo stesso – che ritroviamo nelle gan e nelle loro strane immagini. Il loro mondo “fluido” in cui tutto è “connesso” – alberi, nuvole e funghi – apre nuove connessioni per noi, ci sottrae al nostro isolamento e ci spinge verso qualcosa, fuori, che ancora aspetta di essere esplorato.

18

La vita sociale delle reti antagoniste generative ( gan ) Michael Castelle

Agli occhi del sociologo, l’architettura specifica delle reti antagoniste generative appare particolarmente suggestiva. In primo luogo, il sociologo può osservare come una rete neurale convoluzionale destinata alla classificazione venga in sé percepita dal grande pubblico come «intelligenza artificiale»; e come una rete generativa costituisca una sorta di ribaltamento di questa rete di classificazione (cioè una trasformazione di un vettore numerico in un’immagine attraverso una serie di strati). Se dunque, nel processo di addestramento delle gan, le due «intelligenze artificiali» interagiscono tra loro in una relazione duale, non dovremmo forse considerare sociale questa forma di apprendimento? Questa osservazione può evidenziare alcune sorprendenti analogie, se si pongono a confronto le gan con le teorie del sociologo Pierre Bourdieu, la cui concezione del cosiddetto habitus ha un carattere a un tempo cognitivo e sociale: una percezione produttiva in cui le pratiche di classificazione e l’azione pratica non possono essere pienamente differenziate. Significativamente, Bourdieu si serve del concetto di habitus per contribuire a spiegare la riproduzione della stratificazione sociale sia nella scuola sia nell’arte, concentrandosi sovente sulla trauma19


tica transizione dal realismo all’impressionismo che caratterizzò la pittura francese nell’Ottocento. I movimenti d’avanguardia si segnalarono spesso per un distacco stilistico dal capitale economico operato in nome dell’«arte per l’arte», e questo rifiuto culturale della massimizzazione dell’obiettivo può a sua volta contribuire a evidenziare il profondo paradosso che è al centro dell’intelligenza artificiale creativa contemporanea. Introduzione: dalla fotografia alla neurografia «L’arte ha sempre meno il rispetto di sé stessa, si prosterna davanti alla realtà esteriore, e il pittore si fa sempre più incline a dipingere, non già quello che sogna, ma quello che vede. Pure è una felicità sognare, ed era una gloria esprimere quello che si sognava; ma che dico? Conosce ancora, l’artista, questa felicità?» (Baudelaire, da Le publique moderne et la photographie, in Salon 1859). Nel momento attuale è difficile averne la certezza, ma esiste la possibilità che la nostra posizione nei riguardi del tema tecnologico di questo libro – la rete antagonista generativa o gan – sia analoga a quella di Baudelaire e altri critici contemporanei nei riguardi dell’introduzione della fotografia: ci troveremmo cioè immersi in una contemplazione critica di una tecnologia inedita che sembra costringerci a rivedere i limiti concettuali dei nostri rapporti con il mondo. Se gli strumenti necessari a creare questa prima generazione di immagini durature furono sviluppati da inventori europei isolati quali Daguerre e Talbot, gli strumenti delle reti antagoniste generative traggono origine da una triplice relazione tra grandi istituti universitari di ricerca, finanziamenti pubblici e industrie tecnologiche. Ciò potrebbe sollevare un interrogativo: le tecniche, gli stili e perfino la standardizzazione dell’arte generata dalle gan saranno determinati in futuro dalle proprietà scientifiche e matematiche intrinseche di tali tecnologie? Oppure, come nel caso della fotografia, saranno dettati da una molteplicità di creativi, sia dilettanti sia professionisti, e dalle loro interazioni reciproche e con il pubblico? 20

https://bit.ly/3i1B5Id

The Pixels Themselves: An Interview With Mario Klingemann. Antonio Poscic, “The Quietus”, 2018.

Questa intuizione del potenziale impatto culturale ed estetico delle reti antagoniste generative è stata colta da uno dei più prestigiosi creatori di immagini basate su gan, Mario Klingemann, come dimostra l’uso da parte sua del termine neurografia; e nell’analogia da lui usata è possibile distinguere i contorni di un percorso di comprensione. In primo luogo, se la neurografia è destinata a diventare una forma d’arte riconosciuta – magari, da ultimo, con musei specifici, come quelli di fotografia, che organizzeranno retrospettive dedicate ai principali artisti neurografici – possiamo per il momento lasciare da parte la questione del presunto agire non umano delle reti neurali, concentrandoci invece su una maggiore comprensione sia tecnica sia sociale degli strumenti utilizzati da questi artisti. Questo, a sua volta, potrà non soltanto fare luce sulla nostra concezione della neurografia in relazione alla fotografia (così come Baudelaire tentava di comprendere la fotografia in relazione alla pittura), ma anche fornire nuove modalità di interpretazione dei futuri sviluppi di questo genere artistico. Vi sono tuttavia numerosi potenziali «livelli» di comprensione tecnico-sociale. In questo saggio non ci addentreremo nel campo dei linguaggi di programmazione e delle librerie (Python, Tensorflow, PyTorch e via dicendo) utilizzati per la realizzazione di macchine neurografiche (che nella loro forma inerte possono essere – e saranno qui – definite modelli), né esamineremo nel dettaglio le formalizzazioni matematiche più astratte, pubblicate nei documenti di ricerca, che queste librerie aspirano a implementare. Ci limiteremo invece al livello leggermente più concettuale della cosiddetta architettura delle gan, servendoci di diagrammi così come una guida alla fotografia potrebbe utilizzare un diagramma per illustrare il flusso fisico che caratterizza la fotografia ottica (in cui, per esempio, i fotoni di una sorgente luminosa si riflettono in modo casuale sulle superfici, vengono rifratti attraverso la lente della macchina fotografica e si posano su cristalli di alogenuro d’argento, che vengono immersi in una successione di bagni chimici, ingranditi e quindi stampati su carta). Come vedremo, le architetture di base delle gan hanno una caratteristica struttura interattiva e duale – basata sulla relazione tra una rete detta «ge21


nerator» e una rete detta «discriminator» – che le differenzia dai precedenti sistemi per la generazione computerizzata di immagini. Questa struttura duale e in un certo senso “didattica” ci offrirà quindi il destro per riflettere su un elemento che fu precocemente colto da Alan Turing, ma che per qualche ragione è stato successivamente dimenticato da buona parte delle ricerche novecentesche sull’intelligenza artificiale: e cioè che nel tentativo di creare un’intelligenza artificiale è necessario riconoscere che «sarebbe alquanto scorretto aspettarsi che una macchina appena uscita da una fabbrica possa competere su un piano di parità con un laureato. Il laureato può vantare venti o più anni di contatto con altri esseri umani. Questo contatto ha modificato i suoi schemi di comportamento durante tutto questo periodo. I suoi insegnanti hanno deliberatamente tentato di modificarlo» (Turing, 1948). In altre parole, l’apprendimento umano è intrinsecamente sociale, e inoltre ha luogo nel corso di un lungo periodo di sviluppo. Nella loro (limitata) emulazione di queste caratteristiche sociali e di sviluppo, quindi, le gan possono aiutarci anche a riflettere sulla pretesa – avanzata da alcuni esperti contemporanei di intelligenze artificiali – di essere in ultima analisi in grado di raggiungere una qualche forma di intelligenza «generale» o di livello umano. In questo capitolo intendo in particolare sostenere che la forma dell’architettura specifica di una gan – la sua dualità incarnata da un sistema che classifica e un sistema che genera – presenta forti analogie con una teoria della classificazione sociale e della riproduzione culturale che finora non è mai stata messa in relazione con essa: e cioè con la concezione di ciò che il sociologo francese Pierre Bourdieu definisce habitus. Cognitivo e sociale a un tempo, il concetto di habitus di Bourdieu può consentire una comprensione notevolmente più approfondita della carica innovativa e del fascino concettuale che le gan rivestono agli occhi dell’attuale generazione di studenti delle arti e delle scienze, in particolare di coloro che nutrono preoccupazioni riguardo alla potenziale riproduzione dei pregiudizi culturali presenti nella società attraverso l’apprendimento automatico. Inoltre, dal mo22

mento che lo stesso Bourdieu si servì del suo concetto di habitus per esplorare sia la letteratura sia l’arte, esso ci consentirà di esplorare più agevolmente i potenziali collegamenti tra la teoria sociale e la tecno-estetica pratica delle gan. Nelle pagine che seguono prenderò in considerazione l’architettura delle gan, che viene classicamente suddivisa in una rete detta «generator» e in un’altra detta «discriminator». Dimostrerò quindi come tanto il connessionismo (l’uso di reti neurali) quanto la teoria di Bourdieu abbiano tratto ispirazione, sebbene in modo distinto, da un rifiuto delle teorie cognitive e sociali basate sulle regole. Una volta chiarite queste caratteristiche tecniche e intellettuali, analizzerò la struttura metaforica delle gan, basata sulla relazione tra un “apprendista” produttore in via di sviluppo e un “insegnante” critico. Solleverò quindi la questione della riproduzione del pregiudizio nell’apprendimento automatico, evidenziando come i modelli gan addestrati si possano considerare come una forma parzialmente fisica e materiale di «capitale culturale», nelle cui forme più estese si può ravvisare una sorta di «oggetto di consumo epistemico» infinitamente produttivo. Esaminerò infine la metafora dei giochi e la teoria dei giochi, che compaiono sia nella formulazione tecnica delle gan, sia nelle descrizioni della teoria dell’habitus di Bourdieu e dei suoi campi di applicazione. L’architettura della gan come intelligenza artificiale sociale Il riaffiorare del tema dell’intelligenza artificiale nella sfera pubblica nel xxi secolo non costituisce tanto una riesumazione quanto una ricorrenza – in particolare, una ricorrenza delle architetture computazionali note come reti neurali multistrato (spesso definite anche convoluzionali e/o ricorrenti) giunte a maturazione tra la fine degli anni Ottanta e i primi anni Novanta del Novecento, all’indomani della pubblicazione dei cosiddetti pdp volumes, dedicati a quella che si definiva allora Parallel Distributed Processing (David E. Rumelhart e McClelland 1986). La rete neurale convoluzionale multistrato o cnn, in particolare, si ispira in modo indiretto al cosiddetto flusso di informazioni 23


«feed-forward» postulato per l’apparato visivo umano (Hubel e Wiesel 1962) e, più da vicino, a una precedente architettura di rete neurale nota come Neocognitron (Fukushima 1980), e fu messa a punto da Yann LeCun e altri presso i Bell Labs allo scopo di riconoscere dei numeri in immagini bitmap in bianco e nero di piccole dimensioni che riproducevano cifre scritte a mano, per esempio su assegni bancari o altri supporti (LeCun et al. 1989; LeCun et al. 1998). Questo tipo di sistema di apprendimento – in cui una rete neurale artificiale viene addestrata attraverso grandi moli di dati classificati manualmente e messa alla prova su una quantità più ridotta di dati le cui etichette di classificazione vengono tenute nascoste al sistema – è noto come apprendimento supervisionato; come vedremo tra poco, le reti antagoniste generative introducono una variazione interessante rispetto a questo approccio1. Le reti neurali che operano queste classificazioni vengono convenzionalmente definite modelli; ma per quanto possano ispirarsi ad aspetti neurologici della percezione animale o umana, esse non coincidono con la concezione classica di modello meccanico o fisico designato a rappresentare la struttura e/o il comportamento di un sistema realmente esistente2. Le reti neurali per la visione dei computer costituiscono invece cosiddetti modelli di dati (Bailer-Jones e Bailer-Jones 2002; Knuuttila 2005; Edwards 2010), che – più che formalismi progettati per corrispondere da vicino a condizioni reali – sono strumenti artefattuali orientati a un pragmatismo casuale e incentrato sui dati: per esempio, nel caso delle cnn di LeCun, il punto è la loro capacità di classificare correttamente immagini mai viste prima. Per questa ragione, i modelli di una rete neurale multistrato supervisionata possono essere accomunati più che altro a motori semiotici, che consumano energia computazionale per trasporre un tipo di segno (per esempio le immagini bitmap di cifre tracciate a mano) in un altro (il simbolo di un numero intero compreso tra 0 e 9). In particolare, i «parametri» o valori di riferimento di questi modelli – l’insieme di numeri dal valore reale che determinano ogni fase delle moltiplicazioni della matrice che costituiscono una convoluzione – non sono prefissati. Il modello viene invece addestrato attraverso la presentazione di successivi insiemi di immagini 24

1

p. 25

1. Architettura della rete neurale nota come Neocognitron. https://bit.ly/3gf9wL2

Suggestivo video storico del 1993 di una demo di “LeNet 1”, la prima rete neurale convoluzionale capace di riconoscere numeri scritti a mano, con accuratezza e a una buona velocità.

classificate, e a seconda degli errori che commette riceve istruzioni di aggiornare i parametri in modo tale da ottenere un risultato migliore la volta successiva – una tecnica nota specificamente come retropropagazione. Così, diversamente dalla «macchina differenziale» di Babbage (un arcaico prototipo di dispositivo computazionale azionato manualmente, che era in grado di calcolare tavole di polinomi), le reti neurali si possono considerare come una sorta di «macchina differenziale» la cui riproduzione artefattuale di atti di classificazione futuri (o differiti) viene ottenuta attraverso numerose piccole osservazioni di una differenza – per la precisione, la distanza matematica tra un’ipotesi e la risposta esatta (Globus 1992)3. Diversamente da altre forme di classificazione automatizzata che dominavano nei primi sistemi di data-mining, la cnn – in quanto costituita principalmente da una sequenza di operazioni di filtraggio e ridimensionamento – è attenta a preservare e a dare conto della disposizione spaziale dei suoi input in corrispondenza di ciascuno strato. Ogni gruppo di piccoli «filtri» appresi da ciascuno strato convoluzionale opera sull’intero input – attraverso sequenze bidimensionali di moltiplicazioni note come convoluzioni – rendendo così possibile quella che i matematici sono soliti definire “invarianza” spaziale in relazione ai diversi input. Sotto questo aspetto sono simili ai normali filtri di Photoshop, che sfocano, contrastano o evidenziano i contorni di un’immagine in modo progressivo, senza badare al contenuto dell’immagine stessa; la differenza sta nel fatto che mentre i normali filtri di sfocatura, 25


contrasto o rilevazione dei contorni hanno valori fissi, i filtri di una cnn vengono elaborati progressivamente attraverso l’apprendimento, mediante la retropropagazione (David E. Rumelhart, Hinton e Williams 1986; LeCun et al. 1989). Malgrado la speranza che questo prototipo di architettura cnn, noto come «LeNet» dal nome del suo principale creatore, potesse infine essere utilizzato per contribuire alla classificazione di immagini di dimensioni maggiori (e a colori), per diversi anni i ricercatori hanno incontrato difficoltà nell’applicare i successi di questi sistemi a operazioni di proporzioni maggiori. Soltanto dopo lo sviluppo di alcune innovazioni tecniche (e socio-tecniche) – tra cui l’uso di unità di elaborazione grafica, le gpu (Steinkraus, Simard e Buck 2005), la classificazione distributiva su vasta scala di enormi insiemi di dati da parte di operatori di Mechanical Turk con compensi inferiori al minimo salariale (Deng et al. 2009), e astuti “trucchi del mestiere” quali la tecnica del dropout di Geoff Hinton – questi modelli hanno assunto forme più nuove e approfondite (cioè dotate di un maggior numero di strati) quali vgg16 e ResNet, che sono riuscite ad attuare con successo operazioni di classificazione più impressionanti (come la rilevazione di 1000 oggetti diversi in immagini da 224 × 224 pixel a colori, invece che di 10 cifre in immagini da 28 × 28 pixel in scala di grigio) (Simonyan e Zisserman 2014; He et al. 2015). Questi modelli apparivano così intelligenti che alcuni ritennero che interi sottoinsiemi della visione computerizzata fossero divenuti obsoleti dall’oggi al domani (Cardon, Cointet e Mazières 2018). La notizia di questi successi è stata all’origine dell’attuale «moda» dell’intelligenza artificiale, e si è iniziato a designare questi modelli non come “modelli”, appunto, ma come «intelligenze artificiali» o «ai» a pieno titolo. Inoltre, sulla scia dei successi riportati da modelli di apprendimento per rinforzo correlati in relazione a operazioni fortemente limitate ma complesse come i vecchi giochi Atari o il gioco del Go – nonché per effetto di un’«ideologia del millennio» orientata all’immaginazione – intorno alla metà del decennio successivo al 2010 alcuni individui, peraltro dotati di un’istruzione superiore, si sono in qualche modo convinti che questi modelli di classificazione multistrato si sarebbero evoluti con una 26

rapidità esponenziale, sino a dare vita a un’intelligenza sovrumana. Sebbene ultimamente l’intensità di queste posizioni si sia in parte attenuata, la forma peculiare di tali architetture continua a catturare l’immaginazione di nuove generazioni di studenti, mentre continua a dare buoni risultati in vari campi quali la visione computerizzata, l’elaborazione del linguaggio naturale e via dicendo. Se mi sono tanto dilungato nel rinarrare e ridefinire un esempio di architettura di una rete neurale profonda, è stato soltanto per evidenziare che la rete antagonista generativa, così come l’ha descritta Ian Goodfellow tra un bicchiere e l’altro a Montréal in una tarda serata del 2014, è composta da due strutture di questo tipo – o, se vogliamo, da due «intelligenze artificiali». Una rete, il discriminator, attua la classificazione nel livello «profondo» della rete neurale: riceve le immagini di input e successivamente effettua una serie di trasformazioni lineari e non, producendo un output numerico – in particolare, è addestrata a restituire un numero compreso tra 0 e 1 che indica la misura in cui ritiene che l’immagine di input sia “vera” (cioè verosimilmente tratta dai dati usati per l’addestramento) o meno4. L’altra rete, il generator, è una sorta di discriminator invertito o ribaltato in senso orizzontale, che invece di trasporre un’immagine di input in un valore vettoriale di output, traspone un vettore di valori di input in un’immagine di output – un’immagine generata che è idealmente simile al tipo di immagini osservate nel processo di addestramento, pur non costituendone una copia.

https://bit.ly/2ZCRcF3

Google’s AI Masters the Game of Go a Decade Earlier Than Expected. Will Knight, “The mit Review”, 2016.

2. L’architettura base di una gan.

27


L’addestramento di quello che definiamo una gan implica in effetti un addestramento bidirezionale che si svolge tra questi due modelli, ciascuno dei quali non può visualizzare direttamente i valori di riferimento dell’altro; via via che il discriminator migliora lentamente la sua capacità di distinguere le immagini reali delle ci- https://youtu.be/6v7lJHFaZZ4 fre da quelle prodotte dal generator, il generator a sua volta miglio- Video che mostra l’addestramento ra lentamente la sua capacità di creare immagini di cifre in grado di bidirezionale di una gan. ingannare il discriminator. Ciò che intendo domandarmi in questo saggio è semplicemente quanto segue: se una rete neurale discriminatrice va considerata un’«intelligenza artificiale» – il che, come si è visto, ha ispirato fantasie sfrenate di robot senzienti – e una rete neurale generatrice è anch’essa un’«intelligenza artificiale», non dovremmo forse considerare sociali le reti antagoniste generative? Il tema del saggio è proprio in quale misura questa affermazione sia in grado di reggere. Come vedremo, sotto alcuni aspetti l’idea che le gan abbiano una natura «sociale» costituisce una potente analogia che rimanda in modo interessante ad alcune teorie preesistenti della classificazione sociale e della riproduzione sociale, e intendo sostenere che questi collegamenti potrebbero essere implicitamente – se non sempre in modo consapevole – al centro dell’interesse specifico suscitato dalle gan rispetto ad altre architetture neurali. Sotto altri aspetti, tuttavia, dimostrerò che le gan si possono considerare tanto limitate e metodologicamente ermetiche quanto altri modelli precedenti delle scienze cognitive. In particolare, sebbene il connessionismo (cioè l’uso di reti neurali) venga sovente considerato alla stregua di una ribellione contro il cognitivismo (cioè l’ideologia alla base dell’intelligenza artificiale simbolica “vecchio stampo”, che assimilava la mente umana a un programma computerizzato programmato per seguire delle regole), i modelli profondi di apprendimento continuano in buona parte a operare in modo isolato dal loro contesto materiale e sociale. Inoltre, la formalizzazione matematica primaria delle gan nel documento originale di Goodfellow utilizza la cornice della teoria dei giochi, una visione dell’interazione sociale che deriva da studi statistici ed economici condotti durante il secondo conflitto mondiale (Leonard 2010), e al termine di questo capitolo 28

esaminerò i potenziali limiti dell’inquadramento delle verso questa lente.

gan

attra-

L’habitus di Bourdieu: generativo e discriminativo Da decenni a questa parte, gli studenti di sociologia si trovano prima o poi di fronte al seguente brano, famigerato per la sua complessità, tratto dal libro Per una teoria della pratica (1977) del sociologo francese Pierre Bourdieu, in cui l’autore, nel proporre una teoria sociale destinata a superare la fenomenologia di Merleau-Ponty e lo strutturalismo di Lévi-Strauss, definisce un concetto da lui chiamato habitus: «Le strutture che sono costitutive di un tipo specifico di ambiente (per esempio, le condizioni materiali di esistenza caratteristiche di una condizione di classe) e che possono essere colte sotto forma di regolarità associate a un ambiente socialmente strutturato producono degli habitus, sistemi di disposizioni durature, strutture strutturanti disposte a funzionare come strutture strutturate, vale a dire in quanto principio di generazione e di strutturazione di pratiche e rappresentazioni che possono essere “regolate” e “regolari” senza essere affatto il prodotto dell’obbedienza a delle regole, oggettivamente adattate al loro scopo, senza presupporre l’intenzione cosciente dei fini e il dominio intenzionale delle operazioni necessarie per raggiungerli e, dato tutto questo, collettivamente orchestrate senza essere il prodotto dell’azione organizzatrice di un direttore d’orchestra» (Bourdieu 1977, p. 72). Bourdieu era da lungo tempo interessato alla riproduzione della stratificazione sociale, come dimostrano la sua precedente collaborazione con Jean-Claude Passeron da cui nacquero I delfini (Bourdieu e Passeron 1979) e La riproduzione (Bourdieu e Passeron 1990). Entrambi gli autori erano cresciuti nella provincia francese, dalla quale erano riusciti a raggiungere le grandes écoles; ritenevano che l’istruzione pubblica formale fosse tutt’altro che egualitaria, e che su di essa ricadesse anzi la responsabilità di riprodurre quella stessa stratificazione che avrebbe dovuto verosimilmente attenuare. Era attraverso l’inculcazione culturale di un habitus incarnato e parzialmente inconsapevole – un «principio 29


permanente generativo di improvvisazioni regolate» (Bourdieu, 1977, p. 78) – che, sostenevano i due autori, gli studenti delle classi superiori ottenevano un vantaggio che i loro percorsi scolastici non facevano che rafforzare. Il concetto di habitus di Bourdieu può risultare arduo da afferrare, poiché diversamente dalle visioni cognitiviste della mente come processore simbolico inerte, l’habitus è simultaneamente cognitivo e sociale; in questa visione, non è possibile distinguere gli atti mentali isolati e «strutturati» dalle azioni generate e «strutturanti» che operano nel contesto sociale. Queste due componenti interconnesse sono state descritte dal sociologo contemporaneo Omar Lizardo come equivalenti a (1) «l’habitus come struttura percettiva e classificatoria» e (2) «l’habitus come struttura generativa dell’azione pratica» (Lizardo, 2004, p. 379); in parole povere, l’habitus è composto da un classificatore e da un generator e dunque, a prima vista, sembra avere la stessa architettura di base di una gan. Ciò che mi propongo di esaminare nei paragrafi che seguono sono le implicazioni di questo interessante (e chiaramente non deliberato) isomorfismo tra il concetto di habitus di Bourdieu e l’architettura delle gan. Assimilando il generator e il discriminator di un modello gan alle due funzioni specifiche dell’habitus – e successivamente dimostrando come sia l’habitus sia la gan siano stati concepiti dai rispettivi ideatori, Bourdieu e Goodfellow, come componenti di una sorta di gioco di strategia – possiamo domandarci se la stessa ricerca sull’apprendimento profondo stia o meno riscoprendo e reinventando in modo indipendente una sorta di teoria sociale. Contro le regole: gofai, strutturalismo, connessionismo e prassi tecnica critica Bourdieu elaborò il concetto di habitus in parte come risposta a quello che per lui costituiva un interrogativo da lungo tempo irrisolto: «In che modo è possibile regolare il comportamento senza che esso sia il risultato dell’obbedienza a delle regole?» (Bourdieu, 1990a, p. 65). La domanda illustra implicitamente l’a30

nalogia tra le idee di Bourdieu e un preciso modo di pensare sviluppatosi come reazione all’egemonia di un insieme di approcci in buona parte simbolici alla cognizione artificiale – che negli Stati Uniti fanno capo a istituzioni quali il mit e il cmu – oggi riassunti dall’espressione «good old-fashioned ai» (gofai), traducibile come «la cara intelligenza artificiale dei vecchi tempi»5. Secondo i fautori di questa intelligenza artificiale simbolica, l’intelligenza può essere modellata da «sistemi di simboli fisici» non incarnati (Newell 1980) che, attraverso una combinazione di rispetto di regole esplicite, euristica più generale e pianificazione gerarchica, sono in grado di individuare soluzioni ai problemi in un ampio «spazio di ricerca» (Boden 2014). Per contro, reazioni critiche a questa visione del mondo – nonché alla sua variante detta dell’«intelligenza artificiale forte» in cui tali sistemi vengono considerati intelligenti o perfino coscienti, e servono quindi da modello per la cognizione umana – sono state espresse da filosofi e studiosi di scienze sociali nel corso degli anni Settanta, Ottanta e Novanta, secondo prospettive distinte ma in parte sovrapposte. Hubert Dreyfus, ispirandosi a Essere e tempo di Heidegger, suggerì che un comportamento ordinato poteva emergere in assenza del rispetto di regole in un ambiente umano incarnato e dinamico (Dreyfus 1972); Lucy Suchman sottolineò il ruolo dell’azione come situata e dipendente dal contesto (Suchman, 1987); e Phil Agre tentò di implementare rappresentazioni deittiche nel software (Agre 1997). Tutti questi autori, quindi, compresero che l’intelligenza era intrinsecamente indicale (Peirce 1931, pp. 2227-2308) e non poteva esistere in un mondo ermeticamente chiuso; in particolare, Phil Agre nutriva la speranza che fosse possibile integrare il lavoro tecnico sull’intelligenza artificiale con queste visioni, creando la possibilità di una «prassi tecnica critica» (Agre 1997) – un concetto che richiama le ricerche di Bourdieu miranti a dare vita a una sociologia riflessiva (Bourdieu e Wacquant 1992). Il tentativo di Bourdieu di comprendere le regolarità sociali a prescindere dall’obbedienza alle regole costituiva a sua volta una reazione alla popolarità degli approcci strutturalisti nell’ambito delle scienze sociali, in particolare nella forma illustrata dall’antropologo Claude Lévi-Strauss 31


nella sua analisi delle relazioni mentali che determinano le diverse prassi di classificazione e i sistemi mitologici in varie società umane (Lévi-Strauss 1966). Bourdieu ravvisava nello strutturalismo un esempio classico di quello che definiva «oggettivismo»: una visione del mondo distaccata dalla pratica quotidiana degli agenti presi in considerazione, esemplificata dall’uso di dati genealogici da parte di Lévi-Strauss per spiegare la struttura formale dei rapporti di parentela nelle varie culture. Inoltre Lévi-Strauss, traendo spunto dalla scuola matematica astratta di Bourbaki, vedeva nella mitologia un elemento che poteva essere composto e manipolato come una sorta di algebra – una prospettiva palesemente atemporale che, ad avviso di Bourdieu, appariva inadeguata a rendere giustizia alle indeterminatezze e ai mutamenti legati al contesto (Bourdieu 1990c). È tuttavia interessante, in relazione al nostro tema, rilevare come la rinascita delle reti neurali a metà anni Ottanta – che ebbe luogo in gran parte indipendentemente dalla succitata letteratura critica di Dreyfus e Suchman sull’intelligenza artificiale – si ispirò anch’essa sul piano intellettuale a una rivolta contro la logica orientata alle regole; in un breve saggio che precedette la pubblicazione dei principali volumi pdp, David Rumelhart scriveva: «Il dibattito sulla cognizione, specie in relazione al linguaggio e al pensiero, è spesso incentrato sul dibattito sulle regole del linguaggio e sulle regole del pensiero... Per quanto questi approcci siano parsi acuti, essi sollevano problemi significativi. Il nostro modo di ragionare presenta caratteristici difetti – talvolta non seguiamo le regole. Analogamente, il linguaggio è pieno di eccezioni alle regole... Ormai da alcuni anni, ho la sensazione che l’approccio al linguaggio e al pensiero incentrato sulla “regola esplicita” sia errato» (David E. Rumelhart 1984). Allo scopo di illustrare pragmaticamente la sua argomentazione, Rumelhart elaborò un sistema che avrebbe dovuto tentare di apprendere la rappresentazione fonologica del passato dei verbi inglesi (Rumelhart e McClelland 1986); il presunto relativo successo di tale sistema suscitò accesi dibattiti e controversie (Boden 2006, pp. 955-957). Ben presto Paul Smolensky, un altro membro del gruppo pdp, obiettò che un simile sistema dimostrava che era 32

possibile operare senza il ricorso a regole e simboli e facendo riferimento esclusivamente alle cosiddette rappresentazioni subsimboliche, in cui input e output sono rappresentati come vettori numerici; per citare le sue parole, «diversamente dai segni simbolici, questi vettori risiedono in uno spazio topologico in cui alcuni sono vicini tra loro, e altri distanti» (Smolensky 1988)6. Questa descrizione illustra in modo conciso la visione paradigmatica della vettorizzazione dei dati (Mackenzie 2017), che di fatto è da allora divenuta la prassi standard nel campo dell’apprendimento profondo. Ad alcuni dei suddetti critici umanistici dell’intelligenza artificiale simbolica, il connessionismo sembrò rappresentare un elemento innovativo e promettente che si allineava alle loro ispirazioni intellettuali. Nelle parole di Hubert Dreyfus (e di suo fratello Stuart): «...se le reti multistrato manterranno le loro promesse, gli studiosi dovranno accantonare la posizione che fu di Cartesio, Husserl e del primo Wittgenstein secondo cui il solo modo per produrre un comportamento intelligente consiste nel rispecchiare il mondo in funzione di una teoria formale... le reti neurali potrebbero dimostrare che Heidegger, l’ultimo Wittgenstein e Rosenblatt avevano ragione nel ritenere che ci comportiamo in modo intelligente nel mondo pur senza avere una teoria del mondo stesso» (Dreyfus e Dreyfus 1988, 35). Oggi potremmo essere alla vigilia di questo sviluppo intellettuale, ma è evidente che il successo generale delle reti neurali multistrato tardò a concretizzarsi per qualche tempo; al contrario, coloro i quali vengono oggi considerati i primi esponenti dell’apprendimento profondo, come il succitato LeCun, furono drasticamente emarginati nel corso degli anni Novanta e nel primo decennio del nuovo millennio (Cardon, Cointet e Mazières 2018). Per contro, più o meno nello stesso periodo le teorie di Bourdieu furono sempre più apprezzate dalla sociologia statunitense che, come il resto delle scienze sociali a livello mondiale, ignorava deliberatamente, o non conosceva affatto, gli sviluppi contemporanei nel campo della metodologia di apprendimento delle macchine, come i popolari modelli di apprendimento automatico “superficiale” per dati tabulari esemplificati dalle Support Vector Machines (svms, macchine a vettori di supporto) (Lamont 2012; Cortes e Vapnik 1995). 33


Temporalità, teoria dello sviluppo e mimesi Un altro gruppo che trasse ispirazione dal connessionismo dei tardi anni Ottanta fu quello degli psicologi dello sviluppo, che trovarono nelle reti neurali ricorrenti (rnn) dello scienziato cognitivo di San Diego Jeff Elman – un’architettura semplice il cui output ricorre iterativamente sul suo input, mentre uno o più «stati nascosti» vengono aggiornati internamente – un’utile metafora del processo di apprendimento umano nel corso del tempo (Elman 1990; Plunkett e Sinha 1992). Secondo questi psicologi, il cognitivismo e l’intelligenza artificiale simbolica avevano messo in ombra sia il processo temporale sia il processo sociale dell’acquisizione della conoscenza in pratica, ma il processo di addestramento progressivo delle reti neurali – che partiva da valori di riferimento inizializzati in modo casuale e conseguiva prestazioni sempre migliori attraverso le “epoche” dei dati di presentazione – richiamava le teorie psicologiche epigenetiche – più “dinamiche” – dello sviluppo cognitivo umano di Jean Piaget o di Lev Vygotsky. Vi fu anche chi riconobbe delle analogie tra le cosiddette curve di apprendimento «a U» dei rnn e quelle rilevate nei processi di apprendimento umano (Plunkett e Marchman 1991). Se tuttavia questa esplorazione delle rnn restituì rilevanza alla temporalità nel contesto delle teorie cognitive dell’apprendimento, tale apprendimento artefattuale non era significativamente “sociale”, in quanto era costituito dalla ripetuta presentazione di dati di addestramento “supervisionati” (con risposte “esatte” e una rigida penalizzazione delle risposte errate); per contro, l’architettura duale delle gan suggerisce esplicitamente una relazione più articolata tra un “insegnante” (che giudica l’output dello studente) e lo “studente” (che ha il solo compito di imparare a soddisfare l’insegnante). In particolare, come nella maggior parte delle reti neurali multistrato, in una gan i valori di riferimento del generator, così come quelli del discriminator, vengono inizializzati in modo casuale, cosicché all’inizio del processo di addestramento il generator è “stupido” e sa soltanto creare immagini “casuali” di disturbo, e il discriminator è altrettanto “stupido” – per esempio, non è in grado di distinguere le immagini reali di 34

cifre dal disturbo prodotto dal generator. Ma a ogni passaggio di “andata e ritorno” dell’addestramento, il discriminator impara qualcosa di più sulle immagini reali delle cifre, e il generator impara qualcosa di più riguardo a ciò che il discriminator considera una cifra valida. Di conseguenza, almeno nella formulazione originaria delle gan, il discriminator ha soltanto un “vantaggio” minimo rispetto al generator in ciascun passaggio dell’addestramento7. Questa situazione può essere paragonata al cosiddetto peer learning (Topping e Ehly 1998), in cui il processo di apprendimento da un soggetto che si trova appena al disopra del livello di conoscenza del discente può risultare produttivo in quanto ha luogo nell’ambito di quello che Vygotsky (1978) definì “zona di sviluppo prossimale” (Zone of Proximal Development, zpd). Sebbene Bourdieu citi direttamente Piaget e Vygotsky soltanto di rado, Lizardo (2004) ha messo in luce il contesto dei primi scritti di Bourdieu sull’habitus, dimostrando che l’autore subì l’influenza dell’«inedita miscela di strutturalismo e psicologia cognitiva dello sviluppo» di Piaget. Si può citare un suggestivo brano tratto dal volume L’epistemologia genetica di Piaget del 1971: «… Credo che la conoscenza umana sia essenzialmente attiva. Conoscere è assimilare la realtà entro sistemi di trasformazione. Conoscere è trasformare la realtà allo scopo di comprendere come si determini un certo stato. Alla luce di questa prospettiva, mi trovo contrario alla visione della conoscenza come copia – copia passiva – della realtà. […] Conoscere la realtà significa costruire sistemi di trasformazioni che corrispondono, più o meno adeguatamente, alla realtà… La conoscenza è, quindi, un sistema di trasformazioni che diventa progressivamente adeguato» (Piaget 1971, p. 15). Sebbene Piaget non assegni un nome a questo tipo di processo di apprendimento, esso richiama ancora una volta alla mente i generator delle gan, che non apprendono mediante un semplice processo di copia, ma assimilano un «sistema di trasformazioni» che – attraverso il ripetuto confronto con i giudizi del discriminator – «diventa progressivamente adeguato». Analogamente, Bourdieu descrive il «processo di acquisizione» dell’habitus come una «mimesi pratica», esplicitamente contrapposta a «un’imitazio35


ne che presupporrebbe un tentativo consapevole di riprodurre un gesto, una parola o un oggetto esplicitamente costituito come modello...» (Bourdieu 1990b, p. 73). Si può così ravvisare una corrispondenza tra l’addestramento dell’habitus e la modalità in cui una gan apprende a generare e/o a classificare senza ricorrere a una rappresentazione «consapevole» o spiegabile. Si può altresì notare che, nel caso delle reti generative, pur essendo indubbiamente presente una «costituzione esplicita di un modello», le immagini generate non sono effettivamente imitative – semplici riproduzioni di esempi contenuti nei dati di addestramento – poiché il generator non vede mai i dati di addestramento; riceve soltanto giudizi di plausibilità dal discriminator. Sotto questo aspetto le gan, più di altri tipi di modelli generativi, appaiono più prossime alla mimesi di Bourdieu che all’imitazione8. Al tempo stesso, l’uso del termine mimesi evidenzia uno degli aspetti più profondamente non-sociali delle gan, e cioè il fatto che tipicamente il generator interagisca soltanto con un discriminator, e non apprenda quindi da altre reti. In questo senso, la mimesi di una gan non richiama nemmeno lontanamente le complessità implicite nelle teorie della mimesi di René Girard, che ritiene che i comportamenti (e i desideri) mimetici siano legati da una relazione di prossimità e dipendenza all’osservazione dei comportamenti e dei desideri altrui, nel contesto di una ricorsività potenzialmente illimitata, e politicamente pericolosa (Girard 1979). Sebbene le architetture alternative delle gan più recenti abbiano tentato di introdurre strutture comprendenti più discriminator (Durugkar, Gemp e Mahadevan 2016) e più generator (Ghosh et al. 2017), i ricercatori non hanno ancora concepito, nel momento in cui scriviamo, reti generative che si configurino come agenti nell’ambito di una comunità di artisti e critici o nel contesto di un altro «mondo dell’arte» sociologico più ampio9. Il pregiudizio nell’apprendimento automatico, il capitale culturale e l’oggetto di consumo epistemico Il fascino rivestito dalla specifica tipologia di riproduzione mimetica delle gan, dunque, sta nel fatto che esse sono in grado di 36

produrre nuove immagini che sembrano tratte dai dati di addestramento, ma non costituiscono in realtà delle imitazioni o delle copie esplicite di immagini contenute in tali dati. Per Bourdieu, l’habitus è qualcosa che egli definisce a un tempo durevole e trasponibile: è relativamente stabile, ma può essere utilizzato dinamicamente in situazioni sociali nuove e diversificate – è «in grado di divenire attivo in un’ampia varietà di teatri dell’azione sociale» (Maton 2008)10. Nel crescente dibattito sviluppatosi nel corso degli ultimi anni riguardo al tema del pregiudizio nell’apprendimento automatico (Barocas e Selbst 2016) si può cogliere a mio avviso una preoccupazione relativa alla crescente concretizzazione di questa stessa durevolezza e trasponibilità, spesso per effetto delle tecniche di apprendimento profondo. All’inizio del decennio, per esempio, le reti neurali (superficiali) erano (e sono ancora) utilizzate per l’addestramento dei cosiddetti word embedding (o vettori verbali); questi ultimi, addestrati mediante grandi moli di testo, rappresentano singole parole (estrapolate dal contesto) sotto forma di vettori di grandi dimensioni di numeri reali destinati all’impiego da parte di altri modelli di apprendimento automatico11. Due studi recenti hanno scoperto in modo indipendente che questi vettori recano in sé – e, se applicati a piattaforme di uso diffuso, possono riprodurre – pregiudizi culturali; per esempio, i nomi femminili vengono associati a termini relativi alla «famiglia» più che a termini relativi alla «carriera» (Bolukbasi et al. 2016; Caliskan, Bryson e Narayanan 2017). Tali pregiudizi all’interno dei vettori possono essere rispecchiati dai risultati delle ricerche in rete e da altre situazioni di interazione, e i due studi in questione hanno evidenziato preoccupazioni proprio alla luce della crescente standardizzazione dei dati di word embedding e della crescente facilità con cui Google, Facebook e altre piattaforme, possono applicare ciecamente e su vasta scala queste interpretazioni tendenziose nella vita socio-tecnica quotidiana. Negli ultimi anni, gli studi sul pregiudizio nell’apprendimento automatico non si sono limitati a esaminare i modelli basati su dati strutturati e tabulari (come nel caso dell’algoritmo di classificazione della recidività utilizzato negli usa noto come compas) o testuali (come nei word embedding), ma hanno anche messo in 37


luce i potenziali risvolti discriminatori delle reti neurali convoluzionali sia nell’ambito del riconoscimento facciale (Introna e Nissenbaum 2009) sia in quello del riconoscimento degli oggetti nelle immagini in generale (Noble 2018). È a questo punto che è lecito teorizzare che i modelli generativi (gan comprese) costituiscano una varietà specifica di pregiudizio nell’apprendimento automatico che enfatizza una forma limitata di azione pratica che trae vantaggio, pur essendone in parte distinta, da una struttura di percezione e di classificazione «addestrata». In parole povere, le gan riproducono il pregiudizio non soltanto attraverso la facilità con cui possono operare classificazioni stereotipate, ma anche alla luce della loro potenziale capacità di generare nuovi dati tendenziosi12. Si differenziano quindi dagli «algoritmi dell’oppressione» dei motori di ricerca e di raccomandazione di Google, i cui pregiudizi, pur esistendo, devono tuttavia essere ripresi e riprodotti da esseri umani che intraprendono un’azione pratica autonoma. Per dirla con Bourdieu, i pregiudizi dell’apprendimento automatico tradizionale si possono considerare durevoli ma non trasponibili. Le gan ci conducono più vicino a questo tipo di trasponibilità – ma di certo non la realizzano, dal momento che un modello standard di gan, pur essendo in grado di produrre oggetti nuovi simili ai suoi dati di addestramento, lo fa in modo simile in qualunque ambito contestuale. Uno dei modi per comprendere questo carattere durevole ma non esattamente trasponibile delle gan consiste nell’esaminarle attraverso la lente di un altro concetto presente nell’opera di Bourdieu, quello di capitale culturale. Bourdieu distingue questa categoria dai concetti più tradizionali di capitale economico (cioè qualcosa che può essere convertito direttamente in valore monetario, come il denaro o la proprietà privata) e capitale sociale (che implica un’interrelazione tra agenti e/o una relazione tra agenti e risorse a essi accessibili in virtù della loro posizione in una rete sociale) (Bourdieu 1986). Il capitale culturale, per contro, era il tipo di capitale che Bourdieu riteneva inizialmente venisse creato attraverso la relazione tra famiglia e sistema scolastico, e che si presenta sotto tre forme generali: incorporato (incarnato come parte dell’habitus), oggettivato (che si manifesta in forma mate38

p. 104

QR Code

riale) o istituzionalizzato (sancito da un’istituzione di qualche genere) (Bourdieu 1979). Così, nel caso di un’istituzione scolastica, si potrebbe semplificare il discorso affermando che gli scolari vi entrano provvisti di un capitale culturale incorporato/incarnato che hanno acquisito dai loro genitori e dalla loro educazione; successivamente, sviluppano relazioni con forme di capitale culturale oggettivizzato quali libri di testo, software didattico e apparati di valutazione; e vengono ricompensati mediante un capitale culturale istituzionalizzato rappresentato da qualifiche e titoli di studio (oggettivato simbolicamente in forma di diploma). Tale cornice concettuale solleva un interrogativo: quale tipo di capitale rappresentano le reti neurali addestrate, e le gan in particolare? I numerosi e ben noti modelli di apprendimento profondo di cui è disponibile online l’architettura sotto forma di codice sorgente – così come, spesso, i relativi modelli pre-addestrati – non vanno probabilmente considerati una forma di capitale economico o sociale. Per contro, la capacità delle reti neurali di classificare in modo efficiente gli oggetti all’interno delle immagini assomiglia a una forma di capitale culturale; e Bourdieu ha effettivamente illustrato – nel suo saggio intitolato Profilo di una teoria sociologica della percezione dell’arte – come la «competenza artistica» possa essere concepita come «la conoscenza preliminare delle possibili suddivisioni in classi complementari di un universo di rappresentazioni» (Bourdieu 1993a [1968]). In una prospettiva contemporanea, tutto ciò appare marcatamente simile a una cnn (con discriminator), che, nel caso dei modelli addestrati sulla vasta raccolta di immagini nota come ImageNet, è in grado di distinguere 1000 classi di oggetti all’interno di immagini a colori da 224 × 224 pixel; mentre per Bourdieu, la metafora operativa consisteva nella capacità dello spettatore di identificare l’«autore» di un dato dipinto – capacità che varia in funzione dell’entità variabile del capitale culturale (specie quello inculcato dalla famiglia e dai vari tipi di scolarizzazione) posseduto dagli individui. Bourdieu continua: «La padronanza di questo tipo di sistema di classificazione consente di collocare ogni elemento dell’universo all’interno di una classe necessariamente determinata in rapporto a un’altra 39


classe, a sua volta costituita da tutte le rappresentazioni dell’arte consciamente o inconsciamente prese in considerazione che non appartengono alla classe in questione. Lo stile caratteristico di un periodo o di un gruppo sociale non è altro che una classe di questo tipo, definita in rapporto a tutte le opere appartenenti allo stesso universo che essa esclude e che sono a essa complementari» (Bourdieu 1993a, p. 221). Nel caso a) del classificatore di una rete neurale del tipo cnn o b) di una cosiddetta class-conditional gan – che impara a generare nuove immagini di oggetti in funzione di una molteplicità di categorie, come in Mirza e Osindero (2014) – questo tipo di capitale culturale si può considerare incorporato, specie se si ravvisa nella struttura a flusso delle architetture delle reti neurali una sorta di incarnazione; dal punto di vista di Bourdieu, tuttavia, la dinamicità relativamente limitata di tali architetture porrebbe dei limiti a questa identificazione. Si tratta però certamente di un capitale culturale oggettivato, cioè convertito in forma inerte e stabilizzata; e l’istituzionalizzazione del capitale culturale delle gan è un processo attualmente in corso, come evidenziano i recenti tentativi di Christie’s, Sotheby’s e varie gallerie minori londinesi e parigine di investire il proprio valore istituzionalizzato nella conversione performativa delle gan in capitale economico. In tal senso, si può osservare che per quanto i modelli di apprendimento automatico possano essere coinvolti in un processo di riproduzione culturale oggettivata e quindi tendenziosa, essi richiedono ancora l’intervento di agenti umani nell’ambito della società per quanto riguarda l’incorporazione e l’istituzionalizzazione. Inoltre, la descrizione citata più sopra della modalità in cui secondo Bourdieu è possibile apprendere uno “stile” coerente attraverso un processo di esclusione relazionale si può considerare simile al processo di addestramento di queste gan condizionali, che apprendono progressivamente a imitare varie classi di immagini in funzione della crescente capacità del discriminator di distinguere tali classi. Particolarmente interessante, tuttavia, è prendere in esame le gan condizionali che apprendono da insiemi di dati più vasti quali ImageNet – un’enorme raccolta di dati che contiene 14 milioni di immagini scaricate dal web – come il 40

https://arxiv.org/pdf/1809.11096.pdf

Andrew Brock, Jeff Donahue e Karen Simonyan, Large Scale gan Training for High Fidelity Natural Image Synthesis, 2018.

Sito di Joel Simon.

p. 230-231

A hideaway in the wastelands of #Biggan

recente Biggan (Brock, Donahue e Simonyan 2018). Biggan, che è in grado di generare nuove immagini sulla base di qualsiasi classe dell’insieme di dati di ImageNet (per esempio leopardi, navi da carico, funghi, cani dalmata eccetera) a partire da un singolo vettore da 128 valori di numeri reali (il «vettore latente») utilizzato come input, ha quindi la capacità potenziale di produrre un numero praticamente infinito di immagini possibili. Si tratta quindi di un oggetto che ha assorbito una quantità ingente di capitale culturale, sotto forma di conoscenza dell’enorme universo di fotografia amatoriale e professionale contenuto in tutte le diverse classi del sistema di classificazione di ImageNet; ma si tratta anche di un oggetto che, in termini di capacità generative, sembra eccedere il capitale culturale assorbito (o dimostrarne la natura non quantificabile)13. Il modello Biggan di Brock, che genera con facilità immagini caratterizzate da una certa coerenza strutturale ma spesso anche da una natura profondamente aliena (e alienante), può dunque essere concepito come una varietà assai specifica di quell’entità che una scuola della teoria sociologica «post-sociale» definisce oggetto di consumo epistemologico: qualcosa di «materialmente sfuggente» e caratterizzato da una «mancanza di stabilità ontologica» che ne fa «un continuo progetto di conoscenza per consumatori» (Zwick e Dholakia 2006). Un esempio di oggetto di questo genere è offerto dal mondo dei mercati finanziari in tempo reale – spesso definiti olisticamente «il mercato» –, un’entità che, pur non potendo mai essere pienamente osservata, fornisce un incessante flusso di informazioni a cui attingono comunità di investitori e operatori finanziari. L’interpretazione di Biggan come oggetto di consumo epistemologico è illustrata nel modo più chiaro dal sito di Joel Simon ganbreeder.app, in cui gli utenti possono “esplorare” interattivamente lo spazio dei vettori latenti del modello Biggan e servirsi di un tipo di algoritmi genetici per “ibridare” tali vettori (Simon 2018). Tale esplorazione, condotta manualmente, ha permesso a Mario Klingemann di improvvisare un «tour» virtuale e aleatorio di questo spazio latente all’epoca della pubblicazione originale del modello. 41


I limiti della teoria dei giochi Tra gli aspetti più affascinanti e suggestivi della formulazione originale delle gan da parte di Goodfellow vi è il suo impiego degli aspetti formali della teoria dei giochi, un sottoinsieme dell’economia che trae origine dal libro di von Neumann e Morgenstern Theory of Games and Economic Behavior del 1944. Il fascino risiede in parte nel fatto che tale impiego contribuisce a spiegare l’architettura duale delle gan – che diversamente apparirebbe “strana” – in rapporto a uno dei pochi settori delle scienze sociali con i quali gli scienziati del computer hanno tipicamente familiarità; ma anche nel fatto che, come abbiamo visto, il linguaggio di Bourdieu si serve sovente a sua volta di metafore economiche (come nel concetto di capitale culturale). E, in effetti, Bourdieu parla spesso del modo in cui l’habitus apprende sia a classificare sia a generare un’attività – che si svolge in un’arena sociale «relativamente autonoma» da lui definita campo – come di un processo che comprende «un “senso del gioco”» (Bourdieu 1990b, p. 66). Definisce questo campo come «uno spazio definito da un gioco che offre determinati premi o guadagni» ed è legato a una relazione duale con l’habitus, definito come il «sistema di disposizioni adattate a tale gioco» (Bourdieu 1993b, p. 18). Bourdieu, tuttavia, sottolineò come a differenza di un gioco da tavolo o di una partita di calcio, in cui le regole possono essere consapevolmente concepite come «un costrutto sociale arbitrario» dai giocatori, questi campi sono «il prodotto di un lungo, lento processo di autonomizzazione» in cui «l’individuo non entra in gioco con un atto consapevole, ma nasce nel gioco e con il gioco» (Bourdieu 1990b, p. 67). Nel tentativo di dare una risposta definitiva al nostro interrogativo principale – e cioè in quale misura le gan siano o meno paragonabili all’habitus (in un dato campo) – le domande che intendo affrontare in ultimo sono quindi in un certo senso “bidirezionali”: – In quale misura il processo di addestramento di una gan si può interpretare in termini di gioco (e/o in funzione della teoria dei giochi)? 42

– In quale misura la relazione habitus/campo si può interpretare in termini di gioco (e/o in funzione della teoria dei giochi)? In entrambi i casi, gli autori principali di riferimento (Ian Goodfellow per le gan e Bourdieu per l’habitus) utilizzano ampiamente metafore che rimandano al gioco e/o alla teoria dei giochi, e lo scopo di questo paragrafo finale è valutarne la rispettiva adeguatezza e/o equivalenza. Nel suo studio iniziale sulle gan, Ian Goodfellow descrive l’architettura delle gan come «un gioco di minimax a due giocatori con funzione di valore v(g,d)»; vi è cioè un’unica funzione astratta di cui il discriminator cerca di massimizzare il valore di output, che il generator cerca a sua volta di minimizzare – e cioè la capacità del discriminator di distinguere tra le immagini tratte dai dati di addestramento e quelle create dal generator (I. Goodfellow et al. 2014)14. Nella funzione di valore specificata da Goodfellow, la situazione ottimale del discriminator è quella in cui esso è in grado di restituire sistematicamente 1,0 per i dati veri e 0,0 per i dati falsi; e la situazione ottimale del generator è quella in cui il discriminator restituisce «0,5» per tutti i dati, mostrando così di essere «confuso al massimo» (Creswell et al. 2018). Questa funzione segue la logica del «gioco di minimax» elaborato negli anni Venti da John von Neumann, matematico ed eclettico scienziato ungherese noto per i suoi contributi nel campo della fisica e degli esordi della scienza dei computer; secondo von Neumann, nel cosiddetto gioco a somma zero (in cui la vincita di un giocatore è eguale alla perdita dell’altro), la strategia ottimale per entrambi i giocatori consiste nel tentare di minimizzare la loro perdita massima a ogni turno – da cui l’espressione «minimax»15. Vi sono tuttavia alcune differenze significative tra il tipo di gioco discusso da von Neumann nella prima metà del Novecento – tipicamente rappresentato da una piccola tabella definita matrice dei payoff, che enumera le vincite e le perdite in funzione delle azioni strategiche di due giocatori – e il tipo di “gioco” che rientra nell’addestramento di una gan. In particolare, dal momento che le gan vengono addestrate nel corso di una successione di turni alternati, essi corrispondono a quella che nella teoria dei giochi si definisce «forma estesa» o «forma dinamica», con43


trapposta alla tradizionale «forma normale» (Hargreaves-Heap e Varoufakis 2004, p. 45). Inoltre, l’«azione» intrapresa a ciascun turno – la generazione di nuovi punti dati da parte del generator o la promulgazione di giudizi «vero-falso» da parte del discriminator – mette in ombra la trasformazione alquanto radicale dell’intero agente – generator o discriminator – attuata dall’algoritmo di retropropagazione, che è potenzialmente in grado di aggiornare milioni di parametri diversi a ogni passaggio dell’addestramento. Di conseguenza, la funzione di valore v(g,d) non è stabile – di fatto, muta dinamicamente a ogni passaggio. Questa dinamicità rende difficilmente raggiungibile una piena convergenza su quello che si definisce equilibrio di Nash – uno stato in cui il generator non può più migliorare in funzione dei giudizi del discriminator, e in cui il discriminator non può più migliorare nel distinguere le immagini vere da quelle false (Goodfellow 2016; Salimans et al. 2016). Gli elementi di base della teoria dei giochi – che comprendono giocatori, strategie e preferenze rispecchiate in payoff rivestiti di valore – si possono considerare alla stregua di un tentativo di formalizzare una «teoria del processo decisionale interdipendente» (Colman 1995, p. 3). Questa teoria comprende una serie di presupposti, alcuni impliciti e altri espliciti, che potrebbero potenzialmente renderla problematica in rapporto a teorie più complesse del comportamento umano. Tali presupposti, definiti da Hargreaves-Heap e Varoufakis (2004, pp. 7-33), comprendono quanto segue: – L’azione individuale è strumentalmente razionale: vale a dire che ciascun agente è portatore di un ordine preferenziale dei risultati, evidenziato dal modo in cui la funzione di valore (talvolta definita anche funzione di perdita o funzione di utilità) produce un unico valore unidimensionale che, nel caso delle gan, descrive la misura in cui il generator è riuscito a ingannare il discriminator o la misura in cui il discriminator ha classificato con successo le immagini vere e le immagini false (questo presupposto può risultare familiare in relazione allo stereotipo dell’homo oeconomicus che mira esclusivamente a massimizzare la sua funzione di utilità). 44

– Conoscenza comune della razionalità: ogni agente in uno scenario della teoria dei giochi sceglie una strategia in base al presupposto che gli altri agenti stiano operando nel modo descritto sopra, cioè guidati da una funzione di utilità unidimensionale che determina le preferenze nelle loro azioni. – Conoscenza delle regole del gioco: si dà per scontato che ogni agente abbia familiarità con l’intero spettro delle azioni possibili e con i relativi payoff. – Separazione delle regole del gioco dalle azioni intraprese: le regole del gioco sono fisse e non possono essere influenzate dalle azioni intraprese; a loro volta, le regole non possono influire sull’ordine preferenziale di specifiche azioni. Sebbene ognuno di questi presupposti sia presente per definizione nella formulazione delle gan che fa riferimento alla teoria dei giochi, non tutti sono accettabili per sociologi come Bourdieu, le cui teorie si fondano sia sull’habitus – la «struttura strutturante» classificante e generativa – sia sul campo in cui l’habitus viene impiegato (a dispetto della caratterizzazione del campo da parte di Bourdieu come un’“arena” simile a un terreno di gioco). Se precedentemente abbiamo lasciato da parte la questione dell’autonomia e dell’agire delle reti generative, possiamo ora contrapporre i limiti dell’architettura delle gan ai campi artistici e letterari analizzati da Bourdieu allo scopo di chiarire meglio le limitazioni di queste «intelligenze artificiali» rispetto a quelle degli artisti umani. Se infatti, come accennato più sopra, il connessionismo fu originariamente postulato come rifiuto di un cognitivismo incentrato sulle regole, la dipendenza dell’addestramento delle reti neurali da funzioni di perdita/utilità implica che l’apprendimento profondo e le gan conservino un legame assai stretto con il razionalismo strumentale. Le gan, tuttavia, superano le funzioni di perdita fisse dell’apprendimento supervisionato tradizionale con un processo di addestramento che apprende progressivamente una funzione di perdita (via via che i parametri del discriminator e del generator si evolvono)16. A ogni modo, per Bourdieu nulla sarebbe potuto essere più rozzo di un simile approccio utilitaristico alla creazione artistica rispetto alla realtà sociale: per lui, l’utilitarismo equivale al «livel45


lo zero della sociologia», espressione con cui designa un punto di partenza isolato, inerte e amodale – e perciò non molto sociologico (Bourdieu 1993b, p. 76). La reale modellazione di un agente in un ambito artistico empiricamente plausibile sarebbe notevolmente più complicata e non potrebbe mai essere ridotta alla razionalità strumentale, come illustra il seguente brano che descrive come affrontare la produzione di musica: «A rendere così complesso [lo studio dell’economia della produzione musicale] è il fatto che, nel campo dei beni culturali, la produzione implica la produzione di consumatori, e cioè, più precisamente, la produzione del gusto per la musica, del bisogno di musica, della fede nella musica. Per dare adeguatamente conto di tutto ciò... occorrerebbe analizzare l’intera rete di relazioni di competizione, complementarietà e complicità nella competizione che lega l’intero insieme di agenti interessati – compositori e cantanti celebri e sconosciuti, produttori discografici, critici, produttori radiofonici, insegnanti eccetera: in breve, tutti coloro che hanno interesse per la musica e interessi che dipendono dalla musica, investimenti musicali – in senso sia economico sia psicologico – che sono coinvolti nel gioco e vengono sussunti dal gioco» (Bourdieu 1993b, p. 106). Di conseguenza, possiamo affermare che sebbene le gan si possano considerare una rappresentazione di un habitus artistico in una sorta di limitata cornice “supervisionata”, questo simulacro di habitus è scarsamente in grado di riprodurre le complessità di un campo artistico. Per Bourdieu, gli attori nei campi artistici del passato e del presente non sono soggetti a un unico, onnipotente «discriminator»; esistono non soltanto numerosi critici (compresi i colleghi), ma anche numerose sfere critiche, ognuna delle quali compete con ognuna delle altre per accaparrarsi autorevolezza17. Bourdieu ha analizzato in modo puntuale l’emergere di questa «pluralità di sette rivali caratterizzate da una molteplicità di dèi incerti» nella sua acuta lettura della «rivoluzione simbolica» attuata da Édouard Manet negli anni Sessanta dell’Ottocento con dipinti oggi celebri quali Le déjeuner sur l’herbe (1863) e Olympia (1863) (Bourdieu 1993c; Bourdieu 2017). Il caso di Manet, che trasformò dinamicamente le modalità di interpreta46

zione e valorizzazione dell’arte, offre a Bourdieu l’opportunità di interrogarsi e di riflettere sulle sue stesse teorie della riproduzione culturale (Merriman 2017). Questo esempio suggerisce che l’artista realmente autonomo sarebbe colui che è in grado non soltanto di operare all’interno delle «regole del gioco» apprese, ma anche di sconvolgerle completamente. Infine, alla luce del suo interesse sia per l’ambito artistico sia per quello economico, Bourdieu è particolarmente attento all’emergere nel corso dell’Ottocento di una cultura bohémienne, caratterizzata in primo luogo da un rovesciamento degli incentivi finanziari, per cui il fallimento costituisce una sorta di successo, mentre lo “svendersi” (cioè la massimizzazione del profitto) è la prospettiva peggiore in assoluto: «Il gioco dell’arte è, dal punto di vista degli affari, un gioco in cui “chi perde prende tutto”. In questo mondo economico capovolto, non è possibile conquistare denaro, onori (è Flaubert ad affermare che “gli onori disonorano”)... in breve, tutti i simboli del successo terreno, del successo nell’alta società e del successo nel mondo, senza compromettere la propria salvezza nell’aldilà. La legge fondamentale di questo gioco paradossale è che l’individuo ha interesse a essere disinteressato: l’amore per l’arte è un amore folle [l’amour fou], almeno se lo si considera dal punto di vista delle norme del mondo comune, “normale” portato sulla scena dal teatro borghese» (Bourdieu 1996, p. 21). Ciò ci conduce a evidenziare che se le gan – nella loro formulazione di instancabili ottimizzatrici di una funzione di perdita – replicano intenzionalmente o meno un modello di attore razionale di tipo economicistico, si può ipotizzare che essi si collochino fondamentalmente agli antipodi rispetto alla «funzione di valore» che ha caratterizzato molti artisti umani in via di formazione nel corso della storia. Sotto questo aspetto, l’habitus delle gan si differenzia nettamente dalle norme culturali di un contesto bohémien originario, ma non necessariamente da quelle del mondo dell’arte contemporaneo, che – come abbiamo potuto rilevare in relazione alla vendita all’asta di opere d’arte prodotte da reti generative neurali e all’“ospitalità” offerta (per esempio da Google) agli artisti che si servono dell’intelligenza artificiale – 47


ha finito per assimilare gli incentivi commerciali conservando al tempo stesso gli elementi normativi di un settore d’avanguardia. Alla luce di queste sostanziali incompatibilità tra la metodologia di addestramento delle gan e le complessità sociologiche del campo artistico – quali le relazioni tra più agenti nello spazio, i presupposti del contesto della teoria dei giochi o i paradossi specifici della funzione di perdita o di utilità – possiamo affermare, https://bit.ly/2NUCzrq con Hertzmann (2018), che tali modelli/algoritmi non possono Can Computers Create Art? per il momento essere considerati «creatori autonomi», e che per Aaron Hertzmann, “Arts”, 2018. ritenerli tali sarebbe necessario prendere in considerazione nel processo di addestramento una porzione di gran lunga superiore delle caratteristiche essenzialmente sociali della produzione e della riproduzione artistica18. Per quanto alcuni sviluppi nel campo dell’addestramento per rinforzo sembrino muoversi in una direzione interessante che ricorda il «campo» – un contesto caratterizzato da una molteplicità di agenti, ciascuno dei quali modella altri agenti, come in Jacques et al. (2018) – per il momento il futuro della neurografia non sembra destinato a riservare alla gan uno spazio autonomo maggiore di quello concesso dalla storia della fotografia alla macchina fotografica autonoma.

potrà avere modo, esplorando la teoria sociologica, di comprendere con maggiore chiarezza – forse in modo sorprendente, e forse ancor più a fondo degli stessi tecnici dell’apprendimento automatico – tanto la carica innovativa dell’intelligenza artificiale quanto i suoi potenziali limiti.

Conclusioni In questo capitolo ho cercato di dimostrare come l’innovativa architettura duale delle reti antagoniste generative (gan) possa essere adeguatamente interpretata come equivalente all’habitus a un tempo cognitivo e sociale di Pierre Bourdieu; e come questi e altri analoghi sviluppi legati alle architetture nel contesto della “rivoluzione” dell’apprendimento automatico, concepiti principalmente come successi scientifici e tecnici (Sejnowksi 2018), possano essere interpretati anche come una nuova fase della scienza dei computer che rappresenta – deliberatamente o meno – una nascente reinvenzione indipendente della teoria sociale. Questo tipo di modelli di apprendimento automatico basato sull’“interazione” può potenzialmente consentirci di osservare la teoria sociologica classica e contemporanea attraverso una lente nuova; e viceversa, chi possiede la necessaria inclinazione 48

49


Le gan e la questione della creatività nell’arte e nell’intelligenza artificiale Marian Mazzone

1. Link Between Heaven and Earth, Rutgers Art & AI Lab, 2017. Alluminio Dibond, 120 × 120 cm. Dalla prima esposizione di opere aican “Art of the Future, Now”, scope Miami Beach 2018.

50

La vendita da parte di Christie’s di un’opera realizzata dal gruppo Obvious con l’aiuto di un’intelligenza artificiale – e le conseguenti reazioni da parte della stampa, caratterizzate da costernazione e disinformazione – hanno messo in luce le difficoltà sollevate dall’idea dell’intelligenza artificiale nel pubblico e nel mondo dell’arte. Le opere che implicano un qualsivoglia impiego dell’intelligenza artificiale suscitano dibattiti sulla validità della creatività delle macchine, sull’identità del vero artista e sulla qualità estetica dei risultati. In questo momento filosofi, esperti di scienze del computer ed esponenti del mondo dell’arte devono affrontare interrogativi di grande complessità, che toccano il cuore della questione relativa a che cosa si debba intendere per “arte” e “creatività”, e a che cosa esse rappresentino per noi come creatori e fruitori umani dell’arte. Le macchine possono essere creative, oppure la creatività è una caratteristica esclusivamente umana? Il processo generativo di un’intelligenza artificiale può essere definito creativo? Come valutare le opere d’arte così ottenute, e in base a quali criteri estetici? La mia prospettiva è quella di una storica dell’arte https://bit.ly/3fJS15x associata al laboratorio Rutgers Art & Artificial Intelligence, che Rutgers Art & AI Lab. si occupa di intelligenza artificiale e arti visive. Confido che 51


questa duplice esperienza mi abbia fornito qualche conoscenza utile sulle questioni e sui processi di ricerca che guidano lo sviluppo dei programmi algoritmici applicati al campo dell’arte. Questo saggio esamina il tema della creatività nell’ambito della produzione artistica generata dalle intelligenze artificiali – e in particolare dalle gan – nel tentativo di definire una serie di possibili approcci alle future fasi della produzione artistica realizzata mediante le macchine e dalle macchine stesse. Condivido l’idea che l’intelligenza artificiale possa costituire un’entità creativa in grado di produrre opere d’arte che meritino la nostra attenzione visiva e siano in grado di conservare l’interesse del pubblico contemporaneo. L’introduzione delle gan nel 2014 da parte del team di Ian Goodfellow (Goodfellow et al. 2014) ha determinato un aumento della sperimentazione creativa applicata alla creazione di opere d’arte mediante algoritmi. Le gan si servono di una tecnica di apprendimento automatico basata sull’elaborazione antagonista, in grado di produrre risultati sempre più nuovi e al tempo stesso accettabili. Nel caso delle immagini, le gan generano risultati il cui aspetto è simile, ma non esattamente identico, a quello dei dati utilizzati per il loro addestramento. Semplificando al massimo, si può affermare che attraverso la presentazione di un gran numero di immagini – poniamo – di cani, la macchina viene addestrata dalla gan a produrre nuove immagini di cani che sono riconoscibili come tali, ma non costituiscono copie esatte delle immagini presentate. I risultati sono più raffinati di quelli attualmente prodotti da altre strutture algoritmiche. Le gan sono composte da un generator e da un discriminator che operano l’uno contro l’altro. La macchina viene “incoraggiata” a elaborare nuove immagini (così come fanno molti altri algoritmi generativi o ga), più che a sfornare delle repliche, e a rifinire costantemente le pratiche di elaborazione e i risultati, in modo da migliorare il suo output. La sofisticata funzione generativa delle gan ha indotto alcuni a mettere in relazione tale processo con la creatività. Qui risiede l’argomento del contendere: questa generazione di nuove immagini è o non è un atto o una scelta che si possano definire creativi? 52

2

p. 27

Gli importanti contributi di Margaret Boden alla scienza cognitiva e alla scienza dei computer offrono alcune definizioni utili e approcci chiari alla creatività negli esseri umani e nelle macchine. In questo saggio seguirò la sua definizione e la sua descrizione tipologica della creatività. Come afferma la Boden, stabilire che cosa sia autenticamente creativo è complesso e con ogni probabilità impossibile, se il problema viene posto in termini filosofici (Boden 2009). Ma se si lasciano da parte gli argomenti filosofici sulla natura della creatività, vi sono numerosi concetti che la maggior parte di noi potrebbe condividere. Tali concetti forniscono inoltre delle linee guida sul modo in cui concepire processi e azioni nell’ambito della creatività – un aspetto che riguarda l’arte realizzata con i computer. Innanzitutto, «la creatività si può definire come la capacità di creare idee nuove e dotate di valore» (Boden 2009), dove il termine «idee» può indicare manufatti o opere d’arte. La Boden indica quindi due livelli di novità: le idee creative p (psicologiche) – idee «generate» da un individuo che sono nuove per l’individuo stesso, ma non per tutti gli altri – e le idee creative h (historical = storiche), che oltre ad avere il carattere della creatività p sono anche nuove per tutti. Le idee creative h sono quelle a cui facciamo riferimento nella maggior parte dei casi in cui analizziamo dei prodotti creativi, valutando se un dato prodotto è nuovo, diverso da qualunque influenza e quindi unico. Si tratta di un parametro estremamente elevato. In realtà, la grande maggioranza della creatività presente in qualunque momento dato si colloca al livello creativo p e, come sottolinea la Boden, è assai raro che qualcosa rientri nella creatività h. In sostanza, tutti siamo creativi al livello p – gli esempi possono spaziare dallo scarabocchio tracciato su un tovagliolino di carta al bar alla battuta, e dal dipinto di uno splendido paesaggio alla composizione di una poesia. Oggi siamo riusciti ad addestrare macchine e a elaborare processi generativi che, per usare la terminologia della Boden, possiedono «la capacità di generare idee nuove e dotate di valore». Gli esseri umani hanno scelto di dare vita a strumenti creativi meccanici. La mia analisi si concentrerà quindi meno sul dibat53


tito relativo al problema filosofico dell’esistenza o meno della creatività nelle intelligenze artificiali, e più sulla valutazione dei relativi strumenti e risultati dei processi che caratterizzano attualmente l’elaborazione creativa. Al momento, l’arte delle intelligenze artificiali si colloca al livello creativo p, con l’aspirazione (nutrita da chi le utilizza) di raggiungere il livello h. Nondimeno, di norma giudichiamo le opere d’arte create dalle intelligenze artificiali in termini di creatività h. Siamo sommersi da opere d’arte di livello p, e di rado ci imbattiamo in un Matisse o in un Picasso. Dobbiamo guardarci dalla «fallacia sovrumana» evidenziata dal pioniere dell’intelligenza artificiale Seymour Papert – cioè dalla convinzione che l’intelligenza artificiale fallisca laddove non riesce a eguagliare immediatamente il meglio della creatività umana (Boden 2009). Nel discutere di intelligenza artificiale, arte e creatività, dunque, dobbiamo tenere ben presenti questi parametri di valutazione. Il grado di creatività dell’arte prodotta dalle intelligenze artificiali va valutato al livello creativo p. Il livello creativo h potrebbe eventualmente manifestarsi, ma andrebbe in ogni caso definito e dimostrato. La Boden differenzia inoltre tre tipologie o processi della creatività nella generazione di idee nuove – combinatorio, esplorativo e trasformativo – affermando che «tutti e tre possono essere modellati dall’intelligenza artificiale» (Boden 2009). La creatività combinatoria consiste nel combinare per associazione una serie di idee note, creando nuovi modelli di connessione. Pensiamo per esempio alle immagini poetiche o all’analogia nel campo della musica o delle arti visive. La creatività esplorativa ha luogo nell’ambito di un campo determinato (quale uno stile artistico o un sistema biologico; la Boden lo definisce «spazio concettuale») caratterizzato da norme e restrizioni. L’atto creativo esplora tale spazio andando alla ricerca di aree precedentemente ignote o aprendo nuovi percorsi attraverso di esso. La creatività trasformativa sviluppa quella esplorativa, e introduce mutamenti profondi alterando o eliminando una delle dimensioni fondamentali dello spazio creativo noto. Ciò consente la generazione di nuovi concetti che precedentemente non sarebbero stati pensabili (Boden 2009). Come riconosce l’autrice, la 54

creatività combinatoria sarebbe la più ardua per un’intelligenza artificiale, dal momento che fa forte affidamento su processi cerebrali umani – memoria, conoscenza culturale, esperienza personale e via dicendo – a cui i sistemi di intelligenza artificiale non possono accedere. Tuttavia, la prospettiva di insegnare a un’intelligenza artificiale lo spazio concettuale di un dato campo di conoscenze – per esempio lo stile della ritrattistica europea –, fornendole quindi istruzione di operare all’interno di tali confini, è del tutto realizzabile. Dal punto di vista della scienza dei computer, potrebbe essere possibile ricondurre tale prospettiva allo spazio vettoriale multidimensionale che racchiude i punti dati degli output di un sistema gan. All’interno di questo denso spazio vi è abbondante posto per “anomalie” o innovazioni, e quindi per il conseguimento della creatività. Meno verosimile è un processo trasformativo, semplicemente perché esso presuppone che una delle regole venga alterata o ignorata – un atto generalmente poco desiderabile nell’ambito della programmazione dei computer. Inoltre, la creatività trasformativa è in sé molto più complessa. Potrebbe peraltro essere incoraggiata modificando le gan in modo tale che producano risultati inattesi utilizzando metodi di qualunque genere. E per citare la Boden, «certamente un computer può fare soltanto ciò che il suo programma gli consente di fare. Ma se il programmatore potesse dirgli espressamente che cosa fare, non ci sarebbero problemi...» (Boden 2009). Nel caso delle arti visive, i risultati delle gan fanno riferimento agli input visivi del sistema in modo riconoscibile (un aspetto indispensabile per un’opera d’arte), ma manipolano altresì i dati visivi nell’ambito di un caleidoscopio di possibili varianti. Per la creazione di opere d’arte, l’addestramento non è restrittivo come quello inteso a produrre “un cane”, bensì mira a far sì che l’input venga ristrutturato in modo più profondo allo scopo di creare combinazioni inaspettate e creative. Gli esiti di tale processo sono in qualche misura imprevedibili: la gan riceve istruzioni di creare immagini che tuttavia non sono soggette a restrizioni quali quelle intese a creare oggetti o 55


temi specifici. Le gan trovano attualmente numerosi impieghi da parte di chi manipola immagini per fini artistici e non: gan stilistiche utilizzate per creare opere “nello stile” di un dato artista, gan in grado di ricavare da una singola fotografia un’animazione della persona ritratta con movimenti ed espressioni credibili, e perfino gan capaci di generare volti interamente nuovi di esseri umani inesistenti. Queste ultime applicazioni costituiscono perlopiù sviluppi delle sperimentazioni di alto livello nel campo del riconoscimento facciale, e non rientrano nel campo dell’arte. Per la maggior parte degli artisti che lavorano con l’intelligenza artificiale, le gan rappresentano uno strumento che permette di servirsi del loro database visivo selezionato per riutilizzare elementi visivi in modo pseudo-casuale. Dai risultati traspaiono naturalmente le scelte compiute da coloro che hanno compilato il database: se quest’ultimo viene costruito mediante ritratti o dipinti figurativi, i risultati si ricollegheranno alla figura umana, limitandosi a ridisporla in combinazioni inedite e in nuove strutture. Il grado relativo di interesse visivo (e di qualità) delle immagini così ottenute dipende in gran parte dalla selezione del database e dal livello di raffinatezza della gan utilizzata. È evidente come entrambi questi ambiti implichino un intenso lavoro creativo, che viene perlopiù svolto dagli esseri umani che utilizzano le gan. È dunque legittimo affermare che gli attuali artisti umani che usufruiscono delle gan sono artisti nel senso tradizionale che attribuiamo al termine. Nel laboratorio Rutgers a & ai, abbiamo modificato il processo delle gan in modo da ampliare la gamma dei risultati implementando una teoria della creatività proposta da Colin Martindale (Martindale 1990). Il sistema, denominato aican ( ai-Creative Adversarial Network o rete antagonista creativa di intelligenza artificiale), si ispira alla tesi di Martindale secondo cui il modello della creatività artistica è prevedibile (Elgammal et al. 2017). Si tratta di un’idea utile, poiché se la creatività segue un modello prevedibile, è possibile “mapparla” e quindi in ultima analisi trasformarla in un algoritmo. Il punto essenziale per lo sviluppo della creatività in qualsiasi 56

https://arxiv.org/pdf/1706.07068.pdf

Ahmed Elgammal, Bingchen Liu, Mohamed Elhoseiny, Marian Mazzone, can: Creative Adversarial Networks, Generating “Art” by Learning About Styles and Deviating from Style Norms, 2017.

sistema di intelligenza artificiale sta nel determinare una formula o ricetta che definisca una serie di passaggi che mettano in atto un processo creativo e diano vita a un prodotto creativo. La tesi di Martindale è che gli artisti assimilino le opere d’arte precedenti, si esercitino negli stili dominanti e quindi, in un dato momento, rompano con tali stili dando vita a nuove opere. Nella versione can, la macchina viene addestrata attraverso la tensione che si crea tra il compito di seguire gli esempi artistici a essa forniti (minimizzazione della deviazione rispetto alla distribuzione degli elementi artistici) e le penalità che la macchina subisce quando produce una versione di un’immagine utilizzata per l’addestramento che risulta troppo simile all’originale (massimizzazione dell’ambiguità stilistica). L’obiettivo è creare immagini simili – ma non esattamente identiche – a quelle usate per l’addestramento, evitando i risultati eccessivamente nuovi e quindi sgradevoli o irriconoscibili. L’impulso a raggiungere un equilibrio in questa tensione viene definito principio dello «sforzo minimo» nella teoria di Martindale, e costituisce un freno essenziale per il controllo della gamma (e della qualità) generativa delle immagini risultanti. L’algoritmo di una can contiene una formula matematica che regola questo freno. L’innovazione è incoraggiata, ma soltanto entro limiti controllati. Un altro contributo fornito dalla ricerca sulle can è stato quello di ampliare la gamma creativa dell’apprendimento automatico, riducendo in tal modo il controllo sull’insieme di dati. Abbiamo così sottoposto all’algoritmo 80.000 immagini che rappresentano cinque secoli di storia dell’arte occidentale, con l’idea di simulare le modalità con cui gli artisti fruiscono della storia dell’arte per mezzo di una selezione meno controllata di generi e stili. Il sistema di elaborazione delle gan è in grado di funzionare in modo parallelo alle scelte e alle associazioni di elementi visivi che caratterizzano le operazioni – sia deliberate sia casuali – della mente creativa umana? Si noti che ho utilizzato il termine “parallelo”. Psicologi, scienziati cognitivi, neuroscienziati e filosofi che studiano la creatività e il suo rapporto con il cervello non hanno ancora compreso in quale modo il cervello umano crei. 57


2. Unity Rising, Rutgers Art & AI Lab, 2018. Alluminio Dibond, 100 × 100 cm. Dalla prima esposizione di opere aican “Art of the Future, Now”, scope Miami Beach 2018.

58

3. Freya, Rutgers Art & AI Lab, 2018. Lino belga, 100 × 100 cm. Dalla prima esposizione di opere aican “Art of the Future, Now”, scope Miami Beach 2018.

59


4. Aurora Dunes, Rutgers Art & AI Lab, 2018. Alluminio Dibond, 100 × 100 cm. Dalla prima esposizione di opere aican “Art of the Future, Now”, scope Miami Beach 2018.

60

5. Divided Sunshine, Rutgers Art & AI Lab, 2018. Alluminio Dibond, 100 × 100 cm. Dalla prima esposizione di opere aican “Art of the Future, Now”, scope Miami Beach 2018.

61


6. Psychedelic Wisteria, Rutgers Art & AI Lab, 2018. Alluminio Dibond, 100 × 100 cm. Dalla prima esposizione di opere aican “Art of the Future, Now”, scope Miami Beach 2018.

62

7. Green Genesis, Rutgers Art & AI Lab, 2018 Alluminio Dibond, 100 × 100 cm. Dalla prima esposizione di opere aican “Art of the Future, Now”, scope Miami Beach 2018.

www.aican.io/virtual-gallery aican

virtual gallery.

63


Di conseguenza, è impossibile creare un’intelligenza artificiale che crei come il cervello umano – dato che non sappiamo come questo avvenga. Ciò che è possibile fare è modellare dei processi di apprendimento e valutare che cosa una macchina sia in grado di generare in base a tali condizioni; la questione, cioè, riguarda l’apprendimento automatico. Si tratta indubbiamente di un modello «a scatola nera», ma d’altronde anche il cervello umano è una scatola nera. Le gan svolgono all’interno della scatola nera (cervello) funzioni che non comprendiamo appieno, ma sono nondimeno in grado di generare prodotti che si possono definire opere d’arte. È possibile che le gan si prestino in modo particolare alla sperimentazione artistica in quanto i loro processi sono paralleli ad alcune operazioni compiute dalla mente umana. Un’utile analogia può essere tracciata con la modalità di apprendimento degli artisti – che imparano osservando numerose opere tratte dalla storia dell’arte, copiando e assemblando vari elementi tratti dalle stesse sino a padroneggiarne l’uso e infine sviluppando nuovi modelli di composizione visiva. Le gan vengono addestrati mediante database selezionati di opere d’arte figurativa, e ricevono quindi istruzione di generare nuove opere composte mediante frammenti ed elementi di questo materiale (training set) nell’ambito dello spazio concettuale (spazio vettoriale). Negli esseri umani, scelte e associazioni hanno luogo a livello sia visivo (attraverso la manipolazione degli elementi visivi in nuove combinazioni) sia concettuale (attraverso la scelta conscia o inconscia di elementi atti a creare significato). I sistemi di intelligenza artificiale attualmente impiegati nella produzione artistica operano nell’ambito della prima di queste fasi, creando cioè a livello visivo. Questi sistemi di intelligenza artificiale non compiono (né possono compiere) scelte concettuali simili a quelle di un artista. Come afferma la Boden, «... nessun sistema di intelligenza artificiale attuale può accedere al ricco e articolato campionario di concetti che qualsiasi essere umano adulto normale si è costruito nel corso della sua esistenza» (Boden 2009). Non esiste un metodo per insegnare alle gan la creazione di contenuti concettuali, poiché non esiste (per ora) alcuna formula 64

https://bit.ly/2O01Xfc

Marian Mazzone, Ahmed Elgammal, Art, Creativity, and the Potential of Artificial Intelligence, “Arts”, 2019.

algoritmica in grado di codificare una procedura che riproduca il processo con cui il cervello umano ricava e interpreta contenuti concettuali. L’intelligenza artificiale può misurarsi con i contenuti visivi poiché questi ultimi possono essere codificati in un linguaggio che la macchina è in grado di tradurre: immagini digitalizzate di opere d’arte umane. Elementi quali linea, texture, colore, bordi eccetera vengono espressi in forma di codice (numerico) che viene quindi elaborato dalla macchina. Sono già in atto esperimenti relativi al riconoscimento e alla riproduzione di oggetti nelle opere d’arte (per esempio A. Monroy et al. 2014), che tuttavia si trovano ancora in una fase iniziale. È verosimile immaginare che ben presto i sistemi di intelligenza artificiale saranno in grado di produrre elementi tematici standard quali paesaggi, ritratti, scene di genere e simili. Vi è però una differenza sostanziale: la macchina sarà, sì, in grado di generare un suo nuovo paesaggio riconoscibile come paesaggio, ma tale immagine non conterrà l’elaborazione di elementi naturali o l’insieme di contenuti che caratterizzano un paesaggio realizzato da un essere umano. In altre parole, non si tratterà di un paesaggio che la macchina ha sperimentato in natura. L’esperienza del primate bipede che cammina e vive in un ambiente integrerà sempre l’esperienza umana. Gli esseri umani possono senz’altro riconoscere la propria esperienza in un’immagine generata dal computer – ma ciò non significa che l’immagine contenga tale esperienza. Come ho accennato altrove (Mazzone ed Elgammal 2019), una differenza fondamentale tra immagini generate da esseri umani e immagini generate da macchine consiste nell’origine dello stimolo visivo. Per gli esseri umani, il punto di riferimento è la natura: i nostri occhi vedono costantemente all’interno di un mondo naturale in cui ci muoviamo e viviamo, e che è destinato a rimanere l’origine delle arti visive a prescindere dall’eventuale distanza tra tale esperienza e il prodotto finale. Per una macchina non è mai così, poiché essa non è un mammifero dotato di un corpo all’interno del mondo della natura. La macchina riceve dati numerici relativi a forme, colori, texture e linee di dipinti creati da esseri umani; viene addestrata 65


riguardo alla vista umana a un livello astratto – cioè mediante modelli numerici assai distanti dal mondo della natura. Come mi ha fatto notare il mio collega Kurmo Konsa (Konsa 2019), dal momento che il punto di riferimento della macchina non è la natura, è possibile che sia invece la mente umana. Così come teorizziamo un cervello umano esteso all’interno di un ambiente complesso (Clark 1998), potremmo fare lo stesso anche in relazione all’intelligenza artificiale, con il cervello umano quale ambiente in cui ha luogo l’estensione dell’intelligenza artificiale. In sostanza, stiamo insegnando alla macchina – in un linguaggio astratto e numerico – il modo di elaborare la natura impiegato dal nostro cervello, così come appare codificato nei nostri dipinti. Per questo, ciò che la macchina produce risulta spesso riconoscibile ai nostri occhi, anche laddove l’intelligenza artificiale scombina o altera il modo in cui noi ordineremmo gli elementi visivi. Tutto ciò è favorito dalla propensione di noi umani a individuare e cogliere immagini riconoscibili ogni qual volta veniamo invitati a guardare qualcosa. Ciò che ancora manca all’intelligenza artificiale è una formula o un’equazione che consenta di comporre un algoritmo per la creatività concettuale a un livello indipendente. Non deve sorprendere, data la straordinaria complessità del problema. Dovremo partire da un metodo semplificato e astratto di creazione di un algoritmo generativo che si basi meno sui prodotti artistici umani esistenti e più sulla scoperta di modelli numerici di generazione. Sarebbe forse possibile ricavare tali modelli dopo una fase di combinazione ed elaborazione di vasti database di esempi tratti dalle arti, con un passaggio a un livello più astratto che si allontani dai dettagli per concentrarsi su aspetti più generali delle funzioni cerebrali attraverso l’elaborazione di una mole di dati più ampia. Altra questione è se i sistemi di intelligenza artificiale siano in grado di apprendere e sviluppare intenzioni concettuali proprie – un interrogativo a cui per ora non è possibile dare risposta, dato lo stadio ancora relativamente primitivo dello sviluppo delle intelligenze artificiali. Tuttavia ritengo che i sistemi di intelligenza artificiale siano effettivamente in grado di creare opere d’arte che meritino la 66

p. 166

1

https://bit.ly/31TjlKG

Su GitHub, la più grande piattaforma e luogo di condivisione di codice aperto al mondo, vedi anche Microsoft e Github, come cambia il mondo dell’open source, Antonio Dini, “Wired”, 2018.

nostra attenzione. Queste opere vengono generate attraverso vari gradi di interrelazione tra essere umano e macchina: a volte la macchina lavora in modo relativamente indipendente (aican), altre volte agisce come una sorta di partner dell’essere umano – ma nella maggior parte dei casi funziona come un processo utilizzato dall’artista umano in parallelo con i suoi progetti creativi. La Famille de Belamy del gruppo Obvious, da cui è tratta l’opera Edmond de Belamy venduta all’asta da Christie’s, è stato creato a partire da un piccolo insieme di dati fortemente selezionato composto da 14.000 immagini. L’intento degli artisti era generare ritratti che ricordassero la ritrattistica europea di epoca rinascimentale e barocca – o quantomeno immagino che l’intento fosse questo, a giudicare dai risultati visivi ottenuti. La gan di GitHub leggermente modificata e usata da Obvious aveva il compito di fondere questo tipo di input producendo immagini che assomigliassero a ritratti – ma di persone inesistenti. Riguardo a tali operazioni va ricordato anche che gli artisti operano una scelta all’interno di un insieme più ampio di immagini generate, in funzione dei propri criteri e obiettivi. L’operazione compiuta da Obvious rappresenta un impiego controllato e limitato delle gan come strumenti per produrre risultati mirati. A tale livello, è opportuno ravvisare nelle gan uno strumento, più che un sistema creativo o anche soltanto generativo: uno strumento adattabile, applicato a circostanze specifiche e utilizzato per ottenere risultati specifici. In questa modalità di lavoro, la pre-selezione e la selezione successiva delle immagini su cui la gan viene addestrata avvengono in modo premeditato, e gli obiettivi che gli artisti si prefiggono in relazione ai risultati finali dettano il modo in cui le immagini vengono selezionate prima di essere esposte. Un altro livello di applicazione è quello che integra nel sistema algoritmico una maggiore varietà di esempi usati per l’addestramento e introduce delle opzioni di imprevedibilità (casualità) nel processo generativo, servendosi inoltre di uno spazio vettoriale multidimensionale più vasto in cui far operare il sistema. Le opere di Mario Klingemann, come Neural Glitch (2018), sono un esempio di lavori che utilizzano un codice più raffinato 67


e dotato di maggiori potenzialità in termini di creatività. Klingemann si sta attivamente interessando ai processi algoritmici delle gan allo scopo di creare nuove opere. In Neural Glitch, l’artista ha modificato in modo casuale i riferimenti utilizzati per l’addestramento nell’ambito dell’architettura neurale delle gan, dando vita a texture e informazioni semantiche inedite con cui la macchina doveva misurarsi al momento di generare immagini (quasimondo.com). Inoltre, ha ridotto la specificità del training set: invece di ritratti pittorici o fotografici, la macchina riceve soltanto informazioni di marcatura facciale. L’artista addestra inoltre le sue gan per fini diversi per poi ricombinarle in modalità alternative, dando vita a una gerarchia più complessa di reti neurali che producono risultati meno controllabili o prevedibili. Tutte queste tecniche costituiscono modalità atte a introdurre informazioni casuali in un sistema addestrato, allo sco- https://bit.ly/2V7EexT po di rendere possibili cambiamenti inattesi – il che riproduce Neural Glitch, le operazioni casuali che caratterizzano la creatività umana e Mario Klingemann incoraggia l’intelligenza artificiale a creare in modo esplorativo 2018. o perfino trasformativo. I modelli di apprendimento e di applicazione delle informazioni vengono modificati. Naturalmente, il caso non produce sempre risultati gradevoli o interessanti per l’occhio, ma questo limite vale sia per le macchine sia per gli esseri umani. Inoltre, va tenuto presente che, quando gli artisti utilizzano le gan, la misura in cui modificano o alterano le reti costituisce un parametro importante per la valutazione della creatività e dell’originalità da parte degli artisti – e non soltanto per quella dei risultati ottenuti. In futuro potremmo considerare questo scenario come una tipologia di cognizione estesa (Clark 1998), concependo la creatività come una cognizione che viene distribuita tra l’artista umano e l’intelligenza artificiale. Il linguaggio condiviso del processo cognitivo esteso (Clark, per esempio, individua nel linguaggio un elemento cruciale per la cognizione umana) sarebbe il codice di programmazione – un linguaggio numerico. Potrebbe essere necessario che tutti gli artisti “esplicitino” il loro codice, cioè chiariscano quali algoritmi hanno utilizzato, che cosa hanno modificato o lasciato invariato e come hanno applicato gli algoritmi in que68

stione. Inoltre: quale database è stato utilizzato, e in che modo è stato selezionato e reso accessibile? Qual è stato il ruolo degli esseri umani in relazione ai processi delle macchine? Pubblico e critica necessiteranno di queste informazioni per valutare la creatività. Margaret Boden ha elaborato un test di Turing per valutare le opere d’arte create mediante il computer, che potrebbe rappresentare per noi un utile strumento di partenza (Boden 2010). Immaginando che un essere umano interagisca con un’opera d’arte per un tempo limitato e venga quindi invitato a esporre la propria opinione, secondo la Boden l’opera, per superare il test di Turing, dovrebbe avere le seguenti caratteristiche: 1. essere indistinguibile da un’opera prodotta da un essere umano, e/o 2. essere considerata dotata di un valore estetico pari a quello di un’opera prodotta da un essere umano. L’opera deve inoltre essere stata «generata da processi del computer, in una condizione di totale o elevata indipendenza dall’intervento diretto di esseri umani»; l’uso di un software come strumento non è quindi sufficiente. Minore è il coinvolgimento dell’essere umano, maggiore sarà la facilità con cui l’opera supererà la prova. Dobbiamo inoltre guardarci dalla «fallacia sovrumana» e tenere presente che verosimilmente le opere d’arte saranno perlopiù mediocri, e non eccezionali. È ciò che fa sostanzialmente Rutgers Lab nel suo lavoro con il sistema aican, sondando gli spettatori umani in relazione allo studio degli originali e successivamente nelle aree espositive allo scopo di determinare se siano in grado di distinguere le opere dalle creazioni umane, e se le trovino gradevoli o meno (Elgammal et al. 2017). Quali sono dunque gli elementi essenziali per l’analisi e la fruizione di queste opere? In che modo applicare categorie come qualità, estetica e piacevolezza all’arte generata con l’uso delle intelligenze artificiali? Possiamo prendere le mosse da un’analisi del pubblico che verosimilmente entrerà in contatto con questo tipo di espressione artistica, mettendo in luce le sue esperienze e aspettative in relazione all’arte. Sin dai contributi 69


di Duchamp sappiamo che il riconoscimento di un’opera come arte da parte del pubblico e delle istituzioni si basa su definizioni; in altre parole, il sistema di accettazione definisce che cosa sia arte e che cosa non lo sia. Così, sotto un certo aspetto possiamo affermare che l’arte delle intelligenze artificiali è già arte, poiché viene esposta in contesti istituzionali che le conferiscono legittimità, e che il pubblico umano la accetta come arte. Più complessa sembra essere la questione della qualità delle opere d’arte delle intelligenze artificiali, così come l’interrogativo che riguarda chi sia esattamente l’artista o l’autore dell’opera. In qualche misura i due elementi sono correlati: secondo molti critici, la qualità dell’opera (o la sua assenza) rispecchia le qualità e i limiti del suo creatore umano. Ma in questa sede non mi interessa la qualità dell’autore; altrove (Mazzone ed Elgammal 2019) ho sostenuto, così come molti altri, che se si fa riferimento al concetto – comune nel Romanticismo – dell’artista come unico creatore indotto a realizzare opere d’arte dalle emozioni, dalla psicologia e dalle esperienze personali, allora l’arte generata dalle intelligenze artificiali non potrà mai superare l’esame. Non sarà mai in grado di soddisfare tali requisiti. Vorrei soltanto aggiungere qui che nel mondo esiste già una notevole quantità di arte che non soddisfa questi parametri; la definizione di cui sopra poggia con forza sul concetto del genio unico dell’autore. È inoltre opportuno ricordare l’interrogativo fondamentale sollevato da Linda Nochlin («perché non ci sono state grandi artiste donne?»), dal momento che la risposta da lei proposta risulta utile, avendo molto a che vedere con la definizione di “artista” che si sceglie di applicare. Rispetto alla critica, il pubblico è meno legato all’aspettativa del carattere di unicità dell’autore, anche nel campo della creazione di opere d’arte. Quando vengono esposte opere create da aican, una domanda frequente è «chi è l’artista?», ma la risposta – e cioè che le opere sono state create da un’intelligenza artificiale – non induce mai gli spettatori a negare loro la qualifica di arte. Ritengo che il pubblico contemporaneo abbia con le immagini una relazione mutata, che spiega le sue reazioni positive nei riguardi dell’arte generata dalle intelligenze artificiali. A partire dalla metà del 70

8. Faceless Portrait #1, 2019, stampa su tela, 147 × 147 cm, esposta a New York nel 2019 all'interno della mostra aican + Ahmed Elgammal Faceless Portraits Transcending in Time, presso la hg Contemporary Art Gallery.

Faceless Portraits transcending in time virtual tour. https://eazel.net/exhibitions/174

71


Novecento, il contatto del pubblico con l’arte è mediato da immagini bidimensionali riprodotte su libri, diapositive, schermi cinematografici e televisivi. Per diversi decenni si è trattato di immagini fotografiche, oggi di immagini digitali. L’incontro con la “vera” opera d’arte, nel contesto spaziale e temporale della galleria o del museo, è relativamente raro. Per la maggior parte delle persone e nella maggior parte dei casi, l’arte è un’immagine composta da pixel visibile su una superficie stampata o su uno schermo. E per quanto il contatto con l’opera “vera” sia particolarmente ricco, semplicemente le persone non sperimentano questo tipo di esperienza delle arti visive. Come storica dell’arte posso rammaricarmi di questa realtà, ma ne sono consapevole e la accetto. Di conseguenza, per lo spettatore contemporaneo medio, l’arte generata dalle intelligenze artificiali, visualizzata su uno schermo o stampata su una superficie, ha esattamente il formato con cui lo spettatore ha familiarità e consuetudine – e per questo non la considera un’esperienza artistica inferiore o deteriore. Questi sono elementi cruciali: la legittimazione non è legata all’aspettativa dell’artista/autore unico, e lo spettatore non percepisce l’arte generata dalle intelligenze artificiali come un’esperienza di livello inferiore. La maggioranza dei critici e degli storici dell’arte non si colloca al momento nella stessa posizione dello spettatore comune in termini di abitudini di fruizione e aspettative. I titoli negativi sull’arte generata dalle intelligenze artificiali e la valutazione negativa delle opere in base a parametri estetici sono comuni nella maggior parte dei resoconti dei media (così come i consueti borbottii sui prezzi dell’arte contemporanea); e a mio avviso ciò è perlopiù dovuto ai criteri artistici tradizionali che guidano i critici e i giornalisti che si occupano di arte, e non rispecchia in modo fedele le reazioni del pubblico alle opere. La diffusa riproduzione delle opere d’arte nei mass media ha modificato la relazione tra opere e pubblico anche sotto altri aspetti. Siamo di fronte a un pubblico abituato alla ripetizione o, per utilizzare i termini delle scienze del computer, alla reiterazione e alla parametrizzazione. Elementi essenziali quali colore, texture e qualità del tratto sono variabili, in quanto i 72

processi delle macchine li gestiscono in modo diverso rispetto alla mano umana. Per valutare l’arte creata dalle intelligenze artificiali dovremo elaborare differenti criteri estetici, che non si basino su quelli pensati per le opere realizzate mediante grafite o colori a olio. Non intendo affermare che tali criteri siano destinati a scomparire o siano obsoleti, ma che sarà necessario predisporre per l’arte delle intelligenze artificiali nuovi criteri meno restrittivi di quelli basati su strumenti diversi. Per ritornare al test di Turing elaborato da Margaret Boden per l’arte creata con i computer, intendo concentrarmi ora sul secondo requisito. Il primo requisito ha infatti una natura implicitamente ingannevole e superflua: non vi è alcuna necessità di indurre con l’inganno le persone a credere che un’opera d’arte sia stata realizzata interamente da un essere umano quando non è vero. L’arte generata dalle intelligenze artificiali non deve proporsi obiettivi impossibili; non è umana in termini di esperienze o di intenzioni. Sarebbe una partita che l’arte generata dalle intelligenze artificiali non potrebbe mai vincere: l’inganno verrebbe scoperto, e in ogni caso l’obiettivo è in sé privo di senso. Il secondo requisito, per contro, delinea un obiettivo positivo: gli spettatori riconosceranno o meno all’opera lo stesso valore estetico che attribuirebbero a qualsiasi altra? Data la natura mutevole del pubblico dell’arte e degli strumenti creativi delle gan nel contesto artistico attuale, possiamo affermare che questo stia già avvenendo. Il futuro sarà una questione di sviluppo, rifinitura e costante esplorazione e trasformazione. Come fruitori umani dell’arte, siamo noi a trovarci in una posizione di potere: la scelta di apprezzare o respingere l’arte generata dalle intelligenze artificiale continuerà a essere esclusivamente nostra.

73


Mario Klingemann

Memories of Passersby i , 2018

«Quando ascoltate qualcuno suonare il pianoforte vi chiedereste mai se l’artista è il pianoforte? No. E qui è la stessa cosa. Solo perché il meccanismo è più complicato, non vuol dire che i ruoli cambino.»

1. Memories of Passersby i - Version Companion, Mario Klingemann 2018. In asta da Sotheby’s Londra a marzo 2019.

74

“The Hypnotic Allure of the AI Art Generator” filmato in cui Klingemann, pioniere delle reti neurali nell’arte, racconta l’esperienza e la genesi di Memories of Passersby i. https://bit.ly/2NU4urr

Memories of Passersby i è un’opera pionieristica nel campo dell’intelligenza artificiale. Completamente autonoma, utilizza un complesso sistema di reti neurali per generare un flusso infinito di ritratti – inquietanti visioni di volti maschili e femminili create da una macchina. L’opera viene presentata sotto forma di installazione: la macchina a intelligenza artificiale è racchiusa in un involucro in legno di castagno realizzato su misura, collegato a due schermi provvisti di cornici. Diversamente dalle prime installazioni di arte generativa, Memories of Passersby i non contiene alcun database. Si tratta di un cervello a intelligenza artificiale, elaborato e addestrato da Mario Klingemann, che crea ritratti assolutamente inediti, pixel dopo pixel, in tempo reale. I risultati visualizzati sullo schermo non sono combinazioni casuali o programmate di immagini esistenti, bensì opere d’arte inedite, generate dall’intelligenza artificiale. Il flusso delle immagini presentate non segue una coreografia prestabilita, ma costituisce l’esito dell’interpretazione che l’intelligenza artificiale dà del suo stesso output; la natura complessa di questo ciclo di interscambio fa sì che le immagini non si ripetano mai. 75


2. Memories of Passersby i - Version Companion, Mario Klingemann 2018. gan multiple, due schermi, console realizzata a mano in legno di castagno che ospita il cervello dell’intelligenza artificiale e ulteriore hardware. Console: 70 × 60 × 40 cm. Ogni schermo: 82,9 × 145 × 3,8 cm (cornice su misura). Lanciata nel 2018, quest’opera è un’edizione di 3, più 2ap.

77


Memories of Passersby i contiene tutti gli algoritmi e le gan necessarie alla produzione di una sequenza infinita di immagini durante tutto il suo funzionamento. Sotto questo aspetto, Memories of Passersby i segna un significativo passo avanti nel campo dell’arte delle intelligenze artificiali, che sta venendo rapidamente alla ribalta. Sino a oggi, i collezionisti potevano soltanto acquistare prodotti di reti neurali selezionati da esseri umani; Memories of Passersby i costituisce invece un soggetto creativo indipendente. Ogni edizione è destinata a produrre un numero infinito di ritratti secondo modalità inedite – ritratti che per questa ragione possono essere considerati unici.

https://bit.ly/3iOfQeX

Artist Mario Klingemann on Artificial Intelligence, Technology and our Future, intervista con Martin Dean, Sotheby’s.

Il ritratto incontra la bellezza convulsiva Per realizzare Memories of Passersby i, Klingemann ha addestrato il suo modello di intelligenza artificiale mediante migliaia di ritratti di epoca compresa tra il Seicento e l’Ottocento. Ha creato un’applicazione simile a Tinder per accelerare il processo di apprendimento e insegnare alla macchina le proprie preferenze estetiche, che mostrano l’influenza di figure del surrealismo come Max Ernst. Memories of Passersby i presenta dunque inquietanti interpretazioni del volto umano – esempi generati dall’intelligenza artificiale di quella che André Breton definì «bellezza convulsiva». Talvolta le immagini si fondono in disposizioni astratte di pixel, prodotte dallo sforzo della macchina inteso a creare un nuovo ritratto. Allo spettatore, Memories of Passersby i offre un’esperienza ipnotica, un’occasione di osservare un’intelligenza artificiale mentre «pensa» in tempo reale e di ammirare ritratti assolutamente unici, che non vengono registrati e non si ripetono mai. 3. Memories of Passersby i - Version Solitaire, Mario Klingemann 2018. Gan multiple, schermo singolo, console realizzata a mano in legno di castagno che ospita il cervello dell’intelligenza artificiale e ulteriore hardware. Console: 70 × 60 × 40 cm. Schermo 55 pollici (2160 × 3840) con cornice su misura: 78,5 × 130,5 × 7,5 cm. Lanciata nel 2018, quest’opera è una edizione di 6, più 2ap.

78

79


4. Memories of Passersby i - Version Companion, Mario Klingemann 2018.

80

81


5. Memories of Passersby i - Version Solitaire, Mario Klingemann 2018. 6. A fronte: Memories of Passersby i - Version Solitaire, Mario Klingemann 2018.

82


7-10. Alcuni frames da Memories of Passersby i, Mario Klingemann 2018.

84

85


11-14. Alcuni frames da Memories of Passersby i, Mario Klingemann 2018.

86

87


Imposture Series, 2017

15. Morgan le Fay - Imposture Series, Mario Klingemann 2017. Stampa giclée con pigmenti minerali di lunga durata su carta di cotone «Hahnemühle Museum Etching» 350 g.

88

Imposture Series è una raccolta di sei stampe del 2017 tra le quali The Butcher’s Son, premiata nel 2018 con il Lumen Prize, il premio internazionale dedicato all'arte creata con la tecnologia. La serie rispecchia il caratteristico interesse di Klingemann per l’uso di modelli di intelligenza artificiale allo scopo di sorprendere lo spettatore con i loro prodotti visuali. Per creare queste immagini, l’artista si è concentrato sul corpo umano, addestrando i suoi modelli di intelligenza artificiale a esplorarne le posture e a trasformare figure stilizzate in dipinti, sulla base dell’analisi di immagini tratte da Internet. Ogni immagine di Imposture Series è stata interamente generata da una macchina e «dipinta» da una rete antagonista generativa. La rete arricchisce di nuove informazioni contenuti a bassa definizione, servendosi di un procedimento denominato «transhancement»: l’immagine viene completata attraverso l’applicazione di una texture per la pelle, dei capelli o di altre forme composte da pixel. Il risultato è pittorico ed etereo – la figura umana così come la vede una rete neurale. Per Mario Klingemann, la presenza degli artifacts – le anomalie visive presenti in queste immagini generate dal computer – è particolarmente significativa. L’artista spiega: «Con la pellicola 89


fotografica c’è la granulosità; nei video compaiono le texture tipiche del formato jpg. Ora abbiamo le reti neurali, che producono queste complesse imperfezioni. Ho scoperto che mi piacciono. In questa serie ho cercato di appropriarmi di queste imperfezioni». Ciascuna delle sei opere è stata selezionata dall’artista stesso tra oltre 50.000 immagini create dal suo modello Imposture Series. Con la loro presenza onirica, le loro figure ricche di texture e le loro anomalie visive, le stampe di Imposture Series rappresentano una tappa importante del percorso artistico di Klingemann e una suggestiva testimonianza di ciò che i modelli di intelligenza artificiale erano in grado di realizzare già nel 2017. The Butcher’s Son (già esposta alla mostra “Automat und Mensch”, Kate Vass Galerie, Zurigo) Do Not Kill the Messenger (già esposta alla mostra “Automat und Mensch”, Kate Vass Galerie, Zurigo) Morgan le Fay (già esposta alla Colección Solo, Madrid) Going to Standby (già esposta presso il Founders Forum, Londra) Transcubus Cobalamime

16. The Butcher’s Son - Imposture Series, Mario Klingemann 2017, Lumen Prize Gold Award 2018. Stampa giclée con pigmenti minerali di lunga durata su carta di cotone «Hahnemühle Museum Etching»» 350 g.

90

This nude portrait was generated by algorithms, Kelsey Campbell-Dollaghan, “FastCompany”, 2018. https://bit.ly/38E0YLg

91


17. Do Not Kill the Messenger - Imposture Series, Mario Klingemann 2017. Stampa giclée con pigmenti minerali di lunga durata su carta di cotone «Hahnemühle Museum Etching» 350 g.

92

18. Going to Standby - Imposture Series, Mario Klingemann 2017. Stampa giclée con pigmenti minerali di lunga durata su carta di cotone «Hahnemühle Museum Etching» 350 g.

93


19. Transcubus - Imposture Series, Mario Klingemann 2017. Stampa giclée con pigmenti minerali di lunga durata su carta di cotone «Hahnemühle Museum Etching» 350 g.

94

20. Cobalamime - Imposture Series, Mario Klingemann 2017. Stampa giclée con pigmenti minerali di lunga durata su carta di cotone «Hahnemühle Museum Etching» 350 g.

95


Uncanny Mirror, 2018

«Quando non c’è nessun volto davanti, la macchina continua a imparare e nello stesso tempo sogna, si vedono così delle animazioni fluide in cui solo occasionalmente compaiono dei volti.»

21. Uncanny Mirror, Mario Klingemann 2018. In mostra a “Entangled Realities - Living with Artificial Intelligence”, HeK (Haus der elektronischen Künste) Basel nel 2019. La prima esposizione è del 2018 alla Seoul Mediacity Biennale, committente dell’opera.

96

Video in cui Klingemann presenta Uncanny Mirror e ci accompagna nella mostra alla HeK Basel https://vimeo.com/400894320

Quella di riconoscere se stessi in uno specchio è una capacità tipicamente umana, che ci differenzia dalla maggior parte delle altre specie. Già a circa venti mesi di vita siamo consapevoli della nostra immagine – in parole povere, sappiamo che aspetto abbiamo. Tale certezza viene messa in discussione da Uncanny Mirror, di Mario Klingemann. Servendosi dell’intelligenza artificiale, questa installazione interattiva produce ritratti degli spettatori in tempo reale. Il sistema analizza i parametri biometrici facciali e informazioni relative alla postura e ai movimenti delle mani, creando quindi un’immagine pittorica basata su tutte le immagini precedentemente visualizzate dal computer. Il risultato rispecchia il modo in cui la macchina vede il proprio osservatore. Per Klingemann, la cui arte esplora sovente la figura umana, il pubblico costituisce «un’interessante banca dati», i cui input implicano un margine di rischio e di imprevedibilità. La sua installazione apprende costantemente, assimilando i dati di tutti coloro che guardano all’interno di questo inedito specchio. Ogni nuovo ritratto attinge alle conoscenze accumulate dalla macchina; ogni volto prodotto dal computer contiene qualcosa dei volti precedenti. Abbiamo visto migliaia di volte la nostra immagine riflessa – ma l’opera di Klingemann ci offre una prospettiva del tutto nuova. Saremo in grado di riconoscerci in questo “specchio perturbante”? 97


22-23. Uncanny Mirror, Mario Klingemann 2018. Hek Basel 2019.

98

99


24-25. Uncanny Mirror, Mario Klingemann 2018. Hek Basel 2019.

100

101


Hyperdimensional Attractions, 2019

26. Sirius A - Hyperdimensional Attractions 2019. Colección solo, Madrid, Uno degli 8 video della serie. Biggan ai video, durata: 1 ora e 30 minuti.

102

Estratto di 2,45 minuti del video Sirius A. https://bit.ly/3i4PTXZ

Le creazioni di Mario Klingemann sono caratterizzate dal desiderio di esplorare incessantemente territori sconosciuti, sul piano della tecnologia come su quello visivo. In Hyperdimensional Attractions, Klingemann ha sfruttato al massimo il più potente strumento attualmente disponibile, Biggan, e ne ha esplorato il contesto latente, un caleidoscopio di entità ibride e immagini imprevedibili. Sviluppata con il sostegno di Google, la versione più ampia di questa gigantesca rete antagonista generativa contiene ben 355,7 milioni di parametri – quattro volte più dei modelli precedenti. Come spiega Klingemann, «Questo modello costituisce quasi un universo a sé. Le sue dimensioni sono enormi e in un certo senso contiene in sé il mondo intero. Animali, oggetti, natura, dispositivi... lì dentro c’è tutto». 103


Un universo virtuale ricco di promesse visive «In Biggan non esistono confini: tutto è interconnesso», spiega Mario Klingemann. «Non vi sono differenze tra un cane, un uccello e una qualunque figura astratta. Tutto si inserisce nello stesso flusso di continuità ed è composto dalle stesse parti». Questo universo virtuale è fluido e immenso. Come un naturalista ottocentesco, Klingemann parte per per un viaggio di scoperta condiviso con gli spettatori attraverso Hyperdimensional Attractions. «Alcune texture appaiono familiari, eppure le immagini non corrispondono. È questo l’ambito in cui amo muovermi. Immaginate di avere a disposizione questo universo così ricco di pro- https://bit.ly/31fzpq2 The 1000 ImageNet Categories messe. Potreste scoprire qualcosa di nuovo».

inside of Biggan «Una mappa visuale delle diverse attrazioni che si possono trovare Il problema dei tre corpi applicato a 21 corpi versione pre-allenata della Nell’universo fisico, la gravità solare mantiene in orbita il no- nella Biggan. Da usare come road map stro pianeta durante la sua rotazione, e la gravità terrestre man- per scoprire gli scenari interessanti, e tiene a sua volta in orbita la luna. Su questi movimenti si è basato non, in questo vasto spazio latente». M.K.

lo studio di quello che in fisica e in meccanica classica è detto il «problema dei tre corpi» – che si applica a ogni calcolo relativo ai movimenti di tre particelle. Che cosa avviene all’interno dell’immensità della Biggan? Qui non esiste un corpo centrale: le orbite sono quindi caotiche e imprevedibili. Spiega Klingemann: «È come il problema dei tre corpi – ma in questo caso i corpi coinvolti sono ventuno, e il tutto avviene in 1128 dimensioni invece che in tre».

«Il mio ruolo in questa serie di otto video è fare da guida, stabilire le condizioni di partenza – i “corpi celesti” del problema dei tre corpi – per poi mettere in movimento il sistema. Il risultato è un ipnotico viaggio visivo costituito da tre immagini a schermo in continuo movimento. Non vi sono passaggi bruschi: ogni cosa può trasformarsi in qualsiasi altra». Otto creazioni ipnotiche selezionate una per una Hyperdimensional Attractions è l’esito di un minuzioso processo di selezione che vede Klingemann in veste di decisore e di curatore. «Ho scelto questi otto video, ma in realtà ne ho dovuti realizzare a centinaia. Ho selezionato quelli i cui risultati mi apparivano più soddisfacenti, quelli che mostravano le transizioni giuste e in cui le immagini non si perdevano in territori ambigui che non mi sembravano in tema». Hyperdimensional Attractions: Bestiary, che fa parte della raccolta permanente di Colección Solo (Madrid), esplora immagini ibride di vegetali e animali. Hyperimensional Attractions: Sirius a, invece, accompagna gli spettatori in territori bizzarri in cui il miglior amico dell’uomo compare in forme inedite e curiose. Questi viaggi visivi hanno un carattere musicale, un ritmo graduale e cangiante che contrasta con la frenesia della nostra vita quotidiana. Ci invitano a lasciarci irretire, a essere testimoni di un mondo interamente nuovo in continua evoluzione.

Un viaggio guidato in territori inesplorati Nell’universo iperdimensionale della Biggan, ogni coordinata rappresenta un’immagine. Alcune hanno un’aria familiare – un cane, un fungo – ma altre sono forme affascinanti situate negli spazi interstiziali, nei mondi non fisici in cui concetti quali “cane” e “fungo” non hanno alcun significato. Si tratta di esseri inesistenti, di prodotti dell’intelligenza artificiale rivelati da Klingemann.

104

105


27-28. Bestiary - Hyperdimensional Attractions, 2019. Colleciรณn solo, Madrid. Uno degli 8 video della serie. Biggan AI video, durata 1 ora e 30 minuti.

106

107


29-30. Zero Viscosity - Hyperdimensional Attractions, 2019. Colleciรณn solo, Madrid. Uno degli 8 video della serie. Biggan AI video, durata 1 ora e 30 minuti.

108

109


Set di dati e decadenza: Fall of the House of Usher Anna Ridler

1. Fall of the House of Usher, Anna Ridler, 2017, film di animazione di 12 minuti. Primo fotogramma.

Film https://vimeo.com/217670143

L’intelligenza artificiale viene sempre più utilizzata in contesti creativi sia dagli artisti sia dagli scienziati, e questo ha dato vita a dibattiti e discussioni sulla possibilità o meno, per una macchina o un algoritmo, di creare «vera» arte. Un algoritmo addestratosi su migliaia di opere di grandi maestri è in grado di produrre opere che vengono considerate «migliori» di quelle prodotte da esseri umani1; un braccio robotico è in grado di dipingere ciò che vede dinanzi a sé2. Simili progetti vengono presentati come artistici, ma questo tipo di attività si è in gran parte concentrata sulla valutazione e sulla definizione dei risultati come «arte» in funzione dell’impatto che determinati parametri visivi hanno sullo spettatore (ad esempio, «assomiglia a un’opera d’arte?») – approccio che ignora una considerazione fondamentale per l’artista nel realizzare un’opera, e cioè l’impatto dei materiali utilizzati. Quando si lavora con l’intelligenza artificiale vi sono due materiali principali: i dati o training set usati e l’algoritmo applicato per creare l’intelligenza artificiale. Gli algoritmi che utilizzo, e che mi interessano particolarmente, sono quelli che producono gan. Una gan è una forma di apprendimento automatico non supervisionato, che nel mondo dell’apprendimento automatico è considerata noto111


riamente instabile e non viene adeguatamente compresa. Si tratta essenzialmente di un processo basato su due intelligenze che «danzano» insieme, dalla cui dinamica emergono risultati imprevedibili e non quantificabili che producono immagini. Per creare una gan, una rete di intelligenza artificiale viene addestrata su una serie di immagini (nota come training set) che essa utilizza per creare una versione realistica di un’immagine che potrebbe potenzialmente provenire dal training set in questione. La seconda intelligenza artificiale esamina le immagini create dalla prima e stabilisce se siano vere o false, autentiche o contraffatte. In funzione della capacità della seconda rete di individuare le immagini da respingere, la prima intelligenza artificiale apprende sempre meglio a simulare immagini fino a quando «le contraffazioni risultano indistinguibili dalle immagini autentiche»3; ciò avviene nel corso di numerosi cicli di apprendimento o “epoche”. L’uso del termine «contraffazione» è interessante, in quanto suggerisce una mancanza di autenticità o una forma deteriore di immagine. Ma le immagini prodotte non sono semplici copie di quelle contenute nel training set, bensì immagini del tutto nuove create sulla base della conoscenza di ciò che l’intelligenza artificiale ha visto. I training set o le immagini inviate alle intelligenze artificiali come input forniscono tale conoscenza e sono fondamentali per la produzione delle immagini finali. Gli insiemi di dati necessari per creare i training set hanno generalmente dimensioni molto elevate – migliaia e talvolta milioni di immagini e input – e sono spesso costituiti da materiale proprietario. Se gli algoritmi per l’apprendimento automatico vengono spesso messi a disposizione come materiale open-source, anche da parte di grandi imprese tecnologiche, non è nemmeno molto difficile reperire gli insiemi di dati necessari al loro funzionamento. La maggior parte dei training set facilmente accessibili vengono compilati da ricercatori, spesso per mezzo di portali di crowdsourcing quali Mechanical Turk (la manodopera nascosta e le relazioni di potere a essa correlati sono di rado resi espliciti), mediante varie tecnologie. Dal momento che tale processo coinvolge sempre persone in rapporto al materiale di partenza o alla sua elaborazione, esso incorpora inevitabilmente atteggiamenti culturali o sociali – il cosiddetto dataset bias o «parzialità degli insiemi di 112

2. Esempi di immagini da epoche iniziali (non chiare) e da epoche posteriori (migliori) da Fall of the House of Usher.

https://vimeo.com/216284286

epochs1_70

dati». Per esempio ImageNet (un database canonico ampiamente diffuso, che contiene oltre 14 milioni di immagini) utilizza un concetto di “bellezza” estremamente ristretto e convenzionale – bianco, occidentale, giovane –, mentre la definizione “mostruoso” restituisce immagini non soltanto di Frankenstein, ma anche di bambini disabili. È praticamente impossibile esaminare ogni singola immagine di un insieme di dati così vasto, e per questo è assai difficile per l’artista esercitare una qualche forma di controllo – riguardo a ciò che viene incluso o escluso e alle preferenze e ai pregiudizi che vengono riprodotti e reiterati. Non vi è alcuna certezza riguardo a un vocabolario variegato e completo; è inevitabile che emergano le inclinazioni culturali, politiche o sociali dei gruppi di persone che hanno definito il 3. Esempi di disegni della medesima scena da Fall of the House of Usher. training set. Inoltre, la mole dei dati rende estremamente dispendiosa, in termini di tempo e spesso anche di denaro, la creazione di un insieme di dati su misura, il che può ostacolare la sperimentazione o lo spirito critico. Sono consapevole del fatto che il controllo che sono in grado di esercitare nell’ambito di questo processo sia in realtà legato a come impiego l’insieme di dati. Dal momento che mi interessano gli aspetti misteriosi e dimenticati, mi sento a disagio nell’utilizzare un insieme di dati compilato da qualcun altro senza esplorarlo adeguatamente. I piccoli programmi di apprendimento automatico batch come pix2pix richiedono training set molto più ridotti (spesso limitati ad alcune centinaia di immagini), il che consente di condurre un’esplorazione e una riflessione su tali idee. Creando un mio insieme di dati sono obbligata a esaminare ogni immagine, e la procedura abituale per la realizzazione di questo tipo di insiemi di dati risulta quindi rovesciata. Ogni insieme presenterà leggere variazioni – senza che ve ne sia uno perfetto o ideale. Il processo acquisisce così un carattere quasi artigianale: è ripetitivo e dispendioso in termini di tempo, ma necessario per ottenere qualcosa di bello. Occorre cautela nel creare un training set. Se le dimensioni sono eccessive, se le immagini sono oltremodo numerose, i risultati saranno troppo perfetti – e andranno perdute le imperfezioni e le particolarità che rendono interessante un simile mezzo espressivo. 113


Se invece il training set è troppo ridotto, non conterrà informazioni sufficienti e risulterà confuso, non producendo alcun risultato o limitandosi a ripetere all’infinito una o due variazioni del training set stesso (mode collapse). Il retaggio del training set è presente anche nelle immagini da esso prodotte (se il training set è la “lingua”, la gan conserverà sempre il relativo “accento”). Pix2pix aggiunge a un’immagine gli elementi che ritiene mancanti sulla base di quanto ha visto nel training set. Ho inserito un mio ritratto nella gan da me creata per Fall of the House of Usher. La gan non si è limitata a ridisegnarlo nel modo in cui lo avrei fatto io (così come l’avevo addestrata a fare), ma vi ha anche aggiunto uno scialle. Infatti, in tutte le immagini simili del training set (persone sedute su uno sfondo bianco), c’era qualcuno che indossava uno scialle. Le immagini create da una gan tendono ad avere un carattere molto distinto. Appaiono fluide, acquarellate e hanno una qualità tattile: sembrano essere oggetto di un intervento non naturale che appare al tempo stesso fortemente organico. La procedura consente di ottenere una qualità per cui i materiali sono in grado di «assumere una misteriosa vita propria e manifestare una propria capacità di metamorfosi»4. Questa capacità di metamorfosi sottratta a un vero e proprio controllo è un elemento che in ambito artistico si avvicina alle opere che hanno a che fare con la biologia o con la natura, più che al digitale, che tende a risultare sempre nitido e impeccabile. Lo stile (specialmente quando si utilizza un modello ad «addestramento limitato», cioè un modello al quale è stata fornita una mole limitata di dati o che è stato addestrato per un numero ridotto di epoche) appare deteriorato, rovinato e decomposto – antitetico, direi, alla maggior parte dell’estetica dell’arte digitale contemporanea. Le immagini sono zeppe di «artefatti digitali», errori che rendono manifesta la natura artificiale dell’immagine creata e che sono frutto delle sovrapposizioni irregolari che si generano quando la gan crea un’immagine. Tali imperfezioni – le tracce del processo – costituiscono un elemento con cui alcuni artisti che utilizzano l’intelligenza artificiale desiderano confrontarsi e lavorare, ma è possibile che la loro esistenza sia destinata a essere limitata nel tempo. L’industria della tecnologia punta infatti al realismo, e i progressi della grafica digitale 114

https://bit.ly/305n99b

Artificial Abstraction and the Poetics of Machine Learning: The Role of AI in the Art of Anna Ridler and Roman Lipski, Alex Estorick, Luba Elliott. “FlashArt” 2020.

mirano a ridurre al minimo questi “errori”. Non si tratta di una tecnologia statica: la sensazione è che quasi ogni mese vengano rese disponibili nuove versioni o aggiornamenti, che producono regolarmente un «look» molto diverso quando vengono utilizzati per lavorare, il che conferisce una sfumatura di transitorietà e provvisorietà all’impiego di tali materiali. Sebbene le gan siano sempre più dominanti sulla scena artistica internazionale, manca una terminologia che consenta di discuterne il ruolo in un contesto artistico al di là degli aspetti scientifici o della loro possibile funzione in un altro contesto interessato a elementi nuovi e a diversi criteri di valutazione. L’uso di una gan per produrre un’immagine, rispetto a qualsiasi altra metodologia, offre allo spettatore molteplici esperienze, aspettative, elementi storici e contesti sui quali riflettere. Quali sono queste associazioni, e come è possibile utilizzarle in un’opera d’arte? Di fronte a un’opera realizzata da una macchina si sperimentano reazioni e collegamenti diversi da quelli suscitati da un’opera prodotta da un essere umano. Una gan, o anche un training set, possono trasformarsi in un «attore e agente deliberato all’interno dei processi artistici», così come qualsiasi altro materiale, come i colori a olio, il carboncino o il video? Le reazioni suscitate possono essere sfruttate a beneficio dell’opera? Ho provato a utilizzare la procedura di lavoro basata sull’intelligenza artificiale per mettere in evidenza le idee centrali implicite nel mio film di animazione di 12 minuti Fall of the House of Usher. Ogni fotogramma dell’opera è stato generato da una gan addestrata sulla base dei miei disegni. Sarebbe stato possibile realizzare l’animazione manualmente, ma optando per l’apprendimento automatico ho avuto modo di sottolineare e accentuare i temi legati al ruolo del creatore, alla reciprocità tra arte e tecnologia e agli aspetti della memoria con modalità che altrimenti non avrei avuto a disposizione. The Fall of the House of Usher (La caduta della casa degli Usher) è un racconto scritto da Edgar Allan Poe nel 1839 che tratta di una casata decaduta. Contiene immagini straordinariamente ricche – vi sono «immagini capovolte e deformate» paragonate «al risveglio dai piaceri dell’oppio», che richiamano le caratteristiche estetiche di una gan. 115


117 4. Copia con annotazioni di The Fall of the House of Usher di Edgar Allan Poe.


E non si tratta soltanto di un racconto: è stato adattato per il grande schermo (dal film artistico di Jean Epstein, all’animazione surrealista a passo uno di Jan Švankmajer, sino alle pellicole mainstream dell’orrore prodotte da Hollywood e da Hammer), rielaborato in album a fumetti e opere teatrali e più volte riscritto. Ha una ricca storia di versioni differenti; non coincide con nessuna in particolare, bensì con tutte. Il mio obiettivo era che l’animazione rendesse giustizia a questo aspetto. Si tratta della copia di una copia (il film) dell’originale (il libro); di conseguenza, le cose appaiono e scompaiono, sono ricordate o confuse nel ricordo o nell’immaginazione. Per realizzare la mia animazione ho preparato un training set di 200 disegni ispirandomi alla versione del 1929 de La caduta della casa degli Usher, in modo da insegnare alla gan a disegnare nel mio stile. Il disegno è interessante nel contesto dell’apprendimento automatico – è il primo dei linguaggi (impariamo a disegnare prima di imparare a parlare), perciò mi sembra si presti ottimamente a essere utilizzato con questa tecnologia emergente. Il disegno svolge tre importanti funzioni: registra, rimanda all’elemento umano che si cela dietro l’immagine e racchiude il processo di elaborazione (non riproduce un momento specifico nel tempo o una singola prospettiva, ma produce un amalgama di immagini, pensieri e ricordi). Un tempo il gioco degli scacchi veniva considerato squisitamente umano, ma ora che le macchine sono in grado di praticarlo questa percezione è mutata. Accadrà la stessa cosa al disegno? La creazione dei disegni ha richiesto un’ingente quantità di lavoro. Diversamente dalla pressione di un tasto, essa implica la disponibilità a investire una determinata quantità di tempo in una specifica immagine tracciata su un foglio di carta. Ho scelto deliberatamente di servirmi dell’inchiostro affinché la gan producesse immagini dal carattere parzialmente pittorico, ma anche perché questo materiale implica di per sé una certa misura di casualità. È molto difficile da controllare, e le differenze tra le varie immagini di una stessa scena risultano amplificate. Inoltre è un materiale che non perdona: sfugge, va a finire dappertutto. È ine118

vitabile lasciare tracce dell’elemento umano – le impronte delle dita – che appaiono in un certo senso fuori luogo in un’opera digitale, ma che io ritengo particolarmente importanti. La necessità di decidere che cosa includere nel training set mi ha offerto inoltre l’occasione di esercitare una certa misura di controllo. Limitando il training set ai primi quattro minuti del film, ho avuto modo di controllare entro determinati limiti i livelli di “esattezza”. Vi sono momenti in cui questa è molto elevata – all’inizio, nelle parti in relazione alle quali ho fornito all’intelligenza artificiale un gran numero di riferimenti – ma la ripetizione e la necessità di ricorrere alla memoria sono causa di un «dis-ricordare», e con il procedere del filmato le informazioni iniziano a venire meno. Non vi sono immagini di riferimento, perciò il programma è costretto a ricostruire ogni fotogramma sulla base di ciò che già conosce, il che produce momenti irreali e inquietanti. Alcune volte la procedura funziona, altre volte no. Claude Shannon, il padre della teoria dell’informazione, fa riferimento alle quantità minime di informazioni necessarie alla comprensione, spiegando come «la familiarità con parole, espressioni idiomatiche, cliché e grammatica ci consente di ripristinare le lettere mancanti in una bozza che stiamo leggendo o le frasi interrotte in una conversazione»5. La familiarità con il cinema e con i classici di Hollywood, che possiedono i propri cliché, le proprie espressioni idiomatiche e la propria grammatica, permette allo spettatore di cogliere e comprendere i significati. La memoria diviene così parte del materiale necessario alla comprensione dell’opera. Ma la sensazione di controllo è illusoria: è impossibile prevedere quale sarà l’esito di ciascun fotogramma. Posso tirare a indovinare, ma non ho alcuna certezza. Gli errori e le decisioni che hanno luogo durante il disegno vengono amplificati, e la gan riflette i miei disegni come in uno specchio, facendomi cogliere aspetti di cui non ero consapevole: che cosa ritengo più importante e che cosa tendo sistematicamente a eliminare. Notando che rappresento occhi e sopracciglia in modo molto simile, l’intelligenza artificiale ha finito per fare confusione tra i due elementi. C’è una sedia che 5. Occhi e sopracciglia da Fall of the House of Usher. appare e scompare, poiché talvolta mi ero ricordata di disegnarla 119


e talvolta no. La gan mi mima, facendo proprio l’aspetto umano e gli errori che rientrano nella procedura. I concetti di ripetizione, ricordo e ricostruzione evidenziati dal processo di creazione «e i relativi risvolti» costituivano un aspetto che mi interessava esplorare più a fondo. Ho creato un secondo training set, ma questa volta ho disegnato le immagini “contraffatte” e “deteriori” generate dalla gan. Disegnare queste immagini è stato incredibilmente difficile: la logica del mondo reale c’era e non c’era (le ombre non erano esatte, le pieghe dei tessuti non cadevano come previsto). Nel disegno lo stile è in continua evoluzione, ma il fatto che io lo utilizzassi da molto tempo ha modificato il mio modo di disegnare e colorare un’immagine. Ora ho iniziato ad aggiungere degli “artefatti” e il mio tratto è mutato. È bizzarro avere a che fare con due gan diverse, ciascuna delle quali racchiude in sé il mio stile in due momenti distinti della mia esistenza. Questo progetto ha creato un loop tra copia e ripetizione – sia manuale, sia da parte della macchina –, tra l’elevata quantità di lavoro implicita nella creazione dei disegni per il training set e la rapidità con cui l’algoritmo produce i fotogrammi. Vi è un’interazione tra l’ambito digitale e quello fisico: il film originale era su pellicola di celluloide, che è stata riversata in digitale, stampata, disegnata, scansionata e quindi ricostruita dalla gan. La celluloide è soggetta a danneggiamenti che possono cancellare le immagini; io ho conservato questo elemento, inserendo nei disegni gli aloni di luce e i graffi che vedevo nel film. Ho inoltre riprodotto gli errori e gli artefatti digitali della gan quando ho realizzato il secondo insieme di disegni, e tutti questi elementi costituiscono peculiarità del modello specifico che ho realizzato. Ora che dispongo di diversi insiemi, sono in grado di addestrare vari modelli affinché producano risultati differenziati. Posso produrre innumerevoli disegni con la semplice pressione di un tasto. Dispongo di varie animazioni e dei relativi training set. Compaiono elementi che non si inquadrano più in una narrazione o in un mezzo espressivo specifici, e intendo procedere simultaneamente in più direzioni. Viene a mancare la solidità del fatto concreto, che diviene sempre più concreto quanto più ci si avvicina 120

https://bit.ly/3l6JCeZ

Fairy Tales and Machine Learning: Retelling, Reflecting, Repeating, Recreating, Anna Ridler, Georgia Ward Dyer, “Interalia Magazine”, 2019.

6. Disegno delle immagini generate dalla gan.

121


7. Disegno delle immagini generate dalla gan.

122

8. Disegno delle immagini generate dalla gan.

123


9. 1. Fotogrammi dal film del 1929. 2. Disegni del film. 3. Immagini generate dalle gan. 4. Disegni delle immagini generate dalle gan.

124

125


al punto d’origine. Il risultato è più indistinto e incontrollato di qualsiasi cosa avrei potuto ottenere da sola. Nel realizzarlo mi è ritornato alla memoria Tlön, Uqbar, Orbis Tertius, un racconto di Borges che parla di un paese immaginario chiamato Uqbar in cui «la duplicazione di oggetti perduti non è rara», ma queste duplicazioni, chiamate hrönir, «erano il prodotto accidentale della distrazione e della dimenticanza» (la mia sedia mancante, il mio modo sommario di disegnare gli occhi), «non meno reali, ma più simili alle aspettative», che tuttavia nel corso del tempo e dei cicli di riproduzione assumevano «una purezza del tratto non presente nell’originale»6. Il risultato è opera mia e al tempo stesso non lo è – è riconoscibile come mio, ma non è qualcosa che sarei stata in grado di realizzare da sola. Osservarlo produce una sensazione molto strana – è come se cogliessi un riflesso di me in uno specchio prima di rendermi conto che si tratta di me. Tutto ciò solleva naturalmente un interrogativo relativo a dove risieda la creatività in quest’opera – in me che ho creato il training set, oppure nella gan che ha prodotto le immagini? Dove sta la “vera” arte? Sono un’artista bricoleur che mescola elementi già esistenti, o una persona che possiede ricordi e idee e tenta di trasmetterli a un pubblico attraverso un nuovo mezzo espressivo? Il disegno è a un tempo una cosa e un’azione, ma se una gan è certamente in grado di produrre un disegno, non sono certa che sia in grado di disegnare – di mettere in atto quel processo e quelle decisioni a cui ho fatto riferimento più sopra. Il suo modo di costruire un’immagine è fondamentalmente diverso dal mio. Vi è l’intento che ho trasposto nell’opera – le mie scelte, le mie decisioni, i miei disegni nonché, ritengo, i miei ragionamenti – e a mio avviso i training set sono essenziali per questo. La relazione tra me e la gan risulta molto più intensa rispetto al caso in cui mi fossi limitata ad addestrare un modello con un database trovato altrove. La gan conosce il mio stile. Chiunque vi possa accedere può accedere anche a un pezzetto di me. Non concepisco la gan come uno strumento, come farei per esempio con un filtro di Photoshop – ma non la considero nemmeno un vero e proprio partner creativo. Non sono sicura di che cosa sia veramente. Il «laboratorio dell’artista» ha una lunga tradizione – dal 126

Rinascimento ad Andy Warhol – e direi che forse per me l’uso di una gan rientra in tale categoria. L’intelligenza artificiale è in grado di copiare e di suggerire, ma in ultima analisi tutto inizia e finisce con me. Non mi preoccupa molto l’idea di macchine che http://annaridler.com/works dipingano o di gan che realizzino quella che è essenzialmente Opere di Anna Ridler. carta da parati – arte priva di intenti. Non mi interessa tentare di insegnare a una macchina a disegnare come un essere umano o a produrre immagini che sia impossibile riconoscere come prodotte da una macchina. Talvolta l’arte digitale dà l’impressione di tentare di trasformare il mondo reale, grezzo e confuso, in qualcosa di luccicante e robotico. A me, tuttavia, interessa proprio il contrario – partire da qualcosa di freddo, sterile, “algoritmico” e reintrodurvi l’elemento umano – e ritengo di aver trovato una modalità per farlo servendomi dell’intelligenza artificiale come combinazione di materiali e procedure.

https://bit.ly/2OEupUd

Nature and Artifacts: Interview with Anna Ridler, “Entangled Realities”, HeK Basel 2019.

https://bit.ly/3eEtOg4

Anna Ridler uses AI to turn 10,000 tulips into a video controlled by bitcoin, Ruby Boddington, “It’s Nice That”, 2019.

127


Le gan e la mimesi Georgia Ward Dyer

“Cane ammiraglio!”

“Il maiale-serpente”

1. Immagini delle “entità” tratte dalle nuvole dal DeepDream Program di Google.

“Il cammello-uccello”

“Il cane-pesce”

DeepDream Creator Unveils Very First Images After Three Years, Jason Bailey, “Artnome”, 2019. Intervista ad Alex Mordvintsev, lo sviluppatore dell'algoritmo DeepDream. https://bit.ly/2OaRayR

La percezione umana e quella delle macchine vengono spesso messe a confronto; a proposito della genesi della percezione delle macchine è stato infatti osservato come le reti neurali che ne costituiscono la base abbiano tratto ispirazione dal sistema gerarchico di percezione visiva del cervello umano. Tra le due percezioni si può cogliere un’ulteriore analogia, cioè la capacità di apprendere la similitudine. È questa capacità a costituire la base delle gan e a essere al centro del fascino esercitato dal loro impiego per la creazione artistica. Sinora non sono stati compiuti molti tentativi di spiegare le cause di questo fascino, ma tale esercizio potrebbe contribuire all’esplorazione delle frontiere dell’«arte delle intelligenze artificiali» e al loro allargamento – al fine di scoprire eventuali ulteriori potenzialità per l’uso dell’intelligenza artificiale nella creazione artistica e di conferirle una legittimità che superi quella del semplice «nuovo trucco» di natura tecnica. La similitudine è alla base del nostro modo di creare significato – e dal momento che siamo animali affamati di significato, l’arte (intesa sia come produzione di opere sia come incontro con esse) ne costituisce la manifestazione logica, nonché 129


il terreno sul quale tale relazione ha modo di essere costantemente rielaborata nei modi più originali. Il termine «similitudine» non va qui inteso nel senso di mero dato esteriore di una relazione di tipo essenzialista tra le cose, ma si ricollega a ciò che Walter Benjamin, nel suo saggio sulle origini del linguaggio Dottrina della similitudine1, definisce «facoltà mimetica» – la capacità dell’uomo di riprodurre e di riconoscere la similitudine. È significativo che produzione e riconoscimento vengano definiti nella stessa sede; nella sua successiva rielaborazione di questo concetto, contenuta nel volume Sulla facoltà mimetica 2, Benjamin stesso cita Hofmannsthal: «Leggere ciò che non è mai stato scritto». La descrizione offerta da Benjamin della facoltà mimetica si interroga su quale sia l’origine dell’impulso a produrre e riconoscere la similitudine – sia a livello individuale, a partire dalla nascita, sia sul piano dell’evoluzione della specie. Nel primo caso, egli osserva che il gioco del bambino svolge una funzione di affinamento e sviluppo di tale facoltà: «Nel gioco, il bambino impersona non soltanto il negoziante o l’insegnante, ma anche il mulino a vento e il treno» (Benjamin, Sulla facoltà mimetica). Si può ravvisare questa esplorazione e sperimentazione dei limiti che ha luogo nel gioco anche nell’ambito della pratica artistica, e sono numerose le voci che si pronunciano a favore di un legame tra la visione del mondo del bambino e quella dell’artista – dalla celebre osservazione di Picasso secondo cui «Ogni bambino è un artista. Il problema è come rimanere un artista una volta che si cresce» 3, all’incipit del fondamentale Questione di sguardi di John Berger: «Il vedere viene prima delle parole. Il bambino guarda e riconosce prima di essere in grado di parlare»4. Sebbene la facoltà mimetica si sviluppi e si trasformi attraverso l’esperienza del bambino, essa continua a essere un’energia primaria, viva e mutevole nella pratica dell’artista. L’esempio di Benjamin del bambino che si finge un mulino a vento o un treno richiama alla mente i nostri giochi d’infanzia, ma trova ulteriore riscontro nelle immagini ormai celebri create dal DeepDream Program di Google. Gli autori stessi hanno infatti tracciato questa 130

nota 5 https://bit.ly/2YVVIiS

Inceptionism: Going Deeper into Neural Networks. Google AI Research Blog.

nota 6 https://bit.ly/3iMMihJ

When Robots Hallucinate, “The Atlantic”, 2015.

Performance delle gan dal 2014 al 2018, tratte da: https://arxiv.org/pdf/1406.2661.pdf https://arxiv.org/pdf/1812.04948.pdf

analogia, nel presentare per la prima volta i loro lavori in un Google Research Blog intitolato Inceptionism: Going Deeper into Neural Networks, descrivendo i risultati ottenuti in questi termini: «Ci siamo divertiti come bambini a osservare le nuvole interpretandone le forme casuali»5. Si può ritenere che sia proprio questa la ragione della grande popolarità conseguita dalle immagini prodotte da DeepDream, e del fatto che esse abbiano indotto sia scienziati del computer sia neuroscienziati a ipotizzare che la percezione delle reti neurali e la percezione umana potrebbero essere ancor più simili di quanto si ritenesse in passato 6. È importante specificare che DeepDream, pur dipendendo dalle caratteristiche delle reti neurali convoluzionali o cnn, non è tecnicamente una gan. Nondimeno, soprattutto alla luce del fatto che le immagini di DeepDream sono state – e vengono tuttora – sovente definite in termini di «arte delle intelligenze artificiali», esse costituiscono un riferimento appropriato per un tentativo di accertare il ruolo essenziale della similitudine nella percezione visiva umana e in quella delle intelligenze artificiali e la relazione che le lega al gioco infantile, all’arte e alle pratiche dell’artista. Pur non essendo una gan , DeepDream intrattiene con la similitudine una relazione paragonabile sul piano concettuale. DeepDream opera dando istruzioni alla rete di trasformare l’immagine al fine di ottimizzare ciò che “vede” in essa, ossia di ridurre le differenze (o, se vogliamo, di accrescere la similitudine) tra ciò che esiste e ciò che la rete percepisce – una dimostrazione paradigmatica di lettura di «ciò che non è mai stato scritto». Analogamente, le gan mirano a ridurre al minimo la differenza (il che, ancora una volta, presuppone l’apprendimento della similitudine) tra un output generato e ciò che viene presentato come «immagine reale»; una delle reti genera degli output che sembrano appartenere all’insieme di dati utilizzati per l’addestramento, mentre l’altra valuta il successo ottenuto dalla prima in tale operazione. Le gan hanno attirato l’interesse sia della comunità scientifica sia del pubblico in generale perché, come molte altre tecniche di intelligenza artificiale 131


comparse negli ultimi anni, migliorano costantemente le proprie prestazioni. Per esempio, i più recenti modelli di generazione di immagini sono divenuti notevolmente efficienti nel produrre risultati dall’aspetto realistico. Nell’ambito della comunità artistica, tuttavia, numerosi artisti che si sono serviti delle gan per creare opere – in particolare quelli che lo fanno da diversi anni (sin dalla pubblicazione nel 2014 dello studio di Ian Goodfellow) – hanno tratto vantaggio non dall’efficacia delle gan nel generare immagini perfettamente realistiche, bensì dalla loro capacità di esplorare le aree di «spazio latente» in cui prendono forma immagini strane e surreali. Artisti quali Robbie Barrat e Mario Klingemann lavorano con le gan sin dal loro sviluppo e possono essere a buon diritto definiti dei precursori, che hanno ispirato molti altri artisti a seguirli. Nel caso di Klingemann, l’avvento di gan in grado di generare immagini più realistiche non ha distolto l’artista dal suo interesse per le immagini distorte e difettose; spesso Klingemann ha definito i ritratti di Francis Bacon come una sorta di «cugini visivi» delle sue opere. Nel suo fare riferimento a questo contesto della storia dell’arte, e più in generale applicando un occhio critico alla sua stessa prassi artistica, Klingemann si distingue in modo particolare tra i molti che si sono serviti delle gan per generare immagini di questo tipo. Il paragone con il surrealismo, è vero, è frequente nella cerchia dell’arte delle intelligenze artificiali, ma assume qui una rilevanza contestuale. Si possono infatti ravvisare forti analogie tra il surrealismo e la facoltà mimetica di Benjamin. L’interesse di quest’ultimo per la grafologia – «immagini che celano l’inconscio dell’autore» (Dottrina della similitudine) – e la sua descrizione del surrealismo come «illuminazione profana», su cui ha indagato Margaret Cohen, intrecciano strettamente il surrealismo e la concezione di Benjamin della natura della mimesi. Ciò ci rammenta un elemento importante: la natura e la rilevanza della facoltà mimetica non riguardano in senso realista le analogie percettive tra una cosa e l’altra; e nei suoi scritti, Benjamin mostra il massimo disprezzo per il «banale 132

ambito sensibile della similitudine» (Sulla facoltà mimetica). La potenza della facoltà mimetica sta nelle «corrispondenze magiche» che si risvegliano «come un lampo» – quali le energie misteriose e avvolgenti che si agitano appena al disotto della superficie del nostro pensiero cosciente in occasione degli incontri con il surrealismo. È importante che questo venga descritto esplicitamente come un fatto non consapevole e meramente visibile. Benjamin parla della capacità dei popoli antichi e primitivi di percepire in modo più manifesto queste corrispondenze e analogie, annoverando le rune, i geroglifici e la grafologia tra gli esempi di «mediazioni» con questo passato, mentre oggi il linguaggio costituisce il «canone in funzione del quale è possibile almeno in parte chiarire il significato della similitudine non sensibile» (Sulla facoltà mimetica). Sebbene in questi saggi Benjamin si proponga di esplorare le origini del linguaggio, e malgrado liquidi come “banale” la similitudine sensibile, questi collegamenti consentono di applicare la cornice della facoltà mimetica al nostro modo di interagire con le immagini – e anzi, in questo ambito sarebbe fuori luogo una dicotomia tra linguaggio e immagine. Nella mia opera O Time thy pyramids ho esplorato questa relazione, servendomi delle cnn per leggere significati in disegni a inchiostro deliberatamente calligrafici, simili a glifi e al tempo stesso astratti, e utilizzando quindi una tecnica denominata «deconvoluzione» per identificare gli specifici pixel che motivavano una specifica lettura. Nell’ambito della creazione di questi lavori ho elaborato uno stile di disegno basato sull’impiego di un pennello calligrafico e dell’inchiostro di china, i cui esiti, chiaramente non figurativi, rimandano tuttavia sul piano formale a simboli e sistemi di scrittura. Già in questa fase del processo creativo, dunque, lo sviluppo stesso di questo stile costituiva un modo di affrontare sul piano pratico uno degli interrogativi che motivavano l’opera nel suo insieme, cioè: «Che cosa fa sì che un glifo sia un glifo e non semplicemente un disegno qualsiasi?». Infatti, nel corso di una serie di prove di disegno, è apparso chiaro che alcuni disegni «assomigliavano» a glifi più di altri 133


2. Lucchetto - O Time thy pyramids, Georgia Ward Deyer 2016.

134

3. Chitarra elettrica - O Time thy pyramids, Georgia Ward Deyer 2016.

135


4. Cappello da cowboy - O Time thy pyramids, Georgia Ward Deyer 2016.

136

5. Segnale stradale - O Time thy pyramids, Georgia Ward Deyer 2016.

137


6. Fontana - O Time thy pyramids, Georgia Ward Deyer 2016.

138

7. Scorpione - O Time thy pyramids, Georgia Ward Deyer 2016.

139


– in una sorta di «grafologia al contrario» che andava alla ricerca non dell’immagine tra le lettere, ma della lettera nell’immagine (sebbene procedessi sempre con cautela, cercando di evitare di disegnare elementi troppo identificabili con glifi esistenti). La questione relativa a che cosa – mentre sviluppavo e rifinivo il mio stile di disegno – rendesse alcune immagini più simili a glifi rispetto ad altre rientrava in effetti tra gli aspetti del progetto originale: distinguere i glifi dagli altri disegni; e sarebbe stato impossibile non formulare delle ipotesi riguardo a quali tra gli elementi dei disegni fossero responsabili di questo effetto. Una delle ipotesi che ho elaborato durante la fase di disegno presuppone che – come ha suggerito il semiologo William C. Watt7 – l’anatomia umana influisca fortemente sull’aspetto dei glifi8. La fase successiva del processo creativo è consistita nell’uso di una rete neurale in grado di classificare le immagini allo scopo di “identificare” ciò che i disegni rappresentavano. Si trattava di un’operazione deliberatamente assurda: chiedendo a un’intelligenza artificiale di questo tipo – addestrata a classificare immagini fotografiche e dotata di un vocabolario limitato – di leggere disegni che erano sì simili a glifi, ma nondimeno astratti, ho ottenuto risposte altrettanto assurde quali «una fontana» o «un cappello da cowboy». Mentre le cnn identificano quali parti della rete vengano attivate in modo più marcato da un dato input, la deconvoluzione rovescia tale processo individuando quali parti di un input attivino aree specifiche della rete. Servendomi di questo processo di deconvoluzione, quindi, sono riuscita a identificare le parti specifiche del disegno che producevano le specifiche risposte fornite dal modello di classificazione delle immagini, e ho quindi stampato soltanto queste parti dell’immagine su una seconda pagina. Chiedendo a una rete addestrata su immagini fotografiche di leggere disegni astratti ma simili a glifi e di descrivere in una parola ciò che “vedeva” e (attraverso la deconvoluzione) perché, ho dato vita a un’opera che indaga su interrogativi filosofici senza tempo – per esempio se un disegno contenga il significato a cui fa riferimento il linguaggio, o se sia vero il contrario –, anche se, traendo vantaggio dall’ar140

te come forma di ricerca intellettuale multi-modale e plurale, non è necessario porre questi interrogativi in una forma così lineare. In ambito espositivo, per ogni gruppo della serie, il disegno originale e la corrispondente immagine «deconvoluta» vengono presentati fianco a fianco, accompagnati da una didascalia che specifica che cosa l’intelligenza artificiale abbia visto nel disegno. Le opere si prestano così a sollevare questi interrogativi filosofici relativi a linguaggio e significato, parola e immagine, sebbene lo spettatore legga inevitabilmente le parti dell’opera come un tutt’uno e tracci istantaneamente dei collegamenti tra di esse. Dopotutto, la facoltà mimetica non è un interruttore che si possa accendere e spegnere a piacimento – è qualcosa che è dentro di noi, come il bagliore di una lampada, che si intensifica o si affievolisce reagendo a stimoli. Per Benjamin, rapporti che un tempo venivano percepiti come mimetici hanno attraversato una serie di mediazioni nel corso del tempo, data la necessità da parte della modernità di sussumere e quindi trasformare la nostra stessa facoltà mimetica. Dal punto di vista dell’epistemologia moderna, la trasformazione della facoltà mimetica fa sì che la conoscenza e l’intuizione sia della facoltà stessa, sia degli oggetti che essa mette in relazione con sé, vadano progressivamente perdute. Per citare Benjamin, «il concetto [di similitudine non sensibile] è ovviamente relativo: indica che nella nostra percezione non possediamo più ciò che precedentemente rendeva possibile parlare della similitudine che poteva esistere tra una costellazione e un essere umano» (Dottrina della similitudine). Per Benjamin, la tecnologia del linguaggio è l’ambito in cui, indagando abbastanza a fondo, è possibile rinvenire le tracce di queste magiche corrispondenze. Nell’era moderna abbiamo perduto la nostra magia, e «la nostra esistenza non comprende più ciò che un tempo rendeva possibile parlare di questo tipo di similitudine – e soprattutto la capacità di produrla» (Sulla facoltà mimetica). Ma se esistessero altre tecnologie in grado di aiutarci a riscoprirla e a recuperarla? Se essa continuasse a parlarci attraverso di esse? Descrivendo il modo in cui ha realizzato la sua opera 141


The Butcher’s Son, vincitrice del premio Lumen, Klingemann afferma di controllare «questo processo in modo indiretto, addestrando il modello su insiemi di dati selezionati e sugli iper-parametri del modello, e infine operando una selezione, scegliendo tra le migliaia di varianti prodotte dai modelli quella che più mi parla». A che cosa parla l’immagine nell’artista? La modernità valorizza i meccanismi spiegabili, le cose che siamo in grado di osservare e conoscere, ma i surrealisti capivano che ad alcune verità è possibile accostarsi soltanto lateralmente. Come negli esperimenti surrealisti quali la scrittura automatica, negli stimoli del subconscio che la mente di Klingemann coglie mentre l’artista esamina le «migliaia di varianti», si possono ravvisare esempi degli «elementi che stimolano e risvegliano la facoltà mimetica che reagisce a loro nell’uomo» (Sulla facoltà mimetica). L’idea che verità e intuizioni, specie quelle di natura creativa, emergano da processi del pensiero non cosciente rientra tipicamente non soltanto nel pensiero surrealista, ma anche nei processi creativi degli artisti. Tenuto conto di ciò, è opportuno ritornare sulla natura delle gan e più in generale di molte tecniche contemporanee basate sulle intelligenze artificiali. Nel dibattito riguardo alla possibilità o meno di riconoscere un agire creativo all’intelligenza artificiale – o, a un livello più coerente e più serio, in quello che chiama in causa preoccupazioni di natura politica ed etica – le tecniche attuali basate sulle intelligenze artificiali vengono sovente definite «scatole nere». In altre parole, dal momento che nello stadio attuale della ricerca sull’intelligenza artificiale i metodi sono imposti dalla «forza bruta» di molteplici calcoli matematici svolti in parallelo su vasta scala, non è possibile risalire ai meccanismi causali che legano uno specifico input a uno specifico output – non è cioè possibile identificare il fantasma all’interno della macchina, poiché esso si cela nell’intera architettura e non può quindi essere ricondotto a un’unica istanza. Il riferimento ai fantasmi non è casuale. Anche a prescindere dal fatto che lo stesso Benjamin mette in relazione la mimesi 142

con ciò che definisce «sapere occulto», è legittimo ricollegare la tecnologia, e l’intelligenza artificiale in particolare, alla tradizione magica – l’arte e la letteratura sull’arte offrono già alcuni esempi al riguardo. Nel 2018, Sarah Shin e Ben Vickers hanno lanciato Ignota Books, con l’obiettivo di pubblicare testi che si collochino «all’incrocio tra tecnologia, mitologia e magia»9, mentre nel 2017 l’artista multimediale James Bridle ha realizzato l’opera Autonomous Trap 001 servendosi del rituale magico del cerchio di sale per intrappolare sul monte Parnaso un’auto a guida automatica10. L’artista Anna Ridler nota 10 e io abbiamo paragonato l’uso dell’intelligenza artificiale nel https://bit.ly/3f6guCb processo creativo alla tradizione magica dei Djinn. Autonomous Trap 001. L’impulso ad affrontare la tecnologia attraverso la lente della tradizione magica si può spiegare in relazione al fatto che le definizioni della magia hanno in comune un’attenzione per ciò che non può essere spiegato. Definiamo «magico» un fenomeno quando non siamo in grado di spiegarne i meccanismi di funzionamento, quando non è possibile averne conoscenza (nel senso causale, occidentale del termine). Così come nelle civiltà antiche si attribuivano spiegazioni mitiche o magiche a fenomeni naturali quali le condizioni atmosferiche e le maree, le reazioni del pubblico nei riguardi delle capacità della «tecnologia della scatola nera» tendono a ricollegarsi alla tradizione magica. Una differenza cruciale tra i due ambiti è, naturalmente, che in molti casi è quantomeno possibile indagare un meccanismo tecnologico (sebbene l’ignoranza al riguardo sia favorita dalla struttura di progettazione). Tuttavia, il caso dell’intelligenza artificiale, come accennato più sopra, è diverso, e le difficoltà implicite nella creazione di un’intelligenza artificiale autenticamente «spiegabile» sono tali da essere identificate dai responsabili delle decisioni politiche come uno dei principali ostacoli al progresso dell’intelligenza artificiale – e la Defence Advanced Research Projects Agency (darpa) ha deciso di affrontare il problema elaborando un programma denominato Explainable ai (xai) che mira, appunto, a creare un’intelligenza artificiale “spiegabile”. 143


L’inquadramento delle gan nel contesto della facoltà mimetica trova dunque una duplice giustificazione: in primo luogo in quanto la loro ragion d’essere è essenzialmente mimetica, ma anche in virtù della loro natura ineluttabilmente magica. Le gan possono anche essere conosciute dal pubblico e dal mondo dell’arte come strumenti creativi (di immagini, di materiale audio), ma il loro sviluppo ha motivazioni commerciali, e l’obiettivo della ricerca è metterle in grado di perfezionare i risultati generati, migliorando le proprie prestazioni. Ma non è questo l’obiettivo che debbono prefiggersi gli artisti perché le gan possano diventare strumenti realmente preziosi nella pratica artistica. Per gli artisti, il senso dell’uso delle nuove tecnologie non consiste solitamente nell’affinarne le funzioni predefinite, bensì nel lanciare loro una sfida, scomponendole e ricostruendole, scoprendo in esse nuove caratteristiche e nuove capacità. La scultura è arte in virtù non della sua capacità di produrre una forma, ma di quella di produrre una forma che parla e viene letta in relazione a tutte le altre forme, e in cui viene sfruttato il grado di somiglianza ad altre forme, che dipende dalla facoltà mimetica dell’artista così come da quella dello spettatore – processo in cui possono rientrare elementi quali pluralità di significati, complessità e interpretazione, a seconda del grado di accettazione delle teorie di Barthes sulla morte dell’autore (o, nel caso specifico, dell’artista). Analogamente, la potenza delle gan e di altre tecniche basate sull’intelligenza artificiale nella pratica creativa non sta semplicemente nella produzione di un risultato qualsiasi, ma nella capacità di richiamare e galvanizzare la facoltà mimetica, di raggiungere quei «residui minimi delle corrispondenze e delle analogie magiche familiari alle popolazioni antiche» (Sulla facoltà mimetica) arrivando a momenti di similitudine non sensibile – Klingemann che esamina infinite immagini generate sino a individuare quella che gli parla, o i lampi di riconoscibilità prodotti dai training set disegnati manualmente da Anna Ridler per la sua animazione Fall of the House of Usher.

144

Per Benjamin, la tecnologia del linguaggio ha rappresentato l’ultimo rifugio della facoltà mimetica: facciamo sì che l’intelligenza artificiale sia oggi la tecnologia in grado di risvegliarla attraverso l’arte.

https://bit.ly/32xMfR2

AI and Creativity, Georgia Ward Deyer interviene a “Future Curious” di nesta.

https://bit.ly/32v2wq1

Drone Swarms and Digital Shamans: five takeaways from Ars Electronica 2018. Georgia Ward Deyer, blog Futurescoping di nesta.

1

p. 110

145


Alla ricerca della creatività: le gan come paradigma dell’autonomia nel software per la composizione musicale Caterina Moruzzi

1. Per celebrare il 21 marzo 2019, data del 334esimo anniversario della nascita di Johann Sebastian Bach, i team Magenta e pair di Google hanno creato il primo Doodle - il logo del motore di ricerca personalizzato per occorrenze ed eventi - utilizzando l’intelligenza artificiale, in particolare una rete neurale convoluzionale (cnn). Sono stati analizzati 306 corali di Bach per allenare l’algoritmo ad armonizzare le melodie proposte dagli utenti giocando con il Doodle bachiano.

146

In questo saggio discuterò l’impatto dell’intelligenza artificiale su uno dei temi centrali della filosofia dell’arte: la natura delle opere musicali. L’interrogativo sul quale intendo concentrarmi è il seguente: «Può un computer creare un’opera musicale?». Alla luce della sua complessità e dalla sua dipendenza dal soggetto, il concetto di creatività si sottrae a qualsiasi definizione o quantificazione oggettiva. Al fine di individuare un metodo non arbitrario per misurare la creatività, indico nell’autonomia uno degli elementi necessari che i processi creativi devono presentare. Esaminerò quindi il case study della generazione di musica da parte del nuovo modello di algoritmo generativo delle gan. Intendo sostenere che l’uso delle gan nei software di composizione musicale potrebbe conferire al sistema un livello di autonomia sufficiente a farlo ritenere capace di creare opere musicali. Esaminando le differenze implicite esistenti tra le gan e altri tipi di software impiegati nella composizione algoritmica, metterò a confronto i loro processi di creazione e la qualità dei loro risultati con quelli di altri algoritmi di composizione musicale ampiamente usati. La conclusione del saggio evidenzierà come la qualità esteticamente inferiore dei 147


risultati prodotti attualmente dalle gan nel campo della generazione musicale non possa essere utilizzata come argomento contro la loro creatività. Gli ultimi decenni sono stati caratterizzati da una proliferazione esponenziale dei programmi di intelligenza artificiale per la composizione musicale. I sistemi di composizione algoritmica a codifica fissa degli esordi stanno progressivamente lasciando il posto a impieghi più avanzati delle reti neurali e dei software di apprendimento profondo, con un conseguente aumento della complessità e della qualità della musica prodotta. I Mozart e le Lady Gaga del futuro sono una serie di chip al silicio: Jukedeck, Flow Machine, Aiva e altri programmi stanno conquistando un seguito sempre più ampio in molti ambiti musicali, suscitando crescente entusiasmo e consenso tra i loro fan. Se gli sviluppi più recenti nel campo della musica generata da intelligenze artificiali sono motivo di grande interesse sia tra gli ascoltatori sia tra gli studiosi, essi sollevano anche interrogativi di natura meno pratica e più filosofica. In questo saggio intendo soffermarmi sull’impatto dell’intelligenza artificiale su uno dei temi centrali della filosofia dell’arte: la natura delle opere musicali. L’interrogativo sul quale intendo concentrarmi è il seguente: «può un computer creare un’opera musicale?». La risposta a questa domanda riveste un certo interesse, e non soltanto dal punto di vista filosofico e teorico. Implica infatti conseguenze che riguardano anche le considerazioni relative al copyright e alla proprietà intellettuale, e fornisce inoltre qualche informazione sulla natura della stessa creatività umana. Prima di valutare se un algoritmo possa o meno essere considerato creativo, tuttavia, è necessario definire che cosa sia la creatività. La letteratura offre numerose definizioni della creatività, nessuna delle quali assume però una dimensione paradigmatica che consenta di utilizzarla in ogni campo e disciplina. Il mio scopo in questo saggio non è rivoluzionare gli approcci alla creatività già esistenti, bensì suggerire possibili percorsi di indagine che potrebbero risultare utili alla comprensione della creatività – umana e artificiale. Il campo della tecnologia e dell’intelligenza artificiale sta vivendo uno svilup148

po accelerato, che rimette in discussione le nostre concezioni e idee pregresse sulla creatività. Oggi più che mai è quindi necessario affrontare il dibattito su questo tema e svilupparne la discussione, riconoscendo ed esaminando la rivoluzione tecnologica nel momento in cui si propongono modalità di definizione della natura della creatività. In funzione di tale obiettivo, nel prossimo paragrafo definirò la creatività come processo autonomo di risoluzione dei problemi. Come spiegherò in modo più particolareggiato, si tratta di una definizione minima – che tuttavia serve allo scopo di individuare una misura oggettiva della creatività che consenta quindi di passare allo studio delle sue numerose ulteriori caratteristiche. Applicherò poi questa definizione all’analisi delle gan. Questo algoritmo d’avanguardia ha recentemente dato prova di prestazioni straordinarie nella generazione di nuovi dati, specie nel campo delle immagini. Prendendo in considerazione le componenti strutturali delle gan e il loro processo di generazione, intendo sostenere che queste reti mostrano un’autonomia sufficiente a permettere di considerarle più capaci di creatività rispetto ad altri algoritmi generativi. Esaminerò i due principali vantaggi posseduti dalle gan, che le differenziano da altri algoritmi: la loro capacità di auto-valutazione e la loro relativa autonomia da un insieme preesistente di dati. Concluderò evidenziando alcuni dei limiti delle gan per quanto concerne la generazione musicale – limiti legati in particolare al fatto che esse producono risultati esteticamente inferiori rispetto ad altri algoritmi generativi quali le reti neurali ricorrenti (Recurrent Neural Networks o rnn). Cionondimeno, metterò in luce come questi apparenti limiti non pregiudichino la nostra possibilità di considerare le gan capaci di creatività. Il periodo che stiamo vivendo ci offre materiali e occasioni entusiasmanti per lo studio del tema della creatività. Nutro fiducia sul fatto che l’acquisizione di ulteriori informazioni sulla creatività artificiale sia in grado di produrre altri risultati più generali relativi al modo in cui funziona la mente umana e a come sia possibile migliorarne le prestazioni attraverso la collaborazione con la tecnologia. 149


Creatività: una definizione minima Sono molteplici le definizioni di creatività proposte dalla letteratura specializzata. La definizione che ha gettato le basi per molte altre successive è quella proposta da Margaret Boden: «La creatività è la capacità di inventare idee o creazioni nuove, sorprendenti e dotate di valore»1. Per la Boden, un’attività creativa produce qualcosa che non è mai stato fatto prima. Inoltre, la novità che è frutto di un atto creativo deve essere necessariamente accompagnata da una sensazione di sorpresa. Infine, questa idea o creazione nuova e sorprendente deve essere «dotata di valore». Deve cioè avere caratteristiche riconoscibili che inducono per qualche ragione ad attribuirle un valore. In effetti, nel corso di questo saggio scriverò probabilmente alcune frasi che non sono mai state scritte prima e che potrebbero apparire sorprendenti ad alcuni lettori. Ma altri potrebbero ritenere che non possiedano un valore, e che quindi non siano nemmeno creative. Esistono altre definizioni della creatività, che tuttavia generalmente accettano le caratteristiche evidenziate dalla Boden2. L’analisi della Boden sul tema della creatività è ampiamente apprezzata per aver portato l’argomento all’attenzione dell’analisi filosofica. La definizione da lei proposta non è tuttavia priva di limiti: un aspetto controverso è la sua eccessiva nettezza. E il fatto che la Boden inserisca l’attributo «dotato di valore» tra i requisiti degli atti creativi implica in effetti conseguenze indesiderate – per esempio, una canzone che non apprezziamo e che non riteniamo dotata di valore non si potrebbe definire prodotto della creatività3. Al di là di questo limite, la descrizione della Boden dell’atto creativo come di un atto che produce qualcosa che è «dotato di valore» evidenzia una caratteristica che il senso comune attribuisce tipicamente al concetto di creatività: il suo essere dipendente dal soggetto. È proprio questa natura soggettiva della creatività a rendere ardua l’individuazione di una definizione oggettiva della creatività stessa. Essa può infatti essere identificata come proprietà di un prodotto o di un processo4, come attività di un individuo o di un gruppo5 oppure, in definitiva, come qualcosa che non è possibile definire e che verosimilmente non esiste nemmeno6. 150

Dai dibattiti sulla creatività i partecipanti escono solitamente ancor più confusi riguardo a quale sia la sua natura. Ciò è dovuto in parte al fatto che la creatività viene definita in modi diversi da persone che operano in campi diversi. Di norma, gli artisti considerano la creatività come una proprietà di quel “genio” che solo alcune persone sembrano possedere, almeno a livelli particolarmente elevati7. Gli studiosi che si occupano di scienze dei computer, per contro, considerano la creatività come qualcosa che è possibile ricreare per mezzo di un algoritmo e attribuiscono solitamente maggiore importanza al prodotto finale piuttosto che al processo che conduce alla sua creazione8. Scienziati cognitivi e neuroscienziati vanno alla ricerca di correlazioni neurali della creatività all’interno del cervello, tentando di comprendere i meccanismi che la governano9. Infine, i filosofi conducono una meta-analisi delle affermazioni sulla creatività formulate dai ricercatori che operano in altri campi. Di conseguenza, essi descrivono la creatività in vari modi – come proprietà di un processo, proprietà di un prodotto, entità emergente e via dicendo10. Questa molteplicità di opinioni su che cosa sia la creatività e su come essa vada definita evidenzia in modo ancor più vistoso la necessità di individuare una modalità di interpretazione della stessa che possa essere accettata dalla grande maggioranza di coloro che si interessano al concetto. In mancanza di un punto di partenza di questo tipo, infatti, è impossibile condurre una discussione proficua che tragga vantaggio dai contributi degli studiosi che operano in campi differenti. Allo scopo di fornire tale terreno comune, propongo una definizione minima di creatività che va intesa come punto di partenza per la determinazione della sua natura essenziale, necessaria per procedere nell’indagine e rendere progressivamente più precisa la nostra immagine della creatività sulla scorta delle nuove informazioni via via ottenute. Ritengo che la creatività possa essere compresa con la definizione minima di processo autonomo di risoluzione dei problemi. La caratterizzazione della creatività come processo di risoluzione dei problemi evidenzia come essa sia essenziale in molti settori, non soltanto in quello artistico. Le capacità di risoluzione dei problemi implicano un certo grado di creatività nell’esplorazione e nell’a151


nalisi dei vari percorsi che possono essere imboccati allo scopo di individuare una soluzione al problema che si ha di fronte. Il processo che conduce alle scoperte scientifiche e tecnologiche richiede indubbiamente tale aspetto, così come la creazione di prodotti artistici. La scelta di porre al centro il processo creativo – e non il prodotto – è motivata dalla necessità di tentare di raggiungere una visione della creatività che sia quanto più oggettiva possibile. Concentrare l’attenzione sul prodotto che trae origine da un processo creativo, infatti, non fornisce alcuna informazione riguardo a come il pensiero creativo abbia origine o che cosa esso implichi11. La valutazione di un prodotto come creativo non è misurabile in modo oggettivo: dipende infatti dalla nostra percezione di esso e da una serie di fattori legati al contesto12. Per esempio, consideriamo generalmente creativa la Fontana di Duchamp in virtù del contesto in cui l’opera viene esposta e del processo di creazione da cui ha tratto origine. Ma non la considereremmo creativa se, invece che in una galleria d’arte, fosse installata in un gabinetto pubblico. È quindi il processo di pensiero di Duchamp a elicitare la nostra valutazione della Fontana come opera creativa, e non le proprietà intrinseche del prodotto. La designazione della Fontana come prodotto creativo dipende da questo ed è legata al contesto in cui essa viene percepita. Ritengo che l’esame dei meccanismi impliciti in un processo creativo possa risultare più proficuo ai fini di un’indagine obiettiva. Individuando gli elementi che caratterizzano il processo creativo all’origine della produzione di un risultato, infatti, può essere possibile accertarne le proprietà essenziali e quindi generalizzarle allo scopo di classificare i processi come creativi o non creativi. Ho definito “autonomo” il processo della creatività. L’autonomia è ampiamente riconosciuta come proprietà essenziale della creatività13. D’altro canto, l’autonomia può essere definita in vari modi: come elaborazione di obiettivi interiori14, come capacità di reagire a impulsi noti e ignoti15 o come libertà di generare idee16. Un elemento potenzialmente problematico consiste nel fatto che l’autonomia costituisce un requisito eccessivamente rigido perché un processo possa essere definito creativo. Nemmeno gli esseri 152

nota 12 https://bit.ly/2CBkvjP

The Interrogator as Critic: The Turing Test and the Evaluation of Generative Music, Christopher Ariza, “Computer Music Journal”, 2009.

nota 13 https://arxiv.org/pdf/1709.01620.pdf

Deep Learning Techniques for Music Generation - A Survey, Jean-Pierre Briot, Gaëtan Hadjeres, François-David Pachet, 2017.

umani, infatti, sono completamente autonomi, bensì limitati dal loro corpo, dal contesto sociale, dagli strumenti utilizzati e via dicendo. In questa sede, con il termine «autonomia» mi riferisco non a una totale libertà, bensì al non dover fare interamente affidamento su uno specifico insieme di dati17. Una volta completata la fase di apprendimento, il processo creativo deve condurre in direzioni che si distacchino dall’insieme di dati utilizzati per l’addestramento (training set). È questo il tipo di autonomia a cui farò riferimento quando mi accingerò ad analizzare la possibilità che un software sia creativo. È necessaria un’ultima precisazione riguardo all’autonomia. È possibile che abbia luogo un agire (agency) in assenza di una manifestazione di autonomia18. Il termine inglese agency viene definito dall’Oxford English Dictionary come «azione o intervento che produce uno specifico effetto». È quindi possibile mettere in atto un agire – cioè produrre un effetto – senza essere autonomi. Questa distinzione è fondamentale per determinare la differenza tra musica prodotta con l’aiuto del computer e musica generata dal computer. Nella musica prodotta con l’aiuto del computer non è necessario che il software sia autonomo; è invece necessario che realizzi un agire e fornisca un contributo al risultato finale19. A prescindere dal fascino esercitato dal campo delle collaborazioni tra esseri umani e intelligenze artificiali nella produzione musicale, in questa sede intendo concentrarmi sul caso più estremo della musica generata dal computer. In quest’ultimo ambito, è fondamentale che il computer dia prova anche di autonomia – e non soltanto di un agire – perché sia possibile considerarlo creativo. In questo paragrafo ho proposto una definizione minima di creatività come processo autonomo di risoluzione dei problemi. Occorre sottolineare qui come questa definizione minima sia deliberatamente “debole” e richieda degli aggiustamenti da apportare caso per caso, in funzione del contesto e del campo in cui la creatività viene applicata e valutata. Come ho accennato, la creatività non riguarda soltanto il campo artistico, ma costituisce un elemento indispensabile anche in altri settori quali la scienza e la tecnologia. Il motivo per cui questo saggio concentra l’attenzione sull’arte – e sulla musica in particolare – è 153


legato al desiderio di dimostrare come, perfino in un settore in cui la creatività viene applicata paradigmaticamente come proprietà soggettiva e personale, esista la possibilità di analizzare la creatività in termini più oggettivi. Se sarà possibile farlo con successo in un settore soggettivo come l’arte, la trasposizione di questa interpretazione non parziale ad altri campi risulterà a maggior ragione più agevole. Le reti antagoniste generative come modello di creatività Le gan20 sono algoritmi elaborati con lo scopo di analizzare e interpretare i dati di un insieme preesistente e si presentano sotto varie tipologie: auto-generatori variazionali21, metodologie che massimizzano la verosimiglianza22, modelli a energia23 e via dicendo. In base a un’etichetta o a una rappresentazione nascosta, questi modelli sono in grado di prevedere le caratteristiche a essa legate e di generare nuovi dati simili a quelli forniti dal training set. Gli algoritmi generativi sono stati sinora usati soprattutto per la classificazione e la generazione di immagini, ma di recente si è iniziato ad applicarli anche alla generazione di musica24. Nelle pagine che seguono illustrerò la modalità di funzionamento delle gan, soffermandomi in particolare sulla loro applicazione nel campo della generazione di musica. La motivazione che mi porta a concentrarmi su questo modello piuttosto che su altri sta nel fatto che il processo di creazione messo in atto dalle gan è implicitamente diverso da quello di altri algoritmi generativi. Come vedremo, l’interazione tra generator e discriminator che ha luogo nella struttura delle gan conferisce al processo di creazione un considerevole grado di autonomia dal training set. Le gan hanno già ottenuto risultati decisamente migliori rispetto ad altri algoritmi nel campo delle arti visive25. L’applicazione alla musica è più recente e i risultati ottenuti sono meno raffinati. Tuttavia, alla luce delle potenzialità di cui esse hanno già dato prova, ritengo che, sulla scia di futuri sviluppi, le gan saranno in grado di ottenere anche in campo musicale risultati sorprendenti, paragonabili a quelli che hanno già prodotto nella generazione di immagini e video. 154

nota 26

Celebrating J.S. Bach Behind the scenes of the first ever AI-powerd Doodle.

Ho scelto di concentrarmi sull’applicazione delle gan alla generazione musicale perché la musica implica un ampio spettro di aspetti corporei, contestuali e tecnologici che coinvolgono la creatività. Al tempo stesso, quello musicale è un campo particolarmente impegnativo per la composizione algoritmica, a causa della sua dimensione temporale e della sua complessità articolata a più livelli. Porre al centro la generazione musicale non impedisce peraltro di estendere le considerazioni formulate nel corso di questa ricerca all’analisi di altri settori di applicazione della creatività. L’analisi dell’applicazione delle gan al campo della generazione musicale, inoltre, mi darà modo di evidenziare alcune delle difficoltà attualmente sperimentate dalle gan – e il fatto che tali difficoltà non dovrebbero influire sulla nostra possibilità di definirli creativi. L’interesse esercitato dal campo della musica generata dai computer sta raggiungendo un pubblico sempre più vasto, come dimostra per esempio il Doodle creato da Google il 21 marzo 2019 per celebrare J.S. Bach26. Il Doodle in questione offre un’esperienza interattiva che invita gli utenti a comporre una melodia, armonizzandola quindi secondo il caratteristico stile di Bach. L’algoritmo utilizzato dal Doodle è coconet, una rete neurale convoluzionale elaborata da Anna Huang e dal team Google Magenta, tra i principali soggetti che studiano questo settore. Le reti neurali convoluzionali (Convolutional Neural Networks o cnn) si ispirano alla struttura della corteccia visiva degli organismi viventi e vengono quindi applicate principalmente alla generazione e alla classificazione di immagini. Mediante un operatore convoluzionale, le cnn sottopongono l’immagine a una serie di filtri allo scopo di cogliere vari segnali e di riprodurre una mappa dell’immagine stessa che ne conservi la struttura temporale e spaziale. L’analisi degli aspetti specifici del funzionamento di questo algoritmo in relazione alla generazione musicale esula dai propositi del presente saggio. Ciò che mi interessa è invece evidenziare come la creazione e il successo di questo Doodle attestino l’emergere del settore della musica generata dai computer, che si sta aprendo a un pubblico nuovo e più vasto. Al fine di valutare le prestazioni delle gan in questo campo, e di analizzarne il livello di creatività, è tuttavia importante esaminare 155


più dettagliatamente i meccanismi impliciti in questo algoritmo – ciò che mi propongo di fare nel paragrafo che segue. Come funzionano le gan Le reti antagoniste generative sono venute alla ribalta come nuova tipologia di algoritmo generativo non supervisionato27. Una gan è composta da due reti neurali, un generator e un discriminator. Il generator ha il compito di produrre nuove occorrenze di dati, di cui il discriminator valuta l’autenticità. Tale modello si definisce “antagonista” in quanto il generator e il discriminator vengono posti l’uno contro l’altro in quello che Goodfellow definisce un gioco del gatto con il topo: «Il modello generativo si può immaginare come una squadra di falsari che tentano di produrre valuta falsa e di servirsene senza essere individuati, mentre il modello discriminativo è simile alla polizia che tenta di individuare la valuta contraffatta. La competizione nell’ambito di questo gioco spinge entrambi i gruppi ad affinare i propri metodi, sino a quando le contraffazioni risultano indistinguibili dai prodotti autentici»28. Lo scopo del generator è ingannare il discriminator inducendolo a credere che ciò che è stato prodotto sia un campione appartenente al set di dati iniziali (training set). Lo scopo del discriminator è cogliere in fallo il generator ogni qual volta esso produce un campione falso. Le due reti neurali, generator e discriminator, vengono addestrate simultaneamente in un gioco di minimax a due giocatori e sono indotte dalla competizione a migliorare se stesse. La condizione ideale si raggiunge quando il discriminator valuta sistematicamente in 0,5 la probabilità che l’input fornito dal generator sia reale. Ciò significherebbe che il generator ha imparato a produrre un output indistinguibile dai campioni usati per l’addestramento, e che il discriminator non è indotto a ritenere erroneamente che l’output sia falso, ma lascia aperta la possibilità che esso sia autentico o falso. La funzione principale delle gan è generare da zero nuovi dati indistinguibili da quelli contenuti nel training set. Lasciato a se stesso, il generator non produrrebbe altro che rumore casuale. Il ruolo del discriminator è guidare il generator, fornendogli un feedback che lo incentivi 156

a creare occorrenze di dati visivamente (o acusticamente) simili ai campioni usati nell’addestramento. Il ciclo di feedback che ha luogo tra il generator, il discriminator e l’insieme di dati è ciò che consente sia al generator sia al discriminator di migliorare le proprie prestazioni. Le gan applicano sostanzialmente lo stesso meccanismo alla generazione di nuove immagini o di nuova musica. Nel caso della musica, come input per il generator vengono utilizzati rumore casuale29, note musicali30 o file midi31, mentre l’output del generator è costituito da melodie32. Un altro modello di uso frequente per la generazione musicale è costituito dalle reti neurali ricorrenti (Recurrent Neural Networks o rnn). Le rnn sono reti neurali che apprendono una serie di elementi grazie a connessioni ricorrenti. In tal modo, «la rnn è in grado di apprendere non soltanto sulla base dell’elemento preso in considerazione in un dato momento, ma anche dal suo stato precedente, e così, in modo ricorsivo, sulla base della sequenza precedente nel suo insieme. La rnn è quindi in grado di imparare delle sequenze – in particolare sequenze temporali, come nel caso dei contenuti musicali»33. La capacità delle rnn di imparare sequenze ne ha fatto uno dei modelli preferiti per la generazione di output temporali come la musica. È legittimo affermare che le rnn producono risultati migliori di quelli delle gan34. La loro struttura, tuttavia, è sostanzialmente diversa. Il ciclo di feedback interni che caratterizza le gan conferisce loro un’autonomia che altri modelli non possiedono. La funzione fitness (un punteggio che valuta in quale misura l’output soddisfi i requisiti specifici della soluzione desiderata) delle gan può infatti provenire dall’interno del sistema, e non da feedback esterni35. Il processo intrapreso dalle gan è simile a quello dell’immaginazione umana: la rete si addestra su un gran numero di dati, li assimila, ricava una rappresentazione relativa alla distribuzione della probabilità e genera nuovi dati. È l’interazione tra generator e discriminator a differenziare le gan da altri modelli algoritmici, e da essa conseguono due vantaggi principali: la capacità delle gan di auto-valutarsi e la loro relativa autonomia da un insieme preesistente di dati. Intendo ora esaminare separatamente questi due vantaggi. 157


Vantaggi e limiti delle gan L’autovalutazione nelle gan L’auto-valutazione, cioè la capacità di formulare giudizi normativi su ciò che produciamo, è stata annoverata da alcuni tra le caratteristiche essenziali della creatività36. Quando intraprendiamo un processo creativo, di norma riflettiamo su ciò che produciamo e cerchiamo di migliorarlo in funzione non soltanto delle reazioni che riceviamo dall’esterno, ma anche delle reazioni interne che ci forniamo da soli. L’auto-valutazione è un processo che chiama in causa molte altre attività e proprietà della nostra mente, quali la consapevolezza e l’intenzionalità. Non sorprende dunque la difficoltà che incontriamo nel mettere in relazione l’auto-valutazione con le macchine: «Sebbene numerosi modelli generativi abbiano raggiunto un notevole grado di raffinatezza, essi non comprendono un elemento di riflessione o di valutazione, e non possono quindi essere considerati in sé alla stregua di sistemi creativi a pieno titolo»37. Tuttavia, escludendo dalla definizione di auto-valutazione altri concetti notoriamente complessi quali quelli di consapevolezza e intenzionalità, è possibile concepirla essenzialmente come la capacità di migliorare la qualità del prodotto sulla base dell’analisi delle prestazioni precedenti. Il ciclo di feedback – che costituisce un elemento vitale dell’architettura delle gan – si può interpretare come un processo di auto-valutazione. L’interazione tra il generator e il discriminator, in effetti, riproduce il processo creativo umano basato su tentativi ed errori. Particolarmente rilevante è il fatto che questo meccanismo di feedback agisca all’interno delle gan e non presupponga attori esterni. Tradizionalmente, la computazione evolutiva interattiva si serve di giudici umani per la valutazione nei casi in cui una funzione di fitness è ignota o risulta troppo complessa da determinare (come nel caso delle qualità estetiche nel campo delle arti)38. In tali casi, il feedback proviene dall’esterno e non può quindi essere considerato un’auto-valutazione. Nelle gan, per contro, il feedback proviene dall’interno. Questo, a mio avviso, è uno dei vantaggi che le gan possiedono rispetto ad altri 158

modelli algoritmici, in quanto accresce l’autonomia complessiva del loro processo generativo e, di conseguenza, la loro creatività. A tale riguardo si potrebbe sollevare un’obiezione: le gan non sono realmente autonomi perché fanno affidamento su un training set preesistente. A mio parere questa argomentazione non impedisce di attribuire autonomia alle gan. Anche gli esseri umani, infatti, fanno affidamento su un insieme di dati e istruzioni di addestramento per ogni atto creativo che intraprendono39. Ciò che conta ai fini dell’attribuzione di un certo grado di autonomia al sistema è che esso manifesti indipendenza dopo il completamento della fase di apprendimento e nel corso del processo di creazione. Vi è infine un’ultima caratteristica delle gan che depone a favore della loro natura creativa. Le tipologie di apprendimento sulle quali si è sinora concentrato l’apprendimento automatico sono: apprendimento a memoria, apprendimento da istruzioni, apprendimento per analogia, apprendimento da esempi e apprendimento dall’osservazione40. Il tipo di apprendimento più comunemente applicato ai modelli generativi è l’apprendimento da esempi. A mio avviso, tuttavia, il generator di una gan non si limita ad apprendere dagli esempi: apprende facendo41. Il processo di apprendimento del generator fa infatti forte affidamento sulla competizione che lo contrappone al discriminator. Il generator migliora le proprie prestazioni rivaleggiando con il discriminator e producendo ogni volta un risultato migliore del precedente. Questo processo di apprendimento è simile a quello intrapreso dagli stessi esseri umani ogni qual volta si misurano con un’attività o con un argomento nuovi. Certo, gli algoritmi mancano tuttora di una dimensione corporea, un elemento che svolge un ruolo essenziale nei processi di apprendimento umani42. Non è escluso, tuttavia, che i progressi nel campo della robotica consentano loro di acquisire in futuro funzioni e capacità di tipo percettivo. L’auto-valutazione e la capacità di apprendere facendo si possono considerare due caratteristiche delle gan che depongono a favore della loro possibilità di intraprendere processi creativi. Nel paragrafo che segue esaminerò un ulteriore vantaggio delle gan – la loro relativa autonomia da un insieme preesistente di dati. 159


Autonomia da un insieme preesistente di dati I software di composizione musicale sono perlopiù programmati per imitare lo stile della musica contenuta nel materiale usato per l’addestramento43. L’imitazione, tuttavia, può non essere ritenuta sufficiente a riconoscere autonomia creativa a un sistema44. Una recente evoluzione delle gan sta tentando di conseguire un’indipendenza dal training set sufficiente a far sì che l’output non costituisca una semplice imitazione dei campioni forniti durante la fase di addestramento, ma una creazione maggiormente autonoma. Questo modello, rappresentato dalle cosiddette reti antagoniste creative (can), mira a deviare dal training set e a dare vita a un nuovo stile: «La rete è progettata per generare arte che non si ispiri a movimenti o stili artistici consolidati – tenta invece di generare arte che susciti la massima confusione negli spettatori umani che tentano di stabilire in quale stile rientri»45. Gli autori che descrivono il meccanismo delle can affermano che esso «tenta di accrescere l’ambiguità stilistica e le deviazioni dalle norme stilistiche, evitando nel contempo di discostarsi eccessivamente da ciò che viene accettato come arte. L’attore tenta di esplorare lo spazio creativo deviando dalle norme stilistiche consolidate, e genera così nuova arte»46. Una conseguenza interessante delle can è che, in assenza di interventi umani, l’algoritmo devia dalle norme stilistiche del training set generando dipinti astratti. I creatori delle can hanno ravvisato qui un’analogia tra la traiettoria della storia dell’arte umana e il percorso imboccato dalle can: in entrambi i casi, gli attori hanno «optato» per l’astrazione. Definire che cosa sia uno stile è problematico in sé47. Ai fini della presente discussione, intendo per “stile” un insieme di tratti riconoscibili che viene replicato in una successione di occorrenze e che presenta elementi di unicità. Si tratta indubbiamente di una definizione vaga e suscettibile di critiche48. In questa sede, tuttavia, mi preme non tanto stabilire che cosa si possa identificare come stile, bensì mettere in luce come la produzione di risultati che presentano determinate caratteristiche uniformi che permettono di differenziarli da altre occorrenze (ciò che definisco uno “stile”) si possa interpretare come una misura della creatività di un sistema. 160

p. 26

QR Code

Si può qui tracciare un parallelo tra il campo delle arti visive e quello dei giochi. La famigerata «mossa 37» con cui AlphaGo ha battuto Lee Sedol, campione mondiale di Go, si può considerare un esempio di nuovo stile di gioco49. AlphaGo ha sorpreso il pubblico e il suo avversario con una mossa completamente diversa da qualsiasi altra mossa compiuta nella storia di questo gioco. Spesso essa viene definita una mossa che un essere umano non avrebbe mai potuto compiere, in quanto sovverte tutti i modelli e gli schemi utilizzati nella tradizione secolare del gioco – ed è stata questa mossa a indurre alcuni ad attribuire creatività e intuito ad AlphaGo. Le can non hanno ancora dato vita a un nuovo stile riconoscibile come tale. Ritengo tuttavia che abbiano imboccato la direzione giusta verso lo sviluppo di un sistema sempre più autonomo da un insieme preesistente di dati e dal feedback esterno, e che possieda quindi le caratteristiche essenziali che autorizzano a definirlo creativo. I limiti delle gan

pp. 56-73

Le gan hanno rappresentato una rivoluzione per gli algoritmi generativi, consentendo il raggiungimento di risultati precedentemente impensabili. Non per questo sfuggono alle critiche, legate a due motivazioni principali: addestrarle è estremamente difficoltoso e (nel campo della generazione musicale) i loro risultati sono inferiori a quelli di altri modelli algoritmici. L’addestramento delle gan richiede il raggiungimento di un equilibrio di Nash tra generator e discriminator50. Le gan, tuttavia, vengono solitamente «addestrate mediante tecniche di diminuzione del gradiente progettate allo scopo di individuare un valore basso di una funzione di costo, più che di raggiungere l’equilibrio di Nash nell’ambito di un gioco»51. Di conseguenza, l’addestramento risulta spesso instabile52. L’interazione tra il generator e il discriminator – proprio la caratteristica che rappresenta un vantaggio per le gan e per la loro creatività – causa alcune difficoltà nella fase di addestramento. Per far fronte alla difficoltà di addestramento delle gan sono state proposte varie soluzioni, nessuna delle quali sembra tuttavia particolarmente efficace53. 161


Un’ulteriore difficoltà riscontrata nell’applicazione delle gan alla generazione musicale è rappresentata dalla qualità palesemente inferiore del loro output a paragone di quello di altri algoritmi di generazione musicale. Per esempio le rnn, l’altro modello di nota 54 generazione musicale a cui si è accennato sopra, sono in grado di produrre musica che mostra una struttura più coerente e melodie che risultano più equilibrate e più facili da seguire rispetto ai risultati prodotti dalle gan54. nota 54 Come ho già accennato, mentre nel caso della musica le gan Esempi generati faticano a produrre risultati esteticamente riusciti, in altri campi con rnn e con gan. – in particolare la produzione di immagini e video – esse costituiscono al contrario l’algoritmo d’avanguardia. Opere d’arte composte mediante gan sono state vendute all’asta sia da Christie’s sia da Sotheby’s55; le gan sono in grado di creare volti di celebrità fittizie56, e di recente sono riuscite perfino a dare vita a immagini in movimento sulla base di un unico fotogramma statico57. Benché tali risultati possano suscitare preoccupazioni in merito al loro possibile impiego nel campo delle fake news e degli attacchi contro gli avversari, essi esemplificano nondimeno il successo e le enormi potenzialità di questi algoritmi in molteplici campi di applicazione. Nel caso della musica, una possibile soluzione atta a migliorare la qualità estetica delle melodie prodotte dalle gan consiste nell’affiancarle ad altri modelli generativi. Per esempio, si potrebbe affiancare la creatività delle gan alle buone prestazioni conseguite dalle rnn nella creazione di strutture temporali coerenti, nell’ambito di un c-rnn-gan58. In alternativa, si potrebbero accoppiare le gan alle cnn allo scopo di sfruttare da un lato le potenzialità delle gan, e dall’altro la capacità di gestire grandi moli di dati e di conservare la coerenza delle strutture temporali che caratterizza le reti convoluzionali59. A ogni modo, ritengo che la qualità inferiore della musica prodotta dalle gan rispetto ad altri algoritmi non riduca il livello di creatività che si può ascrivere alle gan stesse. Come affermavo all’inizio, infatti, la creatività va misurata in funzione del processo, e non della qualità del prodotto. Il giudizio umano è stato ampiamente utilizzato allo scopo di valutare il livello di creatività o la qualità dei risultati degli algoritmi genetici per la generazione mu162

sicale60. Se tuttavia l’uso di un feedback umano può risultare utile ai fini del miglioramento del sistema in sé, non lo è a mio avviso quando l’obiettivo è indagare sul concetto di creatività. L’interpretazione della qualità e della creatività di un prodotto è soggettiva, e dipende da una serie di fattori individuali e contestuali61. Inoltre, la qualità di un prodotto non dipende dalla creatività del processo che ha condotto alla sua creazione. Se una studentessa d’arte realizza un disegno la cui qualità è inferiore a quella di un disegno realizzato da un artista di professione, ciò non chiama in causa la creatività degli studenti d’arte, ma semmai l’inesperienza della studentessa. Analogamente, non possiamo giudicare la creatività di un algoritmo sulla base della qualità del suo output. Conclusioni

https://bit.ly/3dV3M7S

Intelligenza Artificiale, arte algoritmica e paternità dell’opera, Valentina Andrea Sala, «Artribune», 2018.

In questo saggio ho discusso la questione della possibilità o meno di considerare creativi gli algoritmi di generazione musicale. Ho proposto una definizione minima della creatività quale processo autonomo di risoluzione dei problemi e ho misurato le prestazioni delle gan in funzione di tale definizione. La mia conclusione è che grazie alla loro relativa autonomia da un insieme preesistente di dati e alla capacità di auto-valutazione delle loro prestazioni attraverso un ciclo di feedback tra generator e discriminator, le gan possono legittimamente candidarsi a essere riconosciute come creative – almeno in senso limitato. In questo paragrafo conclusivo intendo segnalare un settore in cui i risultati ottenuti potrebbero svolgere un ruolo importante e accennare a possibili sviluppi di ricerca. Come ho già affermato, l’indagine sulla creatività non è limitata al campo delle arti. I processi creativi sono comuni in molte altre discipline, dalla tecnologia alle scoperte scientifiche, fino alla creatività sociale62. Giungere a una migliore comprensione di che cosa sia la creatività può risultare particolarmente utile al dibattito che concerne il copyright e la proprietà intellettuale. Le considerazioni legali sulla titolarità devono dare risposta all’interrogativo relativo a che cosa sia necessario per conseguire la titolarità del copyright. Accanto all’originalità e alla novità, la creatività è un elemento che 163


viene ritenuto imprescindibile dalle legislazioni di vari Paesi perché sia possibile riconoscere un prodotto come degno di tutela del copyright63. Il problema è che la creatività non è stata sinora pienamente definita dalle normative sul copyright64. Questa indeterminatezza è causa di notevoli incertezze, specie sulla questione della creatività nel campo dell’intelligenza artificiale. Gli ultimi anni hanno visto diversi casi di collaborazione tra esseri umani e intelligenze artificiali nella generazione musicale. Ciò che occorre accertare, quindi, è il ruolo svolto dai soggetti che contribuiscono al prodotto finale: i musicisti umani, i programmatori e gli stessi software. Una discussione informata sulla creatività nel campo dell’intelligenza artificiale e sull’autonomia delle intelligenze artificiali rispetto agli esseri umani potrebbe contribuire a chiarire la questione della contitolarità e del copyright65. Concludo evidenziando un’ulteriore direzione di ricerca che potrebbe scaturire dalla discussione condotta in questo saggio riguardo alla creatività e all’intelligenza artificiale. Prenderò le mosse da una provocazione: se anche un’intelligenza artificiale fosse in grado di riprodurre il processo creativo umano in campo musicale e generare creativamente un prodotto musicale proprio come farebbe un musicista umano (compositore, interprete o improvvisatore), faticheremmo comunque, in termini intuitivi, a definire «creativa» tale intelligenza artificiale e ad attribuire ai suoi prodotti lo stesso valore che attribuiamo ai prodotti della creatività umana. Delle due l’una: o tale intuizione è corretta – e la creatività umana presenta dunque alcune caratteristiche speciali che le macchine non possono condividere – oppure è scorretta, e noi umani siamo implicitamente parziali nel valutare la possibilità per le macchine di intraprendere atti creativi e dare origine a prodotti creativi. Al fine di stabilire quale di queste due opzioni sia valida, potrebbe essere utile condurre esperimenti comportamentali atti a testare l’intuito e la parzialità degli ascoltatori nei riguardi della creatività delle macchine. Sono già stati condotti esperimenti relativi alla ricezione da parte degli ascoltatori della musica generata da intelligenze artificiali66. A mio avviso, tuttavia, sarebbe più utile condurre esperimenti basati su informazioni “manifeste”, i cui partecipanti fossero al corrente dell’origine artificiale della musica 164

e pienamente informati riguardo ai processi che ne determinano la creazione. Ho già accennato alle critiche mosse nei riguardi dei test di Turing67, e concordo sul fatto che in questo contesto – dal momento che ciò su cui occorre indagare è il processo di creazione e non i suoi prodotti – un test di Turing non servirebbe ai nostri scopi. Si può ritenere che noi tutti condividiamo l’intuizione secondo cui i processi creativi implicano qualcosa di speciale rispetto ad altre attività più ordinarie. Questo carattere speciale della creatività è stato interpretato in vari modi – come valore, originalità, intenzionalità e via dicendo68. Queste sono tutte caratteristiche che vengono di norma considerate esclusivamente – e perfino paradigmaticamente – umane. Nell’analizzare e discutere il tema della creatività, dobbiamo essere consapevoli dei pregiudizi impliciti che potremmo albergare in relazione a questo concetto, che potrebbero influire sulla nostra valutazione delle potenzialità creative degli attori sia umani sia artificiali. La speranza è che la ricerca che ho esposto in questo saggio e le ulteriori indagini che potranno essere condotte possano contribuire a dare risposta agli interrogativi che riguardano la creatività nei sistemi di intelligenza artificiale. Un risultato ancor più importante che potrebbe scaturire dalle ricerche, tuttavia, sarebbe quello di conseguire una migliore comprensione dei meccanismi della creatività umana, un campo tuttora in gran parte ignoto, che abbonda di interrogativi irrisolti.

165


La Famille de Belamy e i Sogni elettrici di Ukiyo: reinterpretazioni e accelerazioni

La Famille de Belamy

Obvious

Il Conte de Belamy

La Contessa de Belamy

La Duchessa de Belamy

Il Duca de Belamy

Il Barone de Belamy

L’Arcivescovo de Belamy

Il Marchese de Belamy

Madame de Belamy

1. La Famille de Belamy, Obvious 2018. L’albero genealogico della famiglia Belamy, che attraversa l’arte della ritrattistica europea nei secoli, visto dalla prospettiva di una intelligenza artificiale. https://obvious-art.com/gallery-obvious/

166

Edmond de Belamy

La Baronessa de Belamy

Il Cardinale de Belamy

Undici ritratti che rappresentano personaggi aristocratici in un’ampia varietà di periodi storici, caratterizzati da elementi visivi comuni: un aspetto in qualche misura sfocato, con scie di pixel espansi, una cornice dorata e una formula matematica a mo’ di firma. La Famille de Belamy (dove «Bel Ami» è un riferimento a Ian Goodfellow, l’inventore delle gan), è una raccolta di ritratti che hanno la particolarità di essere stati creati mediante reti antagoniste generative. I vari ritratti sono collegati da un albero genealogico, che assume significati diversi a seconda del modo in cui lo si osserva. Sul piano verticale esso ritrae i diversi periodi della storia dell’arte, tutti rappresentati nel set di dati da 15.000 immagini utilizzato come input. Sul piano orizzontale, ogni diramazione della famiglia rappresenta un futuro reso possibile dallo sviluppo dell’intelligenza artificiale nella nostra società. Creando questa serie di ritratti, che hanno conseguito un’ampia notorietà, Obvious ha contribuito allo sviluppo dell’uso degli algoritmi di apprendimento automatico in campo artistico, aprendo il mercato dell’arte contemporaneo a nuovi tipi di opere e offrendo una serie di elementi utili a un dibattito sui risvolti 167


sociali e filosofici dell’uso di algoritmi che aspirano a replicare la creatività nelle loro procedure. Alla base di questa serie di ritratti vi è la volontà di offrire un modo nuovo di guardare al nostro retaggio artistico e culturale, attraverso nuovi occhi che fanno affidamento principalmente sulla logica – occhi costituiti da una serie di algoritmi. Le gan sono potenzialmente in grado di offrire questi nuovi occhi. Dal momento che i tre membri del collettivo artistico sono originari dell’Europa occidentale, i nostri pregiudizi mentali ci hanno sospinti in direzione della ritrattistica europea, che ci sembrava rappresentare al meglio ciò che l’arte significa per noi e al tempo stesso offrire una base ideale per il dibattito e per la comprensione del funzionamento degli algoritmi delle gan. Fortunatamente, la cultura europea è ampiamente diffusa in tutto il mondo, e la maggior parte delle persone sono in grado di identificarsi con questo tipo di arte, essendovi entrate in contatto tramite i musei o i libri di storia. Più ancora che nei risultati, tuttavia, l’aspetto più affascinante di questo nuovo modo di fare arte sta nel processo in sé. Lo strumento assume un ruolo più decisivo e centrale nel processo di creazione. Gli algoritmi possono ancora essere paragonati a dei pennelli, ai quali tuttavia viene demandata la fatica del processo creativo, attraverso le schede grafiche ad alta efficienza utilizzate per l’elaborazione. Si possono paragonare anche a una macchina fotografica, ma anche in questo caso viene loro demandata una parte del processo di creazione visiva e quindi una certa dose dell’inventiva – vi è chi direbbe della creatività – tipica di un artista. Ciò significa che un artista che lavora con gli algoritmi delle gan non dà alcun contributo al processo in termini di inventiva? No: significa semplicemente che l’artista concentra la sua creatività su altre variabili del processo, o si serve di un tipo diverso di creatività, e che la creazione visiva viene sempre più delegata allo strumento. Alcuni degli aspetti su cui l’artista si concentra sono la scelta del tema, le ricerche legate alla decisione di trattare tale tema, la ricerca dell’ispirazione – che si traduce qui nella ricerca e nella scelta dei componenti del database utilizzato come input per l’algoritmo – la programmazione e la messa a punto dell’algoritmo e dell’intero processo basato su tentativi ed errori, e la scelta del mezzo espressivo. 168

Le gan come catalizzatori di un nuovo tipo di creatività Le reti antagoniste generative sono insiemi di algoritmi che stanno acquistando crescente notorietà nel campo della ricerca sull’apprendimento automatico. Un aspetto particolarmente affascinante è che questi algoritmi funzionano, ma non riusciamo a capire come funzionino esattamente. La nostra storia prende le mosse da questa semplice affermazione, e dalla presa d’atto che non capiamo nemmeno come funzioni il nostro cervello. Gli algoritmi vengono creati allo scopo di replicare e automatizzare comportamenti umani, perciò il loro percorso di deduzione deve basarsi sul modo di pensare del loro creatore. Ma che cosa avviene quando gli algoritmi iniziano a manifestare caratteristiche deduttive per le quali non li abbiamo espressamente programmati? Si può pensare che abbiamo programmato involontariamente un comportamento che effettivamente possediamo, e che non siamo in grado di descrivere? E in tal caso, può essere opportuno sforzarci di comprendere come l’algoritmo sia giunto al risultato che stiamo osservando, allo scopo di comprendere meglio come funziona il nostro cervello – o di scoprire un modo di pensare interamente nuovo, sviluppato dall’algoritmo durante la sua fase di apprendimento? L’interrogativo era così profondo e suggestivo che abbiamo ritenuto di non poter giungere da soli a una risposta. La questione riguarda ogni singolo essere umano del pianeta che condivida il nostro desiderio di imparare e di risolvere problemi. Perché dunque non attingere al contributo di tutti per risolvere il problema? Per rendere chiara a tutti la questione abbiamo deciso di esporla in termini universali, tentando di raggiungere il maggior numero possibile di persone caratterizzate da una pluralità di origini, mentalità, abitudini e opinioni. Per fare sì che tutti questi cervelli diversi si concentrassero su un unico tema ci occorreva un linguaggio universale. A tale scopo abbiamo scelto un mezzo espressivo tangibile, accessibile, interpretabile – e soprattutto gratuito! Abbiamo scelto cioè l’arte. La base di partenza del nostro processo creativo è stata costituita dal messaggio che intendevamo trasmettere. Era un messaggio 169


molto semplice: «Ciao a tutti, nel campo della ricerca esiste questo affascinante tipo di algoritmo – voi che ne pensate?». Vi erano inoltre alcune limitazioni. Il messaggio doveva essere universalmente comprensibile, ed era necessario che risultasse quanto più semplice possibile. Per raggiungere tale obiettivo abbiamo deciso di lavorare sull’arte così come la concepiva la nostra mentalità occidentale carica di pregiudizi: e cioè sulla ritrattistica classica. Per farlo abbiamo raccolto un gran numero di immagini di dipinti, scegliendole in modo tale da creare un insieme di dati dalla varietà molto limitata, così da permettere agli algoritmi di comprendere meglio il risultato che intendevamo ottenere. Nel frattempo, abbiamo iniziato a costruire il nostro modello sulla base di progetti di ricerca realizzati precedentemente da altri. Una volta ottenuto un risultato soddisfacente, giocando sia sui parametri degli algoritmi, sia sui dati da noi sottoposti agli algoritmi stessi, abbiamo condotto un’ultima fase di addestramento degli algoritmi, che ha dato vita alle immagini che oggi conoscete sotto il nome di Famille de Belamy. A causa della varietà dell’insieme di dati originale in termini di genere, stili, movimenti artistici, eccetera, anche l’output mostrava una varietà molto interessante. Il nostro ruolo come artisti è consistito nel rendere giustizia a tale diversità nella serie di immagini che avremmo presentato al mondo. Dopo numerose discussioni, abbiamo deciso di selezionare undici ritratti, scelti in funzione di un obiettivo preciso: dimostrare quanto più possibile la potenza di questi algoritmi. Prevedendo che ben presto sarebbe sorto un acceso dibattito riguardo alla creatività delle macchine, ci siamo sforzati di offrire una varietà di esempi che servissero da base per tale dibattito. Ci occorreva infine che le opere d’arte risultassero chiare in sé, e non richiedessero la spiegazione da parte nostra dell’approccio utilizzato. Abbiamo scelto con cura il mezzo espressivo da utilizzare, e abbiamo deciso di offrire allo spettatore una chiave di interpretazione che gli consentisse di cogliere che nelle immagini artistiche che stava osservando vi era qualcosa di insolito. A tale scopo abbiamo deciso di inserire manualmente la formula degli algoritmi da noi utilizzati per creare la serie di immagini, così come un artista inserirebbe la propria firma nelle sue opere. 170

REAL

TRAINING SET

2. Architettura base di una gan addestrata da Obvious per creare i ritratti della Famille de Belamy.

FAKE

RANDOM NOISE

FAKE IMAGE

Questo processo di creazione rispecchia quello da noi utilizzato per tutto ciò che creiamo. In un certo senso, è molto simile a quello di un artista tradizionale – che parte da un messaggio e da un’immagine mentale basata su ispirazioni tratte da ciò che ha realizzato in precedenza, e tenta quindi di avvicinarsi a quell’immagine ideale servendosi degli strumenti che ha a disposizione. La differenza principale sta nello strumento usato per raggiungere questo ideale. E uno degli aspetti più interessanti delle gan sta nelle potenzialità sorprendenti che caratterizzano questi algoritmi – il fatto che alcune delle immagini da essi create non sarebbero mai potute nascere dalla nostra fantasia. Da dove arrivano allora queste immagini? Concentriamoci sul processo di creazione utilizzato dall’algoritmo. Per comprenderlo meglio dobbiamo immaginare noi stessi al posto dell’algoritmo a cui vengono date istruzioni di creare un’immagine da zero. L’esempio potrebbe valere anche per la creazione di una poesia, di una canzone o di qualsiasi altro tipo di creazione artistica. Immaginate di essere al buio, e di non possedere né vista, né udito, né tatto. Se vi venisse chiesto di creare qualcosa, con ogni probabilità il risultato sarebbe un’immagine nera e uniforme. Ora immaginate di acquisire il senso della vista. Ciò viene ottenuto mediante la visione computerizzata, che permette alla macchina di analizzare un’immagine, un pixel per volta, e di ricavarne forme e colori. 171


Nel nostro caso, questa è la base del processo di apprendimento, che permette all’algoritmo di accedere ai dati – una necessità basilare che potremmo paragonare a una sorta di nutrimento del pensiero. Una volta ottenuto l’accesso a tale nutrimento, ci viene mostrata un’immagine. L’output prodotto sulla base di questo input sarà con ogni probabilità la stessa identica immagine, poiché essa rappresenta l’unico riferimento di cui l’algoritmo dispone. Quando però ottiene l’accesso a più immagini, il nostro cervello inizia automaticamente a coglierne gli elementi comuni, tentando di ricavarne un senso. Dopo aver appreso quali siano questi elementi comuni, saremo in grado di creare un’immagine completamente nuova. Analogamente, le reti antagoniste generative o gan analizzano decine di migliaia di immagini, apprendono a riconoscerne le caratteristiche e vengono addestrate a creare nuove immagini indistinguibili dai dati originali. Questi modelli sono in grado inoltre di escludere qualsiasi immagine non rilevante (che cioè non ha un numero sufficiente di caratteristiche in comune con le altre immagini). Anche questa è un’operazione che viene svolta dal nostro cervello quando esso stabilisce delle priorità tra le informazioni. Gli algoritmi delle gan sono in grado di replicare anche il concetto di novità. Perfino sulla base degli stessi input, l’algoritmo genera ogni volta un risultato diverso. Questo rispecchia uno dei tratti della creatività umana: non creiamo mai la stessa cosa per due volte, così come è impossibile chiedere a un individuo di creare due volte la stessa cosa nello stesso istante. E tra due momenti successivi, il peso di ciascun fattore che influisce sulla creazione risulta modificato. Proviamo a rendere le cose più interessanti. Immaginiamo di chiedere a un algoritmo di creare un’immagine che sia bella. La bellezza è un concetto soggettivo – non esistono risposte giuste o sbagliate. Esiste però una risposta statisticamente ottimale. Una possibilità consiste nell’applicare delle etichette (meta-dati) alle immagini utilizzate come input (o “nutrimento”). Se mi venisse detto quali immagini sono state considerate più gradevoli, io sarei in grado di intensificare il mio addestramento su queste immagini, creando un’immagine che si avvicini maggiormente a esse. Entriamo ora in un terreno squisitamente teorico. Se mi venisse chiesto di creare un’immagine utile, avrei la necessità di comprendere le numero172

se sfumature dell’effetto che un’immagine è in grado di produrre – facendo riferimento ai miei ricordi che trasmettono messaggi di allegria o di tristezza. Si può immaginare la complessità di questo compito in relazione alle etichette, che dovrebbero essere necessariamente molto numerose e molto specifiche, e contenere un’enorme quantità di informazioni sulle immagini. Infine, se mi venisse chiesto di creare qualcosa che rispecchi la mia personalità, dovrei riconoscere e identificare come specificamente miei determinati tratti della personalità, e metterli in relazione a un contenuto grafico in modo tale da rispecchiarli e produrre l’effetto desiderato nello spettatore. Siamo assai lontani dal poter riprodurre tutto ciò mediante algoritmi. Le gan non sono i soli modelli a misurarsi con la creatività, ma stanno attirando l’attenzione della comunità scientifica in quanto sono in grado di modellare distribuzioni di dati di grandi dimensioni. Come si può notare, la creatività si può suddividere in più «gradini» caratterizzati da una crescente complessità. Per il momento non conosciamo tutti i gradini del percorso, e men che meno siamo in grado di riprodurli mediante algoritmi. Siamo tuttavia in grado di creare immagini uniche, nuove e somiglianti a quelle reali. Le gan sono strumenti affascinanti che non comprendiamo appieno. Non siamo ancora riusciti a capire le ragioni che si celano dietro la creazione di queste immagini. Tutto ciò che sappiamo è che questi strumenti sono catalizzatori estremamente potenti della nostra creatività. Ci consentono di creare sulla base di un’idea e di esempi, sostituendo la conoscenza delle tecniche tradizionali della pittura o del disegno con quella dell’apprendimento automatico e della programmazione. Questi modelli sollevano numerosi interrogativi di natura filosofica. Il più importante riguarda probabilmente una questione a lungo dibattuta – se il nostro cervello, cioè, operi come un sistema predittivo di algoritmi complessi, prendendo decisioni e innescando le reazioni del corpo in funzione degli input che riceve. A questa teoria si può contrapporre quella secondo cui ogni essere umano possiede un’anima, un’entità interiore che ci definisce come individui. Le gan forniscono un ulteriore elemento da inserire nel dibattito, che può risultare utile a entrambi i percorsi di ragionamento. 173


3-4. Il Conte, la Contessa de Belamy, Obvious 2018. Algoritmi gan, stampa inkjet su tela, 70 × 70 cm.

La Famille de Belamy e l’ingresso dell’intelligenza artificiale nel circuito delle case d’aste Non ci aspettavamo che sarebbe stato facile lanciare nel mondo dell’arte un mezzo espressivo completamente nuovo, e l’idea che le macchine possano partecipare ancor più a fondo al processo creativo facendosi carico di una parte dei processi artistici che sono da sempre appannaggio esclusivo degli artisti. E sulle prime non lo è stato affat- https://bit.ly/3gjUDHB to. Nella maggior parte dei casi, gli esponenti della comunità artistica Is artificial intelligence set con cui siamo entrati in contatto inizialmente non consideravano arte to become art’s next medium? queste creazioni, o non desideravano assumersi la responsabilità di promuovere questo tipo di arte nel mercato contemporaneo. Ripensando a quella fase, riteniamo che la responsabilità vada attribuita a una diversa percezione degli strumenti che stavamo utilizzando. Per noi erano soltanto uno strumento molto potente, ma hanno fatto scattare una serie di equivoci alimentati nell’ambito della società da anni di fantascienza, 174

5-6. Il Duca, la Duchessa de Belamy, Obvious 2018. Algoritmi gan, stampa inkjet su tela, 70 × 70 cm.

suscitando un dibattito sull’intelligenza artificiale “generale”, dotata di coscienza e intenzioni – che non è affatto ciò con cui abbiamo a che fare oggi. Le prime persone che hanno dimostrato interesse per il nostro lavoro appartenevano perlopiù ad ambiti tecnici, o quantomeno possedevano qualche nozione riguardo al funzionamento di queste tecnologie, oltre a un notevole interesse per le implicazioni filosofiche della creazione di opere d’arte mediante questi algoritmi. Una volta che abbiamo ottenuto questo iniziale diritto di accesso, il mondo dell’arte ha iniziato a guardare con curiosità alle nostre opere. Un artista parla della sua epoca, della società che lo circonda e delle interazioni che ha con essa. L’intelligenza artificiale è in circolazione ormai da qualche tempo, e meritava di avere un posto nel mondo dell’arte, considerata la mole sempre crescente di interazioni che abbiamo con essa nella nostra vita di ogni giorno. Ma un primo autentico segnale di accettazione da parte del mondo dell’arte contemporanea è stato rappresentato dall’asta tenuta il 25 ottobre 2018 presso Christie’s, a New York. Una delle 175


7-8. Il Barone, la Baronessa de Belamy, Obvious 2018. Algoritmi gan, stampa inkjet su tela, 70 × 70 cm.

opere della serie Belamy, Edmond de Belamy, è stata venduta a 432.500 dollari, un prezzo pari a circa 45 volte la stima più elevata. A partire da quel momento, l’atteggiamento del mondo dell’arte nei confronti di questa nuova tecnologia è drasticamente mutato. Il fatto che una delle istituzioni più prestigiose del mondo dell’arte contemporanea abbia scelto di saggiare la risposta del mercato a questo tipo di opere – ciò che la maggior parte degli altri operatori di quello stesso mercato era riluttante a fare – e il fatto che tale risposta sia stata così sensazionale, ha mutato la visione complessiva dell’intelligenza artificiale da parte del mercato dell’arte. Dopo questo evento, invece di tenersi alla larga dal tema dell’intelligenza artificiale, molte persone hanno iniziato ad interessarsi a essa – non come strumento atto a creare fantascientifiche distopie, bensì per ciò che è oggi: un potente strumento a nostra disposizione che sinora è stato utilizzato perlopiù per migliorare la nostra produttività e la nostra capacità di ottimizzazione, e che può ora essere usato anche per fini didattici e di intrattenimento. Le reazioni a questa 176

9-10. L’Arcivescovo de Belamy, il Marchese de Belamy, Obvious 2018. Algoritmi gan, stampa inkjet su tela, 70 × 70 cm.

prima vendita sono state estremamente eterogenee. L’asta è stata oggetto di grande attenzione da parte dei media – il che, insieme a tutti i commenti che sono stati espressi, ci ha permesso di valutare le diverse reazioni suscitate dal nostro lavoro. Ci riferiamo qui ai qualia relativi alla percezione di Edmond de Belamy. Qualia è un termine filosofico che designa gli aspetti individuali delle esperienze soggettive, coscienti. Abbiamo potuto approfittare di un posto in prima fila per osservare i qualia di Edmond, e l’esperienza si è rivelata affascinante. In queste reazioni abbiamo colto la percezione delle gan e dell’intelligenza artificiale in generale da parte della nostra società. Tali reazioni racchiudono tutti gli aspetti delle percezioni mentali dell’intelligenza artificiale che attraversano la nostra società, e che possono risultare fortemente contraddittorie a seconda del soggetto che percepisce: paura, speranza, collera. Alcuni considerano l’intelligenza artificiale uno strumento pericoloso che rischia di annientare gli artisti; altri la ritengono un elemento al di fuori dalla loro portata, destinato a non avere mai alcun impatto sulla 177


11-12. Il Cardinale de Belamy, Madame de Belamy, Obvious 2018. Algoritmi gan, stampa inkjet su tela, 70 × 70 cm.

loro vita quotidiana. Vi è chi vi ravvisa un promettente ambito di investimento, e chi la considera una bolla economica. Gli uni la ritengono qualcosa che contraddice le leggi della natura, gli altri il logico percorso di sviluppo della specie umana. Scoprire tutti questi punti di vista diversi, improntati a prospettive estremamente specifiche, ha rappresentato per noi un’esperienza grandiosa. Finalmente eravamo giunti al punto in cui il tema di cui ci occupavamo ci aveva completamente eclissati, e poteva vivere di vita propria senza poggiare più sulle nostre spalle. Il fatto di trovarci al centro di questo scambio di opinioni così diverse tra tante persone ci collocava in una posizione così speciale che abbiamo deciso di farne il tema della nostra successiva serie di opere d’arte. La nostra seconda raccolta avrebbe tracciato un’analogia tra questa situazione e quella dell’introduzione dell’elettricità in Giappone. Intendevamo utilizzare questa metafora per parlare della nostra esperienza e per mettere in luce come queste differenze di percezioni, punti di vista e opinioni abbiano sempre accompagnato ogni grande rivoluzione tecnologica. 178

13. Edmond de Belamy, Obvious 2018. Algoritmi gan, stampa inkjet su tela, 70 × 70 cm. Vedi anche 1 p. 8

179


Electric Dreams of Ukiyo: le gan come modalità di reinterpretazione della storia dell’arte Consideriamo le gan uno strumento rivoluzionario. La loro caratteristica più stupefacente è forse la capacità di produrre creazioni nuove. Le immagini prodotte da questi modelli non costituiscono né una miscela né una “media” di tutte le immagini contenute nell’insieme di dati iniziale. Se mostrate a una gan 10.000 immagini, la rete creerà l’immagine 10.001. La sua capacità di attribuire un peso diverso alle immagini a seconda della loro rilevanza, e il fatto che il generator non abbia accesso alle immagini di input, fanno sì che il sistema crei ogni volta un risultato nuovo e unico. Alla luce di ciò, possiamo intravedere enormi possibilità in ogni campo che implichi la creazione. Questo strumento potrebbe fornire un nuovo punto di osservazione di tutto ciò che abbiamo creato in precedenza – compreso un ambito nel quale abbiamo riversato tutte le nostre emozioni nel corso dei secoli: l’arte. L’arte esiste da quando esistiamo noi. Analizzando tutto ciò che abbiamo realizzato, e creando sulla base di tale analisi, potremmo giungere più vicino a comprendere dove risieda l’autentica essenza dell’arte? Ci piacerebbe mettere alla prova questa teoria in funzione di uno stile artistico, di un periodo storico o di un movimento. Con il trascorrere del tempo gli algoritmi diverranno sempre più efficienti e abili nell’imparare, permettendoci di capire di più – sino a cogliere il segreto del singolo artista. Lo abbiamo fatto dapprima con l’arte classica europea, mentre la nostra seconda raccolta si ispira all’arte tradizionale giapponese del periodo Edo, ed è stata creata mediante algoritmi gan. Ancora una volta, abbiamo deciso di attenerci quanto più possibile alle immagini originali utilizzate come input. Abbiamo stampato alcune di queste immagini mediante il moku-hanga, una tecnica di stampa tradizionale che prevede la creazione di vari blocchi di legno intagliati (più o meno uno per ogni colore) e l’applicazione del foglio carta su ciascuno di essi in sequenza. Attenendoci quanto più possibile al tema da noi scelto, e tentando di introdurre un elemento di novità pur nel rispetto delle tradizioni, abbiamo la speranza di inserire opere d’arte generate 180

https://bit.ly/31swuu6

A year after the auction at Christie’s, here is Obvious’ new ai artwork. Filmato in cui i tre membri di Obvious spiegano il loro metodo di lavoro e la nuova opera assieme all’artista Beno dello studio Uki-ga, esperto della stampa tradizionale giapponese moku-hanga.

14. Ukiyo Fine del periodo Edo, 1968. Il mondo fluttuante, terra di sogni e passioni, e i suoi abitanti scoprono l’elettricità. Undici personaggi da undici luoghi differenti, tutti creati usando l’intelligenza artificiale. Clicca su ogni posto per scoprire di più. http://www.obvious-art.com/ukiyo/index.html

Da questa schermata si esplora l'intera collezione della serie Electric Dreams of Ukiyo creata da Obvious nel 2019. «Abbiamo deciso di esplorare l’Uyiko-e (pittura del mondo fluttuante) perché rappresenta uno dei movimenti pittorici giapponesi più influenti nella storia dell’arte. La fine del periodo Edo corrisponde all’arrivo dell’elettricità, una nuova tecnologia piena di promesse di un futuro migliore, ma anche capace di suscitare timori in un Giappone conservatore che si era appena aperto al mondo esterno. Abbiamo trovato interessante il parallelo con le discussioni riguardanti l’influenza che l’intelligenza artificiale può avere sulla nostra società.»

181


Saki of the Dormant Lake

Katsuwaka of the Dawn Lagoon

Okuni of the Shadow Village

Ken of the Two Passes

Dormant Lake Home of the skeptic

Dawn Lagoon Home of the manipulators

Shadow Village Home of the opportunists

Two Passes Home of the traditionalists

Kamio of the Mist Volcano

Mist Volcano Home of the creatives

Chieko of the Catfish Bay

Catfish Bay Home of the lucky

15. Electric Dreams of Ukyo, Obvious 2019. Serie di 22 opere, 11 ritratti e 11 paesaggi, generate da gan allenate con due differenti set di dati di stampe Ukyo-e. Stampa inkjet su carta tradizionale giapponese Washi, formato grande (oban), 56 Ă— 83.

182

183


Bulma of the High Red Pines

High Red Pines Home of the outraged

16-17. Electric Dreams of Ukyo, Obvious 2019. Serie di 22 opere, 11 ritratti e 11 paesaggi, generate da gan allenate con due differenti set di dati di stampe Ukyo-e. Stampa inkjet su carta tradizionale giapponese Washi, formato grande (oban), 56 Ă— 83.

184

185


dalle gan nel solco di questi movimenti artistici. Speriamo inoltre di riuscire a offrire un’interpretazione diversa da quella del critico d’arte – un’interpretazione che dovrebbe risultare imparziale e inedita. Questa nuova visione dell’arte risulta più accessibile, oltre che originale. Consentendo a chiunque di visualizzare l’arte attraverso un nuovo affascinante strumento possiamo imparare qualcosa riguardo non soltanto al tema, ma anche allo strumento stesso, al suo comportamento e al suo funzionamento. È probabile che le future generazioni avranno familiarità con questo strumento, ne afferreranno pienamente la logica e forse si avvicineranno maggiormente alla comprensione del funzionamento del cervello umano. Speriamo che il nostro lavoro aiuti le future generazioni ad avvicinarsi maggiormente alla cultura, e che getti una sorta di ponte tra questo sapere e questa bellezza antichi, la realtà della società odierna e le implicazioni dei vari percorsi di sviluppo che potremmo imboccare. Le gan possono trovare molte altre applicazioni in campo artistico, dall’intrattenimento al restauro. Per esempio, in uno dei nostri primi esperimenti abbiamo cercato di dare a intendere alle gan che le farfalle e i fiori fossero la stessa cosa, sottoponendo agli algoritmi una miscela di immagini caratterizzate da proprietà generali comuni (sfondi verdi, foglie) e differenze limitate ai dettagli (farfalle o fiori). Questo è solo un esempio dei numerosi possibili impieghi delle gan. Possiamo prevedere l’avvento di molti altri impieghi artistici nel futuro, via via che questa tecnologia troverà posto nella società. La nascita dell’arte dell’intelligenza artificiale Analogamente alla comparsa della macchina fotografica nel decennio centrale dell’Ottocento, lo sviluppo delle gan nel mondo dell’arte è verosimilmente destinato a dare vita a un nuovo movimento artistico costituito da opere generate dalle intelligenze artificiali. Queste opere d’arte sono destinate a evolversi insieme alla tecnologia, così com’è avvenuto per la macchina fotografica: le fotografie, inizialmente sfocate, hanno acquisito una risoluzione sempre 186

18. Cocon Floral – Butterflowers collection, Obvious, 2018.

187


19. Dinde (Side b) – Butterflowers collection, Obvious, 2018.

188

20. Lotus du Matin – Butterflowers collection, Obvious, 2018.

189


maggiore nel corso degli anni, e una tecnologia un tempo accessibile soltanto a tecnici altamente qualificati è oggi integrata praticamente in qualunque smartphone, e può essere utilizzata da chiunque per comunicare. La macchina fotografica ha reso possibile per chiunque catturare un istante, un volto, un panorama, aprendo la strada alla riproduzione delle immagini. Molti temevano che artisti quali pittori e scultori divenissero obsoleti. Dopo numerosi decenni, siamo in grado di osservare le conseguenze dello sviluppo di questa tecnologia: se i copisti che realizzavano riproduzioni di dipinti o sculture sono pressoché scomparsi, i pittori – e gli scultori – sono ancora assai numerosi e diversi. Parallelamente è emerso un movimento a sé stante, al quale prendono parte numerosi fotografi di talento che sviluppano nuove capacità legate in modo specifico a questa tecnologia e ai modi in cui può essere utilizzata e modificata. È verosimile che avvenga la stessa cosa in relazione alle gan e più in generale all’arte creata da intelligenze artificiali. Nascerà cioè una nuova generazione di artisti, provvisti di nuove capacità tecniche, che si serviranno di strumenti nuovi per creare, esprimersi, criticare, educare e via dicendo. Nascerà un nuovo mercato destinato a questo tipo di arte, in cui la curiosità sociale e filosofica si affiancherà all’interesse per i progressi tecnologici. Nell’ambito di questo nuovo movimento, l’artista è probabilmente destinato ad avere un ruolo leggermente diverso. Naturalmente, l’artista rimarrà al centro del processo di creazione in quanto portatore del messaggio e dell’approccio artistico che comunica attraverso le opere d’arte da lui create. Nondimeno, la comparsa di questo nuovo intermediario nell’ambito del processo di creazione implica un mutamento nella relazione tra artista e strumento nella fase di creazione. Questo mutamento è dovuto anzitutto al fatto che l’artista fa un passo indietro quando gli algoritmi entrano in funzione. La creazione visiva viene lasciata interamente all’insieme di istruzioni programmate dall’artista, che può soltanto osservare gli elementi visivi che prendono forma. Un elemento che rimane invariato – o che non può essere considerato una regressione – è che l’artista deve ricominciare da capo quando l’addestramento non funziona. Un secondo motivo di questa nuova relazione è legato alla novità e all’imperfezione dello strumento impiegato. Uno 190

degli obiettivi dell’artista è migliorare il suo strumento nel corso del tempo sulla scia dei progressi della ricerca, e mantenersi sempre al passo con le nuove possibilità in modo da disporre sempre di materiale sulla base del quale creare. Sotto questo aspetto, la sua relazione con lo strumento cambia completamente. Strumenti per la prossima generazione di creativi L’arte generata da intelligenze artificiali trae i propri strumenti dalla ricerca sull’apprendimento automatico. Quando Ian Goodfellow ha redatto il suo studio originale sulle gan, il suo intento non era certo quello di dare origine a un nuovo genere artistico. Tuttavia, grazie all’entusiasmo suscitato nella comunità dei ricercatori da questa nuova idea e ai numerosissimi studi successivamente pubblicati sulle gan, lo strumento si è affermato come nuovo metodo per la creazione di immagini artistiche. Non si è trattato di un evento isolato; eventi analoghi sono destinati a ripetersi con il trascorrere del tempo, e i ricercatori continueranno a sviluppare questa tecnologia. Nel campo dell’apprendimento automatico, infatti, il progresso tecnologico procede a ritmi serrati. I numeri non mentono: negli ultimi cinque anni, questa disciplina è stata tra le più seguite (se non la più seguita in assoluto) in ambito universitario nel campo delle scienze del computer. Il numero dei partecipanti e dei documenti presentati alle conferenze sull’apprendimento automatico è in continuo aumento. Altrettanto rapida è la crescita degli investimenti nella ricerca, da parte sia delle istituzioni sia delle aziende. Si possono quindi prevedere importanti progressi tecnologici nel campo dell’apprendimento automatico, destinati ad avere un impatto anche sugli artisti che lo utilizzano, offrendo loro nuove possibilità. Tali progressi saranno con ogni probabilità innescati da nuove idee per la creazione di algoritmi e da nuovi dispositivi dotati di una maggiore potenza di elaborazione da applicare a queste idee. Non sappiamo come saranno le gan del futuro, ma possiamo prevedere con certezza che la ricerca sull’apprendimento automatico continuerà a sfornare nuovi strumenti destinati a essere impiegati per fini artistici. 191


Sta fiorendo una generazione di artisti che utilizzano la programmazione. Si può affermare che ne facciano parte anche gli sviluppatori front end, ma si tratta di un ambito molto più ampio se si prendono in considerazione tutte le tipologie di creazione visiva che si servono della programmazione. Naturalmente, l’intelligenza artificiale rientra in questa generazione, dal momento che fa forte affidamento sulle competenze nel campo della programmazione – sebbene di recente si sia tentato di rendere accessibili questi strumenti anche alle persone che non conoscono la programmazione (come nel caso del software Runwayml). Sebbene molti considerino ingenuamente il programmatore medio come un tecnico la cui creatività è fortemente limitata, la realtà prova il contrario. La programmazione implica una notevole dose di creatività personale, che ne fa uno strumento artistico ideale. La comunità dell’arte generativa è lì a dimostrarlo – da decenni a questa parte. La questione, semmai, è un’altra: in quale misura la programmazione continuerà a essere resa “democratica” nella società del futuro? Sono sempre più numerose le scuole che inseriscono la programmazione nei loro programmi di insegnamento in una fase precoce, e dati i forti incentivi a rendere la programmazione accessibile a tutti, si può prevedere che essa diverrà in futuro assai più comune, perdendo quell’alone di “magia” che possiede oggi agli occhi di molti. In questo testo ci siamo concentrati soprattutto sull’uso dell’intelligenza artificiale per la creazione artistica – in particolare per le stampe e le opere figurative. L’impatto dell’intelligenza artificiale sui processi creativi, tuttavia, è assai più vasto. Qualunque forma di progettazione può potenzialmente trarre beneficio dall’uso dell’intelligenza artificiale – dalle immagini alla creazione di moda, sino alla cucina. Ancora una volta, l’ingresso dell’intelligenza artificiali in questi campi va interpretato come l’introduzione di uno strumento destinato a potenziare la creatività e a offrire nuove possibilità, e non a sostituire il creativo come persona – che continuerà a scegliere il tema e l’intento della sua creazione, nonché a interpretarne l’esito. Un esempio utile è offerto dal progetto «How to Generate (Al- https://bit.ly/3iRbVhn most) Anything» («Come generare (quasi) qualunque cosa»), un’i- How to Generate (Almost) Anything. 192

https://bit.ly/2YW7oSM

The ganfather: The man who’s given machines the gift of imagination. Martin Giles, “mit Technology Review”.

niziativa che illustra esempi concreti delle possibilità che esulano dal campo delle stampe. Il progetto viene presentato come frutto di una collaborazione tra artisti, artigiani e scienziati. Come abbiamo visto nel corso di queste pagine, le gan rappresentano a un tempo uno straordinario terreno sperimentale, che ci consente di utilizzare la nostra creatività per sfruttarne le numerose capacità, e una fonte di ispirazione – una volta ultimata la fase di addestramento. La raccolta quotidiana di una mole di dati sempre crescente rende possibile nuovi esperimenti, che danno vita a un numero ancor più elevato di nuove immagini. Il flusso di ispirazioni così creato può essere utilizzato per alimentare e integrare le nostre idee e per elaborarne di nuove. Per quanto sia assai arduo prevedere le conseguenze di tutto ciò sui vari settori creativi, è lecito attendersi che sempre più persone creeranno per mezzo di questi modelli, integrando in misura diversa l’intelligenza artificiale nelle loro procedure. Siamo di fronte a un’importante tecnologia che sembra destinata a trovare posto nella nostra società più rapidamente di quanto potremmo credere. Se la nostra civiltà imboccherà questa strada, avremo bisogno di crescenti risorse per l’impiego dei modelli che verranno progressivamente scoperti. È anche per questo che è necessario che tutti siano consapevoli dell’esistenza di queste tecnologie. Come già accennato, questi strumenti stanno diventando sempre più accessibili – e se alcuni sceglieranno di usarli a fin di bene, altri potrebbero essere tentati di usarli per fini sbagliati. Le potenzialità creative di questi algoritmi sono destinate a divenire sempre più elevate e accurate, il che consentirà di utilizzarli per la creazione di immagini false e, in ultima analisi, per una sorta di propaganda automatizzata. È dunque necessaria una maggiore consapevolezza a livello generale riguardo a questi temi, in quanto queste tecnologie potrebbero alimentare, oltre a straordinarie scoperte, anche gravi abusi. L’arte continuerà a prendere in prestito strumenti dalla ricerca e a prendere parte ad essa, facendo maggiore luce sulle nuove scoperte e coinvolgendo la società nel suo complesso in un tema destinato infine ad avere un impatto su tutti noi.

193


gan

e musica, on the road Vera Minazzi

Max e il pappagallo Flowy

https://bit.ly/309t2Dh

1. Tre vignette dal fumetto web Max Order realizzato da François Pachet e Fiammetta Ghedini nell'ambito del progetto europeo ERCcOMICS.

Flow Machines

https://www.flow-machines.com/

194

Flow Machines è stato sviluppato a partire dal 2012 dalla Sony Francia nel laboratorio dedicato alla ricerca di strumenti di intelligenza artificiale per musicisti, diretto da François Pachet (oggi a capo del Creator Technology Research Lab di Spotify). Nel 2016, il team di ingegneri e artisti ha realizzato le prime canzoni: Daddy’s Car, ispirata ai Beatles e The Ballad of Mr Shadow nello stile di Irving Berlin e di Duke Ellington. I due singoli, in meno di un mese, sono stati visualizzati sul web da oltre 1,5 milioni di ascoltatori; nel 2018 è uscito Hello World, il primo album. Max Order è un fumetto web su Flow Machines, ideato da Pachet con la sua équipe e disegnato da Fiammetta Ghedini. «Volevamo trovare una storia che dicesse qualcosa di profondo sul progetto di Flow Machines, non una spiegazione tecnica, una storia che fosse interessante in sé e che ci facesse pensare al progetto in una prospettiva diversa, alle sue motivazioni, alle implicazioni e al perché facciamo tutto questo». Flow Machines, come dice Pachet, non ha ispirato la storia di un musicista robot o di uno scienziato pazzo bensì quella di un’aspirante street artist, Maxine detta Max (Max Order è l’algoritmo di Flow Machines), che cerca disperatamente di trovare il suo stile con l’aiuto di un assistente molto speciale, il pappagallo immaginario Flowy (il riferimento è evidente...). Nei 15 episodi pieni di suspance di questo coinvolgente fumetto, alle sequenze della storia di Max e Flowy si alternano dei flash in cui ci ritroviamo al fianco di Pachet (maglione verde e sciarpa gialla) e del suo gruppo mentre discutono su come far procedere la storia e renderla metafora dell’algoritmo Max Order, «una tecnica di intelligenza artificiale che aiuta a comporre musica nello stile di uno specifico autore, evitando il plagio, e usando la copia, ma non troppo!»

Il suono del fallimento (un apparente lateral thinking) «Qualunque cosa in un nuovo strumento ora ti sembri strana, brutta, sgradevole e cattiva, sicuramente diventerà la sua firma. La distorsione dei cd, i tremolii dei video digitali, il suono schifoso a 8 bit: tutto ciò sarà apprezzato ed emulato non appena sarà evitabile. È il suono del fallimento: tanta arte moderna è il suono delle cose che vanno fuori controllo, di un mezzo spinto al limite e che va in pezzi. La chitarra distorta è il suono di qualcosa di troppo forte per lo strumento che dovrebbe veicolarlo. Il cantante blues con la voce incrinata è il suono di un grido emotivo troppo potente per la gola che lo emette. L’eccitazione di una pellicola granulosa, di un bianco e nero scolorito, è l’eccitazione di assistere a eventi troppo importanti per il mezzo che li deve registrare.» A esprimersi in questi termini nel lontano 1995 era Brian Eno, uno dei musicisti e produttori più visionari e creativi nel panorama dell’“arte elettronica” e non solo. Un anno, il 1995, testimoniato giorno dopo giorno nel suo diario A Year With Swollen Appendices in cui Eno annota fra i progetti, accanto a sogni, visioni e letture, anche la collaborazione con Microsoft per realizzare il “suono di accensione” del sistema operativo Windows 95 195


(probabilmente i suoi 3.25 secondi di musica più ascoltati di sempre). Forse Brian Eno si era immerso in quel mondo fatto di “suoni minuscoli” («ogni microsecondo era così importante») attratto dal paradosso temporale di quella composizione: «Ho pensato che fosse assurdo cimentarsi con un pezzo musicale così breve, era come dover costruire un piccolo gioiello. Ne ho preparati 84...». Una micro composizione pensata per essere identica a sé stessa, ovunque e per sempre, con una dimensione temporale dell’ascolto del tutto inusuale, ideata per accompagnare l‘accensione di una macchina. Il “suono di avvio” è una caratteristica che Steve Jobs volle fin dai primissimi modelli di Macintosch. Un ex ingegnere Apple, Andy Hertzfeld, racconta di come Jobs mettesse pressione al team per ottenere un “beep di avvio” decente. Il problema era che il computer non era tanto potente da produrre un suono sofisticato all‘accensione e inoltre il case ottundeva l’audio, il risultato era ovattato, poco professionale. Per uscire dall’impasse qualcuno ebbe l’idea di praticare un buco nella scocca, così da lasciar fluire le onde sonore, ma Jobs fu categorico: «Non metteremo mai un orrendo buco come quello nel case! Scordatevelo!». La storia narra che nel 1982, dopo un ultimatum di Jobs (avrebbe rimosso l‘amplificatore dal prototipo, qualora non si fosse trovata una soluzione acusticamente accettabile), Hertzfeld e il suo gruppo, nell’arco di un fine settimana crearono una demo a quattro voci con il sintetizzatore che stavano testando, controllando forma d’onda, tonalità e frequenza di ogni voce al clic del mouse. Era l’inizio di quella teatralizzazione di un sistema che si accende, a noi oggi così famigliare, che è diventata addirittura una sorta di genere musicale a sé stante. La creazione di un “suono nuovo” piacevole da ascoltare per il boot del computer, sembra appartenere (e di fatto appartiene), a un’altra era tecnologica; ci sarebbero voluti anni per tirare fuori tutto il potenziale della gestione sonora del Mac o perché la Microsoft potesse pensare di commissionare quella microcomposizione, quel “piccolo gioiello”, a un artista come Brian Eno. Nell’epoca delle gan, l’investimento creativo e produttivo per sviluppare “strumenti nuovi” ad uso di una comunità potenzialmente planetaria di musicisti, professionisti e non, di operatori in ambito musicale, è davvero amplissimo. Le ricerche nel campo dell’apprendimento automatico applicate alla musica sono estese e 196

https://bit.ly/2I6AfOj

Jesse Engel, Cinjon Resnick, Adam Roberts, Sander Dieleman, Mohammad Norouzi, Douglas Eck, Karen Simonyan Neural Audio Synthesis of Musical Notes with WaveNet Autoencoders, 2017.

http://ceur-ws.org/Vol-2068/milc7.pdf

Douglas Eck, Adam Roberts, Jesse Engel, Sageev Oore Learning Latent Representations of Music to Generate Interactive Musical Palettes, 2018.

https://arxiv.org/pdf/1902.08710.pdf

Jesse Engel, Kumar Krishna Agrawal, Shuo Chen, Ishaan Gulrajani, Chris Donahue, Adam Roberts GANsynth: Adversarial Neural Audio Synthesis, 2019.

trasversali, dagli incubatori delle piccole équipe indipendenti alle major multinazionali. Ne dà un’idea quasi plastica Douglas Eck, scienziato ricercatore a Google nel team Magenta, uno dei progetti più importanti e articolati per la creazione artistica e musicale attraverso il machine learning: «Volevamo sviluppare uno strumento creativo per i musicisti e anche fornire una nuova sfida alla comunità dell’apprendimento automatico e galvanizzare la ricerca dei modelli generativi per la musica». Era il 2017, Eck si stava riferendo all‘NSynth (Neural Synthesizer), il progetto di “sintetizzatore neurale” lanciato in quell‘anno. Una rete neurale allenata con oltre 300.000 suoni di strumenti, un algoritmo di apprendimento automatico che utilizza le reti neurali profonde per apprendere le caratteristiche dei suoni e creare un “suono nuovo” basato su queste caratteristiche. Invece di combinare o fondere i suoni, l’NSynth sintetizza suoni completamente nuovi, utilizzando le qualità acustiche dei suoni originali. Per rendere questo algoritmo più accessibile, utilizzabile e riproducibile, sono stati sperimentati diversi strumenti musicali e interfacce, e nel 2019 è nato uno strumento prototipo open source, l’NSynth Super, che dà la possibilità ai musicisti di usare i nuovi suoni generati attraverso l’algoritmo NSynth. Siamo di fronte a forme di esplorazione di un territorio sonoro sconosciuto: «Abbiamo questo spazio latente. Per rendere il concetto un po’ meno oscuro, è come se avessimo uno spazio compresso, uno spazio che non ha la capacità di memorizzare l’audio originale, ma è impostato in modo tale che possiamo provare a rigenerare parte di quell’audio. Rigenerandolo, non otteniamo esattamente ciò da cui siamo partiti. Ma si spera di ottenere qualcosa di simile. Per come è impostato, possiamo anche muoverci all’interno di questo spazio, addentrarci in nuovi punti, e ascoltare effettivamente quello che si trova lì. A tutt’oggi, l’ascolto è per così dire piuttosto lento. Non siamo ancora in grado di fare le cose in tempo reale. Ci piacerebbe anche poter essere ad un meta livello, ossia costruire modelli in grado di generare quegli embedding, quelle immersioni, addestrate su altri dati, per potersi muovere in quello spazio in modi differenti. E così continuiamo a lavorare. Stiamo anche dedicando un bel po’ di tempo a ripensare alla generazione delle sequenze musicali. Abbiamo presentato alcuni modelli che, da ogni punto di vista, erano piuttosto 197


2 Video Making music using new sounds generated with machine learning. Douglas Eck e la sua équipe descrivono il progetto del "sintetizzatore neurale". https://youtu.be/iTXU9Z0NYoU

Making music with NSynth Super Filmato efficace, non tecnico, in cui si ascoltano suoni esplorati con l'NSynth Super. https://youtu.be/0fjopD87pyw 3

p. 68

198

QR Code

primitivi. Mi riferisco a quelle reti neurali ricorrenti molto semplici che generano midi da midi...». Douglas Eck descrive il fermento di un cantiere, la tensione creativa delle esplorazioni, la sorpresa per la generazione dei “suoni nuovi”, la necessità di alzare la qualità, il poter prendere in considerazione grandi set di dati di musiche eseguite, potersi occupare delle dinamiche espressive, del tempo, della texture musicale nel suo complesso... una lunga strada. Ma in fondo, si potrebbe obiettare, gli strumenti per generare “suoni nuovi” di certo non mancano, basterebbero un generatore di rumore, qualche oscillatore. Dove risiede allora la fascinazione di questa sperimentazione allargata? I suoni che nascono dalle esplorazioni con le reti neurali profonde − nello spazio latente “fra un flauto e un trombone” − sono in qualche modo suoni rotti, strani, sbagliati, eppure i musicisti che usano queste “palette” di suoni, che ci giocano assieme, sembrano esserne profondamente affascinati. Secondo Eck, è un effetto difficile da descrivere per chi non li abbia sperimentati: «penso che siano tipi di suoni interessanti perché il modello è stato forzato a cogliere nell’audio musicale reale alcune delle fonti importanti di varianza. Anche quando non riesce a riprodurle tutte, quando irrompe la confusione, per così dire, anche quella confusione è in qualche misura guidata dal suono musicale. Quando guardi Deep Dream e ciò che i modelli hanno appreso, può essere che ciò che stai vedendo non sia quello che ti aspetti dal mondo reale, ma c‘è comunque qualcosa di interessante, non è forse così?». C’è qualcosa di armonico in questi “neural glitch”, in questi “errori neurali”, nei “suoni del fallimento” dei nuovi strumenti.

199


Gankyoku, l‘incontro con il flauto zen Può capitare di imbattersi in una suggestiva rete generativa avversaria per la musica shakuhachi, il flauto giapponese di bambù a cinque fori, arrivato in Giappone dalla Cina durante la Dinastia Tang (618-907) e tradizionalmente associato ai monaci buddhisti della scuola zen Fuke. Un progetto del maestro Shawn Head, famoso solista dello shakuhachi, e di Omar Peracha, compositore e ingegnere a Humtap, una piattaforma social interattiva dedicata alla ai music sviluppata con il sostegno dell’incubatore tecnologico Abbey Road Red (nuovo dipartimento dei famosissimi studios di Abbey Road, noti a tutti per i Fab Four). L’intento del progetto gankyoku è quello di generare interi brani nuovi di musica shakuhachi per flauto solo, informa di notazione simbolica, per mezzo di una rete neurale allenata tramite gan. Per il set di dati, l’ingegnere e il musicista hanno preso in considerazione il repertorio classico, honkyoku, da cui il nome gankyoku, che comprende i pezzi suonati dai monaci sia per la questua che per la ricerca della luce interiore. Il repertorio continua a vivere anche oggi attraverso nuove composizioni che fanno proprie le qualità caratteristiche della musica shakuhachi tra- 4. Frase di musica shakuhachi nella notazione Kinko Ryu. dizionale. Le varie scuole differiscono per stile esecutivo, notazione e repertorio, Head e Peracha hanno scelto la Kinko Ryu che ha un focus importante sul repertorio tradizionale, costituito da circa 40 pezzi. La notazione Kinko Ryu differisce dalla notazione musicale occidentale, lo spartito è fatto di colonne, scritte perlopiù in caratteri katakana che vengono letti dall’alto in basso; ognuno di essi può indicare una nota, una tecnica esecutiva oppure altri metadati, ad esempio specificare un’ottava. Le colonne sono lette in sequenza, da destra a sinistra. Alcuni caratteri si riferiscono a una specifica altezza, mentre altri a una classe di altezze, dove l’informazione sull’ottava di riferimento viene da un altro simbolo oppure dalla prassi esecutiva tramandata. Un’altra caratteristica fondamentale dell’honkyoku è che la durata delle note di solito non è specificata. La lunghezza della linea verticale fra due caratteri può essere usata come guida approssimativa su quanto a lungo un suono debba essere tenuto, ma in generale la notazione ritmica è assai meno precisa di quella in uso nella musica occidentale. 200

https://youtu.be/qlaEwqT4mmA Shawn Head intervista Omar Peracha sul progetto gankyoku.

https://bit.ly/3lLoYT4

Omar Peracha, Shawn Head gankyoku: a Generative Adversarial Network for Shakuhachi Music, 2019.

L’aleatorietà temporale è costitutiva della particolarissima qualità estetica della musica shakuhachi: quella sospensione-dilatazione del tempo-spazio, sperimentata sia da chi suona, che da chi ascolta. Tale caratteristica è più performante come base di un modello generativo, poiché nella rappresentazione simbolica devono essere codificate meno informazioni musicali, riducendo teoricamente la complessità della sequenza da modellare. Gli autori, alle prese con un set di dati molto limitato, hanno anche elaborato una tecnica per aumentarlo, indicando una strada utile nei casi in cui un compositore desideri modellare la musica in uno stile che non abbia a disposizione un ampio set di dati. Lo scopo del modello era introdurre nuove qualità negli esempi generati, qualità che fossero però correlate al repertorio honkyoku in modo percepibile. Nei brani shakuhachi ottenuti attraverso la ganKyoku c’è varietà, idiomaticità e senso musicale lungo un arco di tempo esteso: «Abbiamo mostrato come questi pezzi possano presentare novità e creatività, senza perdere il riferimento alle aspettative estetiche provenienti dalle associazioni con il repertorio». Le nuove partiture sembrano aver mantenuto il legame con la specificità shakuhachi, con quelle melodie dal fraseggio ritmicamente libero, inframezzato da respiri silenziosi, dove la sequenza dei suoni, altezza e intonazione, sono per così dire irrilevanti. Melodie che perderebbero senso se suonate con altri strumenti musicali perché fatte di “tono-colore”: corpo-mente-respiro si amalgamano nel suono inconfondibile dello shakuhachi.

5. Esecuzione di tre composizioni scelte fra una trentina. gankyoku i, ii, iii nella Girton College Chapel dell'Università di Cambridge a gennaio 2019. Al flauto shakuhachi il maestro Shawn Head, registrazione e mixing audio a cura di Omar Peracha. https://youtu.be/BubH5CVH6u

201


Un uso visionario delle gan: da Mondrian al Modular Synth Esistono migliaia di interfacce audio per fare musica, che diventano decine di migliaia se contiamo le personalizzazioni e tutti quegli strumenti non commerciali costruiti dalla vastissima comunità nime (New Interface for Musical Expression). Stiamo parlando delle tastiere midi, dei sintetizzatori modulari, delle drum machine, dei controller, dei campionatori, dei sequenziatori, delle consolle per mixare l’audio, eccetera. Le interfacce musicali sono strumenti presenti in ogni parte del mondo e sono ben riconoscibili per la loro particolare estetica fatta di pulsanti, manopole, tastiere... Nel processo di costruzione di questi strumenti, fatto di step ben precisi, anche il design visuale e l’organizzazione del layout giocano un ruolo non secondario. Secondo Perry Cook, esperto di nime: «la musica che creiamo può essere fortemente influenzata dalle scelte iniziali sia tecniche che di design». Quando i ricercatori e i tecnici creano una nuova interfaccia per l’espressione musicale, i colori, la texture, i materiali, l’hardware e la disposizione degli elementi sono rilevanti nell’ideazione del design (l’eleganza minimal dell’NSynth Super: un quadrato satinato, quattro cerchi agli angoli, il touch screen al centro che trascolora esplorando i suoni). Le scelte sono guidate da regole ergonomiche, estetiche e musicali ed anche dalla tradizione, oltre che dal gusto del designer. L’aspetto di questi strumenti, il loro visual design, non interessa solo i musicisti ma anche il pubblico, entra nell’esperienza unica delle performance. Da Akito van Troyer e Rebecca Kleinberger del Berklee College of Music e del mit Media Lab arriva un’idea visionaria, usare le gan per creare nuove immagini di interfacce musicali. Per questo progetto hanno utilizzato l’approccio della traduzione image-to-image, allenando tre modelli gan differenti con tre diversi database: una base dati contenete 1120 immagini di interfacce musicali attualmente in commercio, viste di fronte e dall’alto; un’altra con 613 fotografie con patterns geometrici di mosaici di varie culture, dall’Europa al Giappone, al mondo arabo: infine un terzo database costituito da 1037 immagini di quadri astratti, presi da WikiArt, di 51 artisti, dall’inizio del ventesimo secolo all’oggi, esponenti del 202

5a

6a-6b. Nella riga superiore si vedono le opere d'arte scelte come input, nella riga inferiore i risultati ottenuti. 6a: da sinistra a destra, Piet Mondrian, Henryk Berlewi e Loló Soldevilla. 6b: da sinistra a destra, Ivan Serpa, Richard Paul Lohse, Lidy Prati. 3

p. 198 5b

203


Neoplasticismo, del Costruttivismo, del Minimalismo e dell’Optical Art: Piet Mondrian, Ivan Serpa, Richard Paul Lohse, Lidy Prati, Otto Gustav Carlsund, Lothar Charoux, Max Bill, Henryk Berlewi, Lolo Soldevilla, Erich Buchholz, Lajos Kassak... Gli autori non escludono di sperimentare in un futuro con altre forme d’arte (l’arte rupestre, quella naïf, la cyber art). La prospettiva della loro ricerca è quella di poter approfondire la comprensione dell’attuale metodo del design nime capovolgendone l’intero processo (dalla forma alla funzione e non viceversa), aprendo così nuove prospettive. Lo sguardo visionario di van Troyer e Kleinberger si spinge fino ad immaginare un futuro in cui gli artisti potranno proporre all’industria musicale di creare nuovi prodotti basati sulle loro opere, o addirittura «architetti, biologi, attori e fabbri riuniti per creare la prossima generazione di interfacce musicali, usando le gan» (!). E se questi nuovi strumenti venissero costruiti? «Ci piacerebbe costruire una di queste interfacce e poterne giudicare l’efficacia anche dal punto di vista ergonomico». Alcuni studi di Human Computer Interaction suggeriscono che interfacce piacevoli esteticamente siano più usabili delle altre. Ma realizzare fisicamente un prototipo da queste immagini solleverebbe un insieme di altre questioni complesse. Come suonerebbero questi strumenti costruiti senza una mappatura fra gesto e suono? Come suonerebbero i cordofoni fantastici dell’Harmonie Universelle di Marin Mersenne o la lira immaginaria impugnata da Saffo nel Parnaso di Raffaello?

7. Tavola degli strumenti a corda dal libro iii dell'Harmonie Universelle di Marin Mersenne, la cui prima edizione venne pubblicata nel 1636 a Parigi (f. 171).

204

https://bit.ly/3d6rOOr Akito van Troyer, Rebecca Kleinberger From Mondrian to Modular Synth: Rendering nime using Generative Adversarial Networks, 2019.

8. My Artificial Muse (2017-2020) di Albert Barqué-Duran, Mario Klingemann e Marc Merzeneit. https://albertbarque.com/myartificialmuse/

Muse artificiali e corpi musicali Immaginate una performance di tre giorni in cui una figurina umana super stilizzata in continue posture differenti genera tramite gan delle immagini in formato digitale, le quali a loro volta vengono riprodotte a olio su supporto di grande formato da un pittore, al quale sono applicati dei sensori che ne seguono i movimenti mentre dipinge, e che a loro volta generano una colonna sonora live. Questa installazione è stata presentata nel 2017 a Barcellona nell’ambito di Sónar+D, un festival internazionale dedicato all’innovazione tecnologica e creativa in campo audiovisuale e musicale. Da allora My Artificial Muse, è questo il titolo dell’opera, ha viaggiato in giro per il mondo, Shangai, Berlino, Londra, Zurigo, Colombia, Spagna, Polonia, Grecia, Italia... Tre sono gli artisti-artefici che l’hanno ideata: Mario Klingemann, che ha usato l’approccio “pose-to-image” per rigenerare delle immagini dalle “stick figures”, stilizzazioni delle posture dei corpi umani raffigurati in famose opere d’arte (la Maja 205


desnuda di Goya o l’Olympia di Manet); Albert Barqué-Duran, l’artista e ricercatore che si è messo nella posizione del pittore che con pennello e spatola copia il modello generato dalla macchina, e il compositore Marc Merzeneit alla “colonna sonora generativa” che modula la narrazione della performance live. È una sorta di loop, ma sempre diverso, in cui creazione e riproduzione, modello, copia del modello e variazione, macchina e uomo si scambiano continuamente le parti, in un continuum. Chi ispira chi? Ciò che più interessa in quest’opera, ai fini del nostro discorso, non è una delle molte suggestioni che possono affiorare in filigrana, quasi per assonanza, con le Muse eliconie di Esiodo che cantano l’origine del mondo, la nascita degli dei e degli uomini, personificazioni di ogni creazione, qui convocate per uno strano agóne. Notevole piuttosto è l’utilizzo delle “posture”. Dal punto di vista musicale, la correlazione postura-movimento-ritmo-musicalità è di enorme rilevanza. Non è questa la sede per approfondire gli aspetti della cosiddetta “musicalità innata” e il suo radicamento corporeo, come indagato anche dalle moderne neuroscienze o dalla psico-biomusicologia. In My Artificial Muse, attraverso le gan le posture stilizzate generano delle immagini, le posture reali (quelle del pittore) sono tracciate con i sensori per creare una colonna sonora vivente. L’elaborazione delle posture per mezzo delle gan si può trovare in numerosi progetti che riguardano la musica. Ad esempio in gans and Poses (2018), un’installazione multimediale interattiva che fa uso delle posture umane per controllare le reti neurali che generano le parti di un arrangiamento musicale. Alla base dell’installazione c’è un sistema di riconoscimento in tempo reale dei movimenti dei partecipanti; i movimenti, ripresi da una telecamera, vengono elaborati come pose stilizzate (analoghe alle “stick figures” di Klingemann) le quali sono poi analizzate da un sistema di riconoscimento per i movimenti della danza (dance move recognition). «In questo lavoro abbiamo combinato lo stato dell’arte delle reti neurali per la valutazione delle posture umane, con un metodo generativo sperimentale per la creazione della musica che utilizza le gan insieme con un’architettura ricorrente-convoluzionale. Usando queste tecnologie, viene creato un ensemble musicale semi-umano/semi-macchina, quando il pub206

p. 233-235

QR Code

blico interattivamente controlla la struttura del brano e genera gli elementi musicali usando i gesti del corpo.» Le gan per la creazione della melodia (melody gan) e del ritmo (drum gan) sono state allenate in modo semisupervisionato per poter parametrizzare i pattern musicali ottenuti. Il pubblico è incentivato a interagire attraverso un’interfaccia audiovisiva. Come in un videogioco a livelli, vengono “premiate” le posture che il sistema riconosce come movimenti di danza e che controllano il risultato musicale, facendo avanzare la musica a un livello successivo. In questo “circuit training”, diventiamo parte di un inedito automa musicale: i nostri passi di danza mettono in moto un “meccanismo” che produce musica.

9. Schema d'insieme del sistema che mostra le varie componenti.

https://arxiv.org/pdf/1902.08710.pdf

Richard Vogl, Hamid Eghbal-zadeh, Gerhard Widmer, Peter Knees, gans and Poses: An Interactive Generative Music Installation Controlled by Dance Moves, 2018.

207


processo di ri-composizione, una mm-gan (“music-to-tomovement”) genera una sequenza di nuovi movimenti condizionata dall’input musicale. Questo “ai-Choreographer” ha un compito generativo davvero molto complesso, ossia la sincronizzazione dello stile con il ritmo, la multimodalità e la strutturazione spazio-temporale a lungo termine. Per i suoi autori sembra interessante la potenzialità di poter assistere e perfino «espandere la creatività nelle performance teatrali». Siamo nel campo delle ricerche volte a costruire dei facilitatori, strumenti abilitanti per la danza e la coreografia. Come nel disegno le gan non imparano a disegnare, imparano i disegni, così nella danza le gan non imparano a danzare, imparano le danze, eppure nel generare nuovi movimenti tramite la musica danno voce all’aspirazione di ogni grande coreografo, quella di poter modellare nuove figurazioni dai limiti del corpo, oltre l’imitazione, oltre la ripetizione di sé stessi e del proprio repertorio.

Danzare con la musica Il legame corpo-ritmo-musicalità si ritrova nell’approccio “musicto-to-dance” attualmente molto studiato, da diverse prospettive. È del Computer Vision and Cybernetics Group dell’Università Indipendente del Bangladesh un modello capace di produrre tramite gan video di danza realistici basati sul ritmo. «Abbiamo aggiunto una tecnica che trasforma per mezzo di una gan le “stick figure” dei movimenti in immagini realistiche, a differenza di quanto avviene solitamente nelle coreografie generate tramite ai in cui la rappresentazione dei movimenti è stilizzata. La velocità dei movimenti del corpo segue il tempo della musica, come avviene nella realtà.» In questo studio i movimenti di danza generati non tengono però conto del vocabolario del contesto, la rete gan (Pix2pixHD) è stata allenata con i fotogrammi di brevi filmati di movimenti liberi. Sempre nel 2019, i ricercatori nvidia in collaborazione con l’Università della California, hanno sviluppato un modello differente, molto più complesso, in grado di comporre nuovi movimenti coerenti nello stile. Il modello è stato allenato con oltre 350 mila clip musicali, rappresentative di tre tipologie di danza. Al centro del lavoro c’è un framework decomposition-to-composition che dalle clip musicali ottiene le sequenze delle posture di danza e, nel

Disegnare il suono

https://arxiv.org/pdf/1911.02001.pdf

Hsin-Ying Lee, Xiaodong Yang, Ming-Yu Liu, Ting-Chun Wang, Yu-Ding Lu, Ming-Hsuan Yang, Jan Kautz. Dancing to Music, 2019. 10. Esempi di unità di danza. Ogni unità ha la medesima durata e i battiti cinematici sono associati a quelli ritmici.

208

p. 111

In Drawing with Sound, opera vincitrice del dare Art Prize nel 2018, l’artista e ricercatrice Anna Ridler ha lavorato insieme con il compositore Ben Heim del Royal College of Music nell’addestrare una rete neurale a riconoscere le forme di un insieme di schizzi dal vivo, disegnati dall’artista stessa nell’arco di paio di anni, per poi associarle a suoni di soprano campionati da Heim. L’indagine sulle implicazioni filosofiche e creative del disegnare, in Fall of the House of Usher (2017) è declinata come un lavoro sul ricordare-ripetere-ricreare-rinarrareri-dimenticare, attraverso i disegni dei fotogrammi del film del 1929 usati per allenare la gan, i ri-disegni delle immagini generate dalla gan stessa... (si rimanda alla lettura del coinvolgente capitolo di Anna Ridler). In Drawing with Sound, sempre del 2017, il focus si sposta sulla “corporeità della memoria” attraverso la corporeità del disegnare, che in questo processo generativo diventa a un contempo “strumento-suono-notazione”. Drawing with Sound è una performance durante la quale l’artista disegna con un carboncino su di un muro bianco, mentre una webcam incorporata negli occhiali segue il disegno e attiva una serie di linee melodiche di soprano, sovrapposte e dissonanti, controllate 209


11. Anna Ridler nella performance Drawing with Sound; si notano gli occhiali con la telecamera.

dell’allenamento e dell’apprendimento delle reti neurali nelle diverse epoche». Se in Fall of the House of Usher le immagini generate nelle epoche iniziali sono poco chiare, le gan ne producono di migliori in quelle successive − è l’esito (auspicato) del processo discriminator-generator −, in Drawing with Sound si procede all’inverso, all’inizio i segni appaiono più precisi, sulla superficie bianca del muro, poi le tracce si mischiano, si confondono «causando disordine e, alla fine, entropia», in una ossimorica partitura musicale improvvisata che sembra evocare la partitura delle nostre tracce mnestiche, prima di una possibile narrazione. Musica generativa senza confini (?)

dalla risposta delle reti neurali allenate. «Quando disegni ti muovi ed è come se ballassi. Non si tratta solo di come suoneranno le linee quando vengono disegnate. L’atto stesso del disegnare è molto importante, reagisce al processo: una linea proveniente da una direzione genererà un suono diverso da una linea proveniente da un’altra. Un semicerchio inizierà un suono che si muoverà dolcemente in un cerchio completo. Assicurarmi che tutti i suoni associati alle forme che uso di solito quando disegno lavorassero insieme “sonoramente”, per così dire, è stato davvero difficile». La telecamera è negli occhiali per «costringerti a guardare e riguardare il segno» dalla prospettiva del corpo in movimento, dalla testa che si inclina in direzioni differenti, non è un occhio esterno che osserva, si allontana o si avvicina come uno zoom. Il disegno diventa così notazione. C’è una lunga storia di notazioni musicali alternative che cercano di far coincidere segno e suono, ma ascoltando e guardando Drawing with Sound siamo spinti vorticosamente alle origini della notazione musicale, ai neumi del canto gregoriano, voce-gesto-segno, qui rovesciati in gesto-segno-voce. La performance si svolge in un periodo determinato di circa mezz’ora in cui l’artista disegna e poi cancella, torna e ritorna a disegnare nel medesimo spazio, i segni a carboncino si sovrappongono gli uni agli altri, le tracce vengono sovrascritte nel tempo, e così le linee vocali, come avviene per i ricordi della nostra me- https://vimeo.com/226293297 moria. Per Anna Ridler, questo processo «echeggia le ripetizioni Drawing with Sound. 210

Nel 1965 Steve Reich compone l’ipnotica e notissima It’s Gonna Rain, un’opera seminale realizzata con un sistema generativo meccanico costituito da due registratori a cassetta messi in fase. Alla Union Square di San Francisco, Reich registra su nastro un giovane predicatore pentecostale mentre tiene un sermone su Noè e la fine del mondo... e arriverà la pioggia. Due brevi loop identici, tratti dall’audio registrato, vengono montati sui due registratori che sono settati a velocità leggermente diverse: i due loop scivolano così gradualmente fuori fase. «After a while, it’s gonna rain after a while, or forty days and for forty nights... It’s gonna rain, It’s gonna rain... It’s gon’... It’s... Rain...» il loop sfasato si frammenta in un diluvio di parole, sillabe, suoni. Il compositore allestisce il sistema e mette in moto la musica, «una volta che il processo è avviato, funziona da solo», procede in modo autonomo, scrive Reich nel saggio Musica come processo graduale. Brian Eno si ispirerà al phasing di It’s Gonna Rain per l’album del 1978 Ambient 1/Music for Airports (sette registratori, loop di diverse lunghezze...). «Uno dei miei interessi di sempre è l’invenzione di “macchine”e “sistemi” capaci di produrre esperienze musicali e visive... Il punto è poter comporre musica con materiali e processi specificati da me, ma con combinazioni e interazioni che non ho specificato io.» È l’assioma della musica generativa, una musica «sempre diversa», in «perpetua trasformazione», e che è «generata da un sistema». Il “sistema” pensato da Brian Eno per Generative Music 1 non è più 211


meccanico/analogico, è il software Koan della sseyo caricato su un floppy disk insieme con 12 brani di musica ambient composti da Eno stesso (Rothko Doric, Microcosmology, Klee 4.2, Supporting Circle, Densities iii, Tintoretto...). Ogni compositore può giocare con i brani, attraverso l’algoritmo del software Koan può scegliere e controllare 150 parametri musicali e sonori, con i quali il computer poi improvvisa, «come il vento improvvisa con le campane a vento» (esempio rudimentale di musica generativa). Generative Music 1 è del 1996, un anno dopo la micro-composizione gioiello per l’avvio di Windows 95, e per Eno quest’opera rappresenta l’inizio di una “nuova era musicale”, come scrive nella presentazione, in cui è possibile unire i vantaggi della musica dal vivo a quelli della musica registrata. La musica generativa, «come quella dal vivo, è sempre differente. Come quella registrata, è libera dalle limitazioni spazio-temporali – puoi ascoltarla quando e dove vuoi.» Oggi, i sistemi generativi sono ideati con le reti neurali allenate, come nel generative film The Ship di Brian Eno. Le gan spingono ai limiti gli assiomi e l’esperienza della musica generativa, provocano i paradigmi della composizione e dell’esecuzione, dell’improvvisazione e della scrittura, della riproduzione e dell’ascolto. Interrogano i confini, never repeating, ever changing, lasting for ever... https://bit.ly/3bnCxmA In Memories of Passersby i, Mario Klingemann ha creato un Brian Eno,The Ship meccanismo che continuerà a generare ritratti di persone inesi- A Generative Film (2016) Machine Learning: Nao Tokui. stenti, per sempre, come gli spartiti inesistenti creati dalla gan di Nao Tokui, artista e ricercatore, fondatore di Qosmo, uno dei più inventivi gruppi di sperimentazione artistica audiovisuale (Imaginary Soundscape, ai dj Project...): «Siamo stati ispirati dall’immagine fantastica di uno stregone che sta facendo un incantesimo per far emergere degli spartiti musicali da una vecchia pergamena». Ed è proprio come in un incantesimo che guardiamo le note comparire e dissolversi, deformarsi e riformarsi, scorrere sul leggìo digitale, mentre ascoltiamo rapiti la musica di queste note liquide suonate, in tempo reale, dal pianoforte.

212

12. AI-Generated Music “Composing Melodies Inspired by Musical Scores” un'opera di Nao Tokui realizzata da Qosmo in collaborazione con Yamaha, presentata nel 2019 al Midtown Design Hub di Tokio in occasione della 78esima mostra della Japan Graphic Designers Association. La gan è stata allenata con un set di immagini di spartiti. https://vimeo.com/375623431


A hideaway in the wastelands: nuove sfide filosofiche dell’ai art Alice Barale

Infinite Skulls

1. Infinite Skulls, Robbie Barrat/Ronan Barrot 2019. In mostra all’Avant Galerie Vossen di Parigi a febbraio 2019.

214

«Infinite Skulls»: l’expo qui fait dialoguer art et intelligence artificielle Sophie Kloetzli, «Usbek & Rica», 2019. https://bit.ly/3dPjFg4

Nel grande entusiasmo per le gan che caratterizza gli ultimi anni – entusiasmo dovuto tra l’altro alla possibilità che questa nuova tecnica offre di manipolare e produrre una grande varietà di immagini di alta qualità1 – molti sono gli aspetti che colpiscono il filosofo. Primo tra tutti, il fatto che le gan sono due. La particolarità di questo tipo di intelligenza artificiale, come è stato evidenziato più volte nel presente volume, è che si tratta di due reti neurali che giocano in qualche modo l’una contro l’altra. Il discriminator, allenato su un certo set di dati (di immagini, oppure di testi o di suoni), deve giudicare i dati prodotti dal generator, decidendo se siano o meno «reali» (ovvero in accordo con i dati iniziali). Il generator, da parte sua, deve produrre dei dati che siano il più possibile simili a quelli su cui è stato istruito il discriminator, così da trarlo in inganno. L’inganno non deve però essere completo, perché i nuovi dati non devono essere identici a quelli di partenza, ma soltanto, in qualche modo, somiglianti. Perché questo avvenga, il generator non ha accesso ai dati iniziali forniti al discriminator. I dati che produce non sono dunque 215


semplici copie, ma – nel caso, ad esempio, delle immagini – nuove immagini, che imitano trasformandole le immagini iniziali. È questo che ha attratto l’attenzione degli artisti e anche di molti semplici utenti della rete, affascinati dalle immagini del tutto particolari, familiari e spaesanti al tempo stesso, che si generano2. Ed è questo che attrae anche l’attenzione del filosofo. Perché, infatti, le gan occupano un posto tanto particolare all’interno dell’intelligenza artificiale3? E da dove viene il carattere così avvincente delle immagini generate con questa tecnica? Al filosofo che si avventura, coraggioso e un po’ incauto, in questi nuovi campi del nostro vivere quotidiano vengono in mente le riflessioni di Giorgio Colli sull’origine della filosofia dall’inganno e dall’enigma, antenati della dialettica. Sapere è sempre anche camuffare, ingannare, come mostra l’itinerario lungo delle frecce di Apollo4. E, naturalmente, la riflessione di Platone sulla mimesi, quel processo di imitazione che rinvia sin dall’inizio, come dice la sua radice etimologica che lo riporta agli antichi «mimi»5, a un atto trasformativo che coinvolge il corpo intero. Un’intelligenza artificiale però non ha “corpo” in senso proprio, né può «pensare», nel senso in cui si usa normalmente questo termine6... Di fronte a tali domande, che portano nel territorio difficilissimo della agi (Artificial General Intelligence) – il sogno e la speranza di produrre una ai che comprenda davvero quello che fa nei suoi aspetti generali, e non sia solo finalizzata a uno scopo (individuare una cellula malata, o distinguere un particolare comportamento…)7 – l’incauto filosofo è portato a cambiare strategia, partendo dalle immagini che lo hanno colpito, o almeno da alcune di esse, per indagarne problemi e potenzialità. Tra il 7 e il 19 febbraio 2019 a Parigi viene presentata al pubblico una mostra che nasce dalla collaborazione tra un pittore francese piuttosto noto, Ronan Barrot, e un giovane artista e studioso di intelligenza artificiale americano, il diciannovenne Robbie Barrat. L’idea è di utilizzare come set di dati iniziali per le gan di Barrat alcune opere di Barrot, per confrontare i due tipi di immagini. In particolare Barrot ha l’abitudine di dipingere, ogni volta che termina un’opera, un teschio, realizzato con gli ultimi avanzi di colore. È – come afferma il pittore in un’intervista – una sorta di «proces216

https://vimeo.com/302584147

Barrat/Barrot, Infinite Skulls #2. Apprentissage des crânes par le gan. Filmato in cui Barrat spiega l’addestramento delle gan per Infinite Skulls.

so collaterale della sua pittura», come «pulire il motore dopo aver guidato per miglia e miglia»8. Negli ultimi vent’anni della sua produzione, Barrot ha realizzato alcune migliaia di teschi, un perfetto dataset per le gan di Barrat. Cosa avviene dunque quando le gan di Barrat vengono istruite sui teschi di Barrot? L’esperimento è particolarmente interessante perché nella storia dell’arte i teschi sono, come gli autori della mostra ben sanno, il simbolo per eccellenza della vanitas della vita e dell’arte stessa. Il risultato però è sorprendente e porta, in parte, in una direzione diversa. Vale la pena seguire il processo nei suoi dettagli. Barrat si ritrova a suddividere il suo lavoro in due fasi. Nella prima, le immagini di teschi che utilizza come dataset sono molto simili tra loro – tutte con la stessa forma, grandezza e orientamento – e i teschi prodotti risultano, di conseguenza, estremamente vicini agli originali. Barrat prova allora a modificare il layout delle immagini di partenza, e ad aumentarne considerevolmente il numero (da 500 a 1700). Ottiene così qualcosa di inaspettato: «Ho istruito le reti sui teschi. Avevano tutti la stessa forma, le stesse dimensioni e lo stesso orientamento. I risultati sono stati ottimi, ma molto simili ai teschi originali di Ronan. Abbiamo suddiviso la mostra in epoche diverse – questa è l’Epoca 1, in cui l’addestramento è condotto direttamente sui suoi teschi. «Per l’Epoca 2 ho pensato che l’aspetto più entusiasmante dell’uso delle gan sta nel fatto che permettono di ottenere il bizzarro “punto di vista” della macchina riguardo alle opere d’arte. Ma fornire alla macchina tutti i teschi disposti nello stesso modo è un po’ come dire alla macchina in quale modo deve “vedere” le immagini. Equivale a imporle una prospettiva molto fissa e molto convenzionale – già vista prima». «Perciò, per l’Epoca 2 mi sono praticamente sbizzarrito sottoponendo alla macchina i teschi in modo completamente indipendente da qualunque rotazione o prospettiva, in modo che la macchina vedesse i teschi rovesciati o stirati. Utilizzo lo stesso modello, ma il numero dei teschi contenuti nel training set passa da 500 a 17.000. E i risultati sono veramente ottimi. Vengono fuori immagini davvero strane, che non ci si aspetterebbe. Si capisce che sono teschi, ma non risultano familiari». 217


Il fatto che i nuovi teschi prodotti risultino «non familiari» è particolarmente importante, proprio perché si tratta di teschi. Se il teschio, come topos che attraversa tutta la storia dell’arte, rappresenta infatti la vanità di ogni esistenza individuale, il suo annullamento in un destino sempre uguale, i teschi di Barrat vanno in qualche modo – come afferma Benjamin, per restare in atmosfera di teschi, a proposito dell’allegoria barocca9 – oltre sé stessi. In Barrat i teschi si animano, diventano allegri e fantasiosi. Uno di essi fa pensare al processo di transizione tra un teschio e un qualche futuro e misterioso robot, immerso in una profonda atmosfera blu-nera. Un altro è estremamente materico (per un teschio), rosso e arrabbiato, con un grande orecchio, un grande sopracciglio inarcato e un pezzetto di viso mancante. La vanitas – i teschi che le gan di Barrat possono produrre sono “infiniti”, come recita il titolo della mostra – si trasforma in elemento giocoso, che non porta a una distruzione della possibilità rappresentativa e dell’arte, ma al contrario a una sottolineatura delle sue infinite capacità trasformative. Ciò si esprime anche in una continua interazione tra l’artista e la macchina. Non solo Barrat sceglie il dataset da utilizzare, confrontando di volta in volta i risultati raggiunti, ma le immagini prodotte vengono poi modificate da Barrot, che ci dipinge sopra. Questi teschi, afferma Barrot, sono «i più belli»: «Ronan li adora. Gli piace https://vimeo.com/302584040 moltissimo correggere alcuni dei teschi. Magari dice “Questa mi Ronan Barrot, piace, ma non è ben fatta”, oppure “Nessuna immagine mi soddisfa Le désir de peindre. Filmato Infinite Skulls #4. mai completamente”, e le corregge. E talvolta le reinterpreta.»10 In un’intervista, Robbie Barrat spiega che l’opera d’arte per lui QR Code p. 14 non sono le singole immagini, ma è la gan stessa11. C’è una nuova impronta, in questo tipo di arte, che consiste nell’affidare qualcosa alle sue possibili trasformazioni, senza negare l’autorialità (perché di trasformazioni si tratta, e non di copie), ma facendo, come autore, un passo indietro: quel che importa sono le prossime trasformazioni future12. Questo è il significato che l’aggettivo «infiniti» del titolo della mostra assume. A quell’avvicinarsi agli oggetti che caratterizza, secondo Walter Benjamin, la produzione artistica e la nostra stessa percezione nell’epoca della riproducibilità tecnica13, sembra succedere così un nuovo ri-allontanarsi, che trasforma ogni identità nella possibilità di qualcos’altro. 218

2. Infinite Skulls, Robbie Barrat/Ronan Barrot 2019, olio su tela, stampa uv su plexiglass.

219


3-4. Infinite Skulls, Robbie Barrat/Ronan Barrot 2019, olio su tela, stampa uv su plexiglass.

220

221


5-8. Landscapes series, Robbie Barrat 2018.

Questo è dovuto al fatto che, come vedremo nel prossimo paragrafo, cambiano le regole del vedere. Il riconoscimento di una gan (se di “riconoscimento” si può parlare) non è il riconoscimento umano. Le deep neural networks, da cui la gan è costituita, sono in grado di codificare alcuni tratti salienti di quello che «vedono» (ad esempio linee, angoli o, a un livello più complesso, un oggetto o un gruppo di oggetti), ma mancano di una vera e propria “comprensione” di esso (che richiederebbe la possibilità di integrare la capacità visiva con altre capacità: linguistiche, di ragionamento, motivazionali, emozionali…)14. Proprio questo, però, rende particolarmente interessante il loro processo di elaborazione, in quanto traduzione – estremamente incompleta e problematica – di una lingua nell’altra. Attraverso lo sguardo “altro” della gan sembrano prefigurarsi nuove modalità del vedere per noi. 222

È questo il messaggio che sembra emergere da alcuni paesaggi che Robbie Barrat realizza qualche anno prima della mostra parigina. Per produrli, l’autore ha istruito la sua gan su decine di migliaia di paesaggi dipinti a olio, tratti da WikiArt. I primi risultati sono ancora piuttosto realistici, ma colpiscono per alcuni tratti particolari, per un’incertezza che ci spinge a domandare: una strana linea delle montagne, troppo netta e come fatta di luce, un filo di fumo o forse di foglie che sale verso il cielo, dei tronchi troppo fluidi, che Die Toteninsel, Arnold Böcklin. ondeggiano come rami... Mano a mano che l’artista progredisce nel training della gan, il paesaggio si fa meno realistico e soprattutto più scuro, sino a caricarsi di un aspetto misterioso. Un misterioso, però, che non ha nulla di mitico – sul modello, ad esempio, dell’Isola dei morti di Böcklin –: non c’è, in questi paesaggi, nulla di immobile e di già dato, ma tutto ci invita all’esplorazione. 223


9-10. Gloomy Sunday - Learning to see, Memo Akten 2017. Installazione interattiva al Barbican di Londra: “AI: More than Human”, 2019.

Learning to see Nel maggio del 2019, in una mostra al Barbican Centre di Londra, l’artista e studioso di intelligenza artificiale Memo Akten realizza un’installazione in cui lo spettatore è chiamato a scegliere tra alcuni oggetti di uso comune – un pezzo di stoffa, delle chiavi, un telecomando... – per proporli all’attenzione di una gan. Tra gli oggetti a disposizione c’è un pezzetto di panno giallo, come quelli che si usano per 224

togliere la polvere dagli scaffali, con piccole cuciture rosse. Quando un osservatore lo sposta sullo sfondo blu del piano d’appoggio, il panno, nell’interpretazione della gan, diventa un mare in cui le onde sono le pieghe della stoffa, la linea dell’orizzonte le cuciture, e la schiuma https://vimeo.com/260612034 improvvisa di un’onda il dito del visitatore. Emergono, per lo spettaVideo Gloomy Sunday. tore, memorie infantili. Quante volte da bambini siamo sprofondati nelle piastrelle del bagno, vedendoci una montagna, o in un pezzetto di stoffa come questo, vedendoci un mare… 225


11-12. Gloomy Sunday - Learning to see, Memo Akten 2017. Installazione interattiva al Barbican di Londra: “AI: More than Human”, 2019.

A questo aspetto trasformativo – sottolineato, non a caso, da Walter Benjamin nella sua memorie d’infanzia proprio negli stessi anni in cui riflette sull’opera d’arte nell’epoca della sua riproducibilità tecnica15 – si accompagna però anche un altro elemento, che consiste piuttosto in un mancato riconoscimento. La gan vede un mare nel pezzetto di stoffa perché, come spiega Atken nella sua presentazione dell’opera, il suo training è stato fatto con immagini di elementi naturali16. Sono, questi, gli unici dati che la ai conosce e che ha a disponota 16 sizione. Da questo punto di vista la magia delle gan, di cui spesso si Learning to See, parla, è una magia controllata. L’immaginario che risulta dipende in Memo Akten 2017. gran parte dall’immaginario del dataset. Per questo, le gan sono dei grandi riproduttori di pregiudizi, oltre che possibili fattori di una loro messa in causa. Come spiega lo stesso Atken: «Una rete neurale artificiale osserva il mondo esterno, tentando di dare un senso a ciò che vede, in funzione di ciò che ha visto precedentemente. Proprio come noi, può vedere soltanto ciò che conosce già. L’immagine che vediamo nella nostra mente cosciente non è un’immagine speculare del mondo esterno, bensì una ricostruzione basata sulle nostre aspettative e sulle nostre convinzioni preesistenti. Il mondo fa parte di un processo più ampio di indagine sul sé che riproduce 226

13-14. Learning to see, Memo Akten 2017. Installazione interattiva al Barbican di Londra: “AI: More than Human”, 2019.

i bias cognitivi, la nostra incapacità di vedere il mondo dal punto di vista altrui e la conseguente polarizzazione sociale»17. Il repertorio di immagini con cui la gan viene “allenata” è, spesso, un repertorio precostituito18, tratto da quei grandi depositi di immagini che sono Google Art, o ImageNet. Eppure, è proprio la capacità della ai di attraversare tali immensi serbatoi dell’immaginario collettivo, deformandoli e facendoci riflettere su di essi, a costituire il suo maggior interesse. Come scrive Atken a proposito di Google Art, da cui ha attinto il suo dataset: «Decine di migliaia di immagini prelevate da Google Art Project, che contengono scansioni di pezzi provenienti da collezioni d’arte e musei di tutto il mondo. Ci sono dipinti, illustrazioni, schizzi e fotografie che ritraggono paesaggi, ritratti, immagini religiose, scene pastorali, scene di mare, illustrazioni scientifiche, dipinti preistorici all’interno di caverne, immagini astratte, dipinti cubisti e realisti e molto altro – un vasto (per quanto assolutamente incompleto) archivio dell’immaginazione, dei sentimenti, dei desideri e dei sogni dell’uomo, catalogato da quel deposito della nostra coscienza collettiva che è Google»19. Nell’attraversamento di quel grande deposito della nostra «coscienza collettiva» che è Google, le incrinature del vedere della gan diventano le nostre incrinature, le 227


mancanze e le deformazioni della sua rappresentazione si trasformano in una domanda sul nostro stesso vedere e comprendere20: «Gli algoritmi di intelligenza artificiale sono in circolazione da decenni, ma recentemente la loro popolarità è in forte aumento. Ciò viene spesso attribuito ai recenti progressi in termini di potenza dei computer e alla disponibilità di enormi moli di dati di addestramento. Tali progressi, tuttavia, sono innegabilmente alimentati dagli investimenti multi-miliardari dei produttori di sistemi di sorveglianza di massa – imprese tecnologiche i cui modelli di business sono incentrati sulla pubblicità mirata, psico-grafica, ed entità governative impegnate nella “guerra al terrorismo”. Il loro obiettivo è rendere automatica la comprensione dei big data, cioè la comprensione di testi, immagini e suoni. Ma che cosa significa “comprendere”? Che cosa significa “apprendere” o “vedere”?»21.

A hideaway in the wasteland Uno dei maggiori motivi di interesse tecnico e commerciale nei confronti delle gan è, come si è accennato, che sono in grado di produrre una grande varietà di immagini di alta qualità. I ricercatori stanno cercando, a tal scopo, di ampliare progressivamente il dataset di partenza, riducendo al tempo stesso gli scarti e le incertezze presenti nei risultati. Nel 2018 è nato così Biggan, istruito a partire da quell’enorme deposito di immagini che è ImageNet e in grado di generare ogni categoria di immagini in esso presenti. Se diamo uno sguardo alla presentazione di Biggan fornita dalla rivista online «Synced», troviamo alcuni esempi: un fungo rosso a pallini bianchi, un cagnolino Yorkshire, un piatto di spaghetti22… Immagini banali, già viste, ma attraversate a tratti ancora da alcune incongruenze. L’imperfezione del mezzo – un’imperfezione destinata probabilmente a diminuire con i progressi della ricerca – fa sì che quel grande serbatoio di luoghi comuni che è ImageNet non si riproduca semplicemente, ma che possa aprirsi in tali immagini un’incrinatura, un momento (seppure nascosto e passeggero) di dubbio. Su questo momento si è concentrato l’artista Mario Klin228

gemann, in uno dei suoi ultimi progetti, Hyperdimensional Attractions Series: «Per il suo ultimo progetto, Klingemann è ricorso al più potente strumento di intelligenza artificiale attualmente disponibile: Biggan. La versione più elaborata di questa gigantesca gan, realizzata con il contributo di Google, contiene ben 355,7 milioni di parametri – il quadruplo rispetto ai modelli precedenti. Come spiega Klingemann, «Questo modello è quasi un universo a sé. Ha dimensioni straordinarie e in un certo senso racchiude un intero universo in sé. Animali, oggetti, elementi naturali, strumenti... Lì dentro c’è tutto”»23. Biggan, una delle ai “più potenti” che esistono al momento, ha «un intero universo in sé»: «animali, oggetti, elementi naturali, strumenti…». Ma ciò che interessa all’artista è il momento in cui una di queste immagini familiari smette di essere tale e inizia a porre delle domande. Questo, all’interno di Biggan, accade non appena si modificano alcuni parametri: il cane diventa un uccello e il fungo una torre. In tal senso, nell’universo di Biggan «non ci sono confini rigidi» ma «tutto è connesso», come in un gigantesco serbatoio di somiglianze inaspettate: «Per Biggan non ci sono confini rigidi, tutto è connesso», spiega Mario Klingemann. «Non ci sono differenze tra un cane, un uccello o una figura astratta. Tutto rientra nella medesima gradazione ed è composto dalle stesse parti. Questo universo virtuale è fluido e smisurato. Come un naturalista del xix secolo, Klingemann parte per un viaggio di scoperta». Il paragone tra l’artista che viaggia alla scoperta dello spazio smisurato di Biggan e lo scienziato del xix secolo non è casuale. A ogni parametro modificato, infatti, corrisponde realmente un nuovo tipo di immagine, una nuova creatura abitante degli «spazi di mezzo» («in-between spaces») di Biggan: «Nell’universo iperdimensionale di Biggan, ogni coordinata rappresenta un’immagine. Alcune immagini sono familiari – come un cane, o un fungo – ma altre sono figure affascinanti che abitano gli “spazi di mezzo”, i mondi non fisici in cui “cane” e “fungo” non hanno alcun significato. Si tratta di esseri inesistenti, prodotti dell’intelligenza artificiale […]»24. Prima di dare vita a Hyperdimensional Attractions Series, l’esplorazione dello spazio latente di Biggan era stata raccontata da Klingemann su Twitter in forma di un viaggio, che vale la pena ripercorrere in alcune tappe25. 229


Tutto inizia con la scoperta di un misterioso fortino, che l’artista chiama «un rifugio nelle lande desolate di Biggan» (A hideaway in the wastelands of #Biggan). La seconda immagine è quella di «uno strano artefatto, nelle lontane montagne. Troppo fuori mano per raggiungerlo con le mie scarse scorte d’acqua». Anche le provviste di cibo scarseggiano, ma l’esploratore vorrebbe evitare di dover attingere alla fauna locale, come il bizzarro insetto-uccellino presentato nella terza immagine. L’esplorazione prosegue rivelando dolci mammiferi che si muovono con il vento, incomprensibili geroglifici e antichi macchinari. Una tempesta di sabbia investe l’esploratore. Quando finisce, lascia il posto a strani giochi di luce, che lasciano appena intravedere alcune figure in avvicinamento. Altre avventure attendono il viaggiatore, che verrà alla fine depositato su un’isola, dove una giacca si muove incomprensibilmente al vento (uno spaventapasseri alieno)? Uno degli interlocutori di Klingemann osserva su Twitter che questo viaggio è «molto Star Wars»26. È un’indicazione preziosa, se si pensa al modo in cui i primi episodi di questa serie hanno influenzato l’immaginario popolare sino a oggi, dando vita a innumerevoli prequel e sequel27. Uno degli aspetti che più hanno contribuito al successo di questi film è, indubbiamente, la grande quantità di strane creature, familiari e totalmente altre al tempo stesso, che li popolano. Nella famosa scena del bar del primo episodio28, ad esempio, vediamo sfilare un’intera galleria giocosa di mostri alieni che bevono, fumano e suonano proprio come noi, suscitando nello spettatore un’irrefrenabile (per quanto timorosa) simpatia. Qualcosa di simile evocano gli strani animali che Klingemann ci presenta in questo vaggio e nella serie Hyperdimensional Attractions. Spesso l’arte di Klingemann è stata paragonata a quella di Francis Bacon29. Questo in alcuni casi è vero – si confronti in particolare l’opera, vincitrice del Lumen Prize, The Butcher’s Son (2017), che ricorda l’interesse di Bacon per le mutilazioni e le lacerazioni del corpo (in questo caso, del volto), per il corpo al di là di qualsiasi intenzione o capacità rappresentativa30. Il lavoro che Klingemann intraprende con la serie Imposture, di cui fa parte The Butcher’s Son, tuttavia, è parte di un progetto più ampio, 230

https://bit.ly/31GBhYY

A hideaway in the wastelands of #Biggan, viaggio nello spazio latente della Biggan raccontato da Klingemann su Twitter a fine 2018.

p. 102

16

p. 91

Mario Klingemann

@quasimondo

Quali pericoli e quali prodigi mi aspettano su quest’isola? Troverò cibo, acqua, rifugio? E da dove diavolo è saltato fuori all’improvviso questo mantello? Forse continua in un altro thread.

231


che indaga gli elementi «artefatti» che la resa del corpo umano da parte di una ai implica. L’artefatto, errore o incongruenza nella resa della figura, è qualcosa che appartiene all’uso della ai come mezzo rappresentativo, proprio come la grana di una fotografia, o il tessuto di jpg nella sua versione digitale: «Nella pellicola fotografica c’è la grana. Nel video ci sono alcune texture jpg. E ora, nelle reti neurali, ci sono questi artefatti convoluzionali. Ho scoperto che mi piacciono. In questa serie ho cercato di fare miei gli artefatti»31. Gli “artefatti” possono essere di vario tipo: possono segnare l’irrompere di una materialità caotica, come in The Butcher’s Son, ma anche una sottrazione, come nelle figure scarne, più simili ad androidi che a umani, che si intravedono nelle altre opere della stessa serie, o l’isolamento di alcune parti del corpo, come nel caso della fanciulla di un’altra immagine di Imposture, di cui intravediamo, poeticamente, solo le gambe e un naso tra i capelli32. In tutti questi casi, l’interesse dell’artista è incentrato su ciò che succede alla figura umana una volta usato questo particolare mezzo, l’intelligenza artificiale e, in particolare, la gan. Questo tipo di ricerca prosegue nell’itinerario artistico di Klingemann con Uncanny Mirror, un’installazione interattiva in cui gli spettatori sono ritratti in tempo reale dalla gan, e Circuit Training, in cui gli spettatori vengono invitati a entrare in una cabina fotografica in cui la macchina acquisisce i loro dati, poi i vari “ritratti” vengono votati dal pubblico, così che la macchina possa imparare via via quali risultano più interessanti allo sguardo umano33. Cosa significa fare un ritratto quando, dal mezzo pittorico o fotografico, si passa all’intelligenza artificiale? È l’interrogativo che sta alla base di queste opere. Un primo tentativo di risposta ci può venire dallo straordinario Memories of Passersby i, l’opera venduta nel 2019 con grande successo da Sotheby’s. Qui l’elemento passeggero e fuggitivo, come capiamo già dal titolo stesso, diventa particolarmente importante. La gan genera una serie infinita di ritratti, tutti unici e irripetibili, di persone inesistenti. Il risultato è una serie di ritratti di visi in evoluzione, di identità possibili. 232

20

p. 95

15

p. 88

p. 96

p. 76-77

15. Circuit Training, Mario Klingemann 2019. Installazione interattiva in tre parti che cattura le immagini dei partecipanti per creare set di dati usati poi per allenare le reti neurali. Siete invitati a giudicare le immagini prodotte dal sistema e, così facendo, gli insegnate ciò che trovate interessante. La macchina impara costantemente da questa interazione umana a creare un’opera d’arte in evoluzione, che comprende una composizione delle immagini più attraenti.

Mario Klingemann presenta Circuit Training. https://vimeo.com/400533160

233


16-19. Circuit Training, Mario Klingemann 2019. Installazione interattiva al Barbican di Londra: “AI: More than Human�, 2019.

234

235


Ci avviciniamo così a un altro elemento che allontana l’arte di Klingemann da quella di Bacon, a cui è spesso paragonata. Se si considerano altre opere, come il ritratto esposto nel 2017 nella Galleria online nips34, ci si accorge che qualcosa di diverso emerge. Nel corpulento e bizzarro signore che ci si fa incontro qui, vestito (seppure a suo modo) di tutto punto, a emergere non è tanto, come in Bacon, la volontà di mettere a nudo qualcosa a cui non possiamo sfuggire, quanto la possibilità di qualcosa che ci sfugge e a cui dobbiamo ancora prestare ascolto. Molti anni prima dell’invenzione delle gan uno studioso belga, Luc Steels, pioniere dell’ai e fondatore del Sony Computer Science Laboratory di Parigi, effettua un progetto sull’apprendimento del linguaggio naturale da parte dell’ai, a cui dà il titolo «rock» di «Talking Heads»35. Si tratta, infatti, di diverse unità di ai, «teste parlanti robotiche, impegnate in giochi linguistici con altre teste robotiche o con interlocutori umani, a proposito di scene reali del mondo che percepiscono con i loro sensori»36. L’obiettivo di Steels è quello di spostare l’attenzione anche nel campo dell’intelligenza artificiale sul fatto che il linguaggio emerge in modo dinamico da una rete concreta di relazioni37. Ma ciò che più importa qui, per tornare alle gan, è il modo in cui Steels descrive l’incontro tra la sua comunità di talking heads, che hanno sviluppato ormai un loro piccolo linguaggio comune, e il pubblico umano. La reazione del pubblico è quella, stupita e rispettosa, di chi si avvicina a un’altra lingua38. Le gan non possiedono una loro lingua, non nel senso, perlomeno, di riferirsi a un mondo esterno con cui entrino in relazione. Il loro immaginario di partenza, come si è accennato, è il nostro39. L’esigenza a cui le opere create con questa tecnica ci mettono di fronte è però la possibilità di un’altra lingua per noi, dell’emergere di un «in-between» che chiede di essere ascoltato. Quello a cui lo strano signore dalle grandi orecchie e il buffo mammifero che si muove col vento ci mettono di fronte, e la radice al tempo stesso della tenerezza che ci ispirano, è qualcosa che a loro (e a noi) ancora manca, e che ci chiama a un nuovo ascolto, a sospendere momentaneamente il controllo (controllo sui risultati nel processo artistico, e controllo sull’identificazione dell’immagine)40 per arrivare a capirli, e a capirci. 236

https://youtu.be/iJl-pM3FzSw

Mario Klingemann: Neurography An Interview.

20. Mario Klingemann, ritratto, neurografia con l'utilizzo del microscopio elettronico, 2017.

237


NOTE E BIBLIOGRAFIA


Arte e intelligenza artificiale: alcune domande Alice Barale

In Silico Trials, in «Frontiers in Bioengineering and Biotechnology», 3 maggio 2018, https:// doi.org/10.3389/fbioe.2018.00053 (ultimo accesso aprile 2020). 14 Cfr.

Aspuru Guzik A., Intervista. L’assistente chimico virtuale, in «Intelligenza artificiale», 4, 2017.

1

«Belamy» è ovviamente un’allusione a «Goodfellow», il cognome dell’inventore delle gan, di cui si tratterà tra breve.

6

2

7

Artificial intelligence, da ora in poi abbreviata spesso in ai. Su cosa sia l’intelligenza artificiale e sui diversi tipi di ai, cfr. Boden M., Artificial Intelligence. A Very Short Introduction, Oxford University Press, Oxford 2018. Cfr. anche Russell S., Norvig P., Artificial Intelligence – A Modern Approach, Paerson, 2016 Frankish K., Ramsey W. (eds.), Cambridge Handbook of Artificial Intelligence, Cambridge University Press, Cambridge 2014. Sulle deep neural networks cfr. Goodfellow I., Bengio Y., Courville A., Deep Learning, mit Press, Cambridge ma 2017. Su arte e intelligenza artificiale cfr. A.I. Miller, The Artist in the Machine. The World of AIPowered Creativity, mit Press, Cambridge MA 2020 Du Sautoy M., The Creativity Code. How ai is learning to write, paint and think, Harper Collins, London 2019. Di Miller cfr. anche l’interessantissima pagina web: https://www. artistinthemachine.net/ Per un’indagine sul rapporto tra estetica, arte digitale e i più recenti sviluppi dell’intelligenza artificiale, cfr. Marfia G., Matteucci G. (a cura di), Towards a digital aesthetics, numero monografico di “Studi di Estetica”, 12/2018 (http://mimesisedizioni.it/journals/index.php/studi-di-estetica/issue/view/76) 3

O perlomeno dell’intelligenza artificiale e delle gan a questo stadio di sviluppo: è un problema che verrà analizzato in seguito. 4

Cfr. su questo KlingemannM., Presentazione di Memories of Passersby, infra, p. 77.

5

Cfr. su questo il testo relativo a Obvious, infra, p. 169.

240

Boden M., Foreword to J. McCormack, M. d’Inverno (eds.), Computers and Creativity, Springer, London-New York 2012. Ibidem. Nella sua prefazione Boden si riferisce in particolare alla mostra di David Hockney «A Bigger Picture», allora appena inaugurata (siamo nel 2016) alla Royal Academy of Arts di Londra. 8

Cfr. su questo d’Inverno M., McCormack J., Heroic versus Collaborative ai for the Arts, in Yang Q., Wooldridge M. (eds.), Proceedings of the Twenty-Fourth International Joint Conference on Artificial Intelligence (ijcai 2015) Palo Alto, California, aaai Press, pp. 2438-2444. 9 Cfr. Goodfellow I.J.

et al., Generative Adversarial Networks, ArXiv:1406.2661 [Cs, Stat], June 2014. http://arxiv.org/abs/1406.2661. Per il racconto cfr. il twitter di Goodfellow: https://twitter.com/goodfellow_ian/status/ 942924939304173568 (ultimo accesso aprile 2020).

10

Per il chiarimento di che cosa sia una rete neurale, cfr. il saggio qui proposto di Castelle M., infra, p. 21. 11

Sulla differenza tra le prime e le più recenti gan, cfr. ancora Castelle, infra, p. 21. 12 Goodfellow I.J. et al., Generative Adversarial Networks, cit., p. 1. 13 Cfr.

Kazeminia S. et al., gan for Medical Image Analysis, 2018, preprint: https:// www.groundai.com/project/gans-for-medicalimage-analysis/1 (ultimo accesso aprile 2020); F. Galbusera et al., Exploring the Potential of Generative Adversarial Networks for Synthesizing Radiological Images of the Spine to be Used

15

Zhang K., Stock Market Prediction Based on Generative Adversarial Network, in «Procedia Computer Science», 147, 2019.

Lo stesso Robbie Barrat, un artista di cui si tratta nel presente volume (infra, p. 201), vi si è dedicato ultimamente. Cfr. l’intervista Do Androids Dream of Balenciaga SS29? https:// www.ssense.com/en-us/editorial/fashion/doandroids-dream-of-balenciaga-ss29 (ultimo accesso aprile 2020).

16

26 Cfr.

su questo tema Mazzocut-Mis M., ScarE., Fotografia: temi e Problemi, Mimesis, Milano 2019. pellini

27

Le reazioni di Barrat sono visibili sul suo account twitter: https://twitter.com/videodrome/ status/1055285640420483073?lang=it Cfr. anche le critiche mosse a Obvious da Mario Klingemann sul «New York Times» (https:// www.nytimes.com/2018/10/22/arts/design/ christies-art-artificial-intelligence-obvious.html; ultimo accesso aprile 2020) e sul suo account twitter: https://twitter.com/quasimondo/status/1056211563361828865 (ultimo accesso aprile 2020). 28 Per altre riflessioni sul problema dell’autorialità nella gan art cfr. il saggio di Moruzzi C.: infra, p. 149.

in-

29 Cfr. il mio saggio alla fine del presente volume.

Ridler A., Set di dati e decandenza. Fall of the House of Usher, infra, p. 113.

30 Bailey J., AI Artist Robbie Barrat And Painter Ronan Barrot Collaborate On “Infinite Skulls», cit., https://www.artnome.com/ news/2019/1/22/ai-artist-robbie-barrat-andpainter-ronan-barrot-collaborate-on-infiniteskulls (ultimo accesso aprile 2020).

17 Castelle M., La vita sociale delle fra, p. 21.

gan,

18

19

Ibid., p. 113.

20

Ibid., p. 113.

21 Cfr. su questo Desideri F., Ratio, Mimesis, Dialectics: on some motifs in Theodor W. Adorno, in «Discipline filosofiche», xxvi, 2, 2016, pp. 125-138. 22

Poe E.A., The Fall of the House of Usher (1839), tr. it. Il crollo della casa degli Usher, in Racconti, i, Milano, Rizzoli, 1989.

23

Ibid.

24 Obvious, 25

infra, p. 169.

Su questo tema del rapporto tra immaginario e tecnica cfr. gli scritti di Montani P., in particolare i recenti: Id., Tecnologie della sensibilità. Estetica e immaginazione interattiva, Cortina, Milano 2014 e Id., Emozioni dell'intelligenza. Un percorso nel sensorio digitale, Meltemi 2020.

31

Benjamin W., L’opera d’arte nell’epoca della sua riproducibilità tecnica, a cura di F. Desideri e M. Montanelli, Donzelli, Roma 2019.

32 Cfr. a questo proposito Rozzoni C., Fotografia e realtà, in Mazzocut-Mis M., Scarpellini E. (a cura di), Fotografia: temi e problemi, Mimesis, 2019, pp. 21-35 33 Klingemann M., testo di presentazione di Hyperdimensional Attractions Series, courtesy Onkaos: cfr. infra, p. 105. 34

Su questo aspetto cfr. anche infra, p. 105.

35

Klingemann M., testo di presentazione di Hyperdimensional Attractions Series, courtesy Onkaos: cfr. infra, p. 105.

241


La vita sociale delle reti antagoniste generative (gan) Michael Castelle

1

Per i fini del presente saggio ci limiteremo a discutere le reti neurali convoluzionali, escludendo le reti neurali ricorrenti, che sono di uso più comune per il trattamento di frasi e documenti nel campo dell’elaborazione del linguaggio naturale (Natural Language Processing o nlp); inoltre, la discussione sarà limitata all’apprendimento supervisionato (contrapposto all’apprendimento non supervisionato, in cui i dati inseriti non sono corredati da etichette esplicite, e/o all’apprendimento per rinforzo, in cui le reti si adattano in modo dinamico a un sistema più complesso di premi e punizioni). Si noti che la concezione dei ricercatori che si occupano di intelligenze artificiali riguardo alla possibilità di un apprendimento «senza insegnanti» o condotto secondo altre modalità «prive di contaminazione sociale» ha una natura implicitamente ideologica (Slezak 1989; Bechmann e Bowker 2019). 2

Sulle ideologie rappresentazionaliste della modellazione contrapposte ai modelli alternativi si vedano Morgan e Morrison (1999) e Knuuttila (2005b). 3 Le analogie alquanto affascinanti tra Derrida e il connessionismo sono ulteriormente esaminate in Globus (1995) e potrebbero essere utilmente riesumate oggigiorno in funzione di un nuovo tipo di «umanesimo digitale» che ripristini il primato della prima categoria rispetto alla seconda. 4 Le prime gan, come quelle descritte originariamente in I. Goodfellow et al. 2014, utilizzavano i cosiddetti strati pienamente connessi (si immagini un unico grande «filtro» che non deve essere «trascinato» attraverso il suo input,

242

come avviene in un livello convoluzionale). Sviluppi successivi, quali la Deep Convolutional gan o dcgan (Radford, Metz e Chintala 2015), hanno dimostrato la possibilità di far funzionare l’architettura duale della gan con generator e discriminator convoluzionali. 5 Salvo ove diversamente indicato, utilizzerò il termine «simbolico» nel senso del tipo di segno definito da Peirce come simbolo – un segno che fa riferimento al suo oggetto secondo la modalità arbitraria o convenzionale della relazione significante-significato di de Saussure (così, per esempio, la serie di caratteri árbol fa riferimento a un albero) (Saussure 1915), contrapposta al riferimento iconico o indicale.

Il successivo dibattito sul fatto che i «subsimboli» fossero o meno dei simboli rispecchia i limiti semiotici degli scienziati cognitivi, che non disponevano di termini quali indicale o deittico utilizzati da Suchman e Agre. 6

In altre formulazioni, come le gan di Wasserstein, il discriminator viene addestrato in modo più esteso rispetto al generator in ciascun passaggio (Arjovsky, Chintala e Bottou 2017).

7

8 La distinzione operata da Bourdieu tra imitazione e mimesi e l’analogo comportamento delle gan trovano un interessante parallelo nella letteratura sui modelli di dati contrapposta ai modelli «strutturalmente isomorfici» nel campo della filosofia della scienza (Knuuttila 2005b). In entrambi i casi, la semplice prospettiva della copia «isomorfica» viene contrapposta a un processo di riproduzione maggiormente «slegato» che può avere luogo senza un riferimento diretto alla «realtà» che si presume oggetto della modellazione.

Anche se in questa sede non ci addentreremo nella miriade di varianti delle gan, vale la pena di citare l’affascinante e suggestivo modello Cyclegan, composto da due coppie discriminator-generator che apprendono simultanea­mente, per esempio, a trasformare i cavalli in zebre e le zebre in cavalli all’interno di immagini statiche o di video (Zhu et al. 2017). 9

Gli esperti di apprendimento automatico potrebbero affermare che la trasponibilità è un tipo di generalizzabilità. 10

11

Per quanto l’uso delle reti neurali per la costruzione dei word embedding non fosse strettamente necessario (Goldberg 2015), le reti neurali profonde vengono utilizzate sistematicamente nelle iterazioni più recenti degli embedding che prendono in considerazione quantità maggiori di cosiddetto «contesto» (occorrenze congiunte di parole nell’ambito di paragrafi o interi documenti, invece che di brevi frasi).

12 Il problema è stato sollevato nel corso di un’intervista a Mario Klingemann, in relazione al suo utilizzo di cosiddetti ritratti di «grandi maestri» che rappresentano letteralmente le classi storicamente dominanti. Klingemann ha ammesso questa implicita riproduzione della stratificazione, replicando: «Per caso, realizzo un’arte politica» (Poscic 2018). 13

L’«assorbimento» delle convenzioni della fotografia amatoriale in una costruzione artificiale come Biggan costituisce un tema potenzialmente interessante, che trova riscontro in un precedente lavoro di Bourdieu del 1965 intitolato La fotografia. Usi e funzioni sociali di un’arte media (Bourdieu 1990d).

14 Nell’equazione minimax specificamente usata in Goodfellow et al. (2014), il discriminator cerca di massimizzare il primo termine (la valutazione precisa di numerose immagini tratte dall’insieme potenzialmente infinito di immagini «reali») e di minimizzare il secondo (la valutazione scorretta di numerose immagini tratte dal vastissimo insieme di immagini che il generator può creare sulla base di un vettore di partenza casuale).

Per una storia della teoria dei giochi che tiene conto del contesto culturale dell’Ungheria del primo Novecento e della seconda guerra mondiale, v. Leonard 2010. 15

16 L’idea delle gan come rappresentanti di una «funzione di perdita appresa» viene ricondotta a Philip Isola (Isola et al. 2016) e più in generale al laboratorio di Alexei Efros a Berkeley. 17 Per citare Loic Wacquant, ex studente e collaboratore di Bourdieu, «ogni componente coinvolta nella formazione dell’habitus è in sommo grado collettiva» (Wacquant 2014). 18 In effetti, per integrare appieno la logica della pratica di Bourdieu sarebbe necessario negare la netta distinzione tra processo di addestramento e impiego nell’ambito dell’apprendimento automatico.

Agre Philip E., Computation and Human Experience, Cambridge University Press, Cambridge 1997. Agre Philip E., Toward a Critical Technical Practice: Lessons Learned in Trying to Reform ai, in Geoff Bowker, Les Gasser, Susan Leigh Star e Bill Turner (a cura di), Bridging the Great Divide: Social Science, Technical Systems, and Cooperative Work, Lawrence Erlbaum Associates, New York 1997, pp. 131-158. Arjovsky Martin, Soumith Chintala e Léon Bottou, Wasserstein gan, in ArXiv:1701.07875 [Cs, Stat], gennaio 2017. http://arxiv.org/ abs/1701.07875 (ultimo accesso aprile 2020). Bailer-Jones Daniela M. e Coryn A.L. Bailer-Jones, Modeling Data: Analogies in Neural Networks, Simulated Annealing and Genetic Algorithms, in Lorenzo Magnani, Nancy J. Nersessian (a cura di), Model-Based Reasoning: Science, Technology, Values, Kluwer Academic-Plenum Publishers, New York 2002, pp. 147-165. https://doi.org/10.1007/978-1-46150605-8_9 (ultimo accesso aprile 2020). Barocas Solon e Andrew D. Selbst, Big Data’s Disparate Impact, ssrn Scholarly Paper id

243


2477899, Social Science Research Network, Rochester NY 2016. https://papers.ssrn.com/ abstract=2477899 (ultimo accesso aprile 2020). Bechmann Anja e Geoffrey C. Bowker, Unsupervised by Any Other Name: Hidden Layers of Knowledge Production in Artificial Intelligence on Social Media, in «Big Data & Society», 6, 1 (2019). Boden Margaret A., Mind as Machine: A History of Cognitive Science, Oxford University Press, Oxford 2006. —, gofai, in Keith Frankish e William M. Ramsey (a cura di), The Cambridge Handbook of Artificial Intelligence, Cambridge University Press, Cambridge 2014, pp. 89-107. https:// doi.org/10.1017/CBO9781139046855.007 (ultimo accesso aprile 2020). Bolukbasi Tolga, Kai-Wei Chang, James Zou, Venkatesh Saligrama e Adam Kalai, Man Is to Computer Programmer as Woman Is to Homemaker? Debiasing Word Embeddings, in ArXiv: 1607.06520 [Cs, Stat], luglio 2016. http://arxiv.org/abs/1607.06520 (ultimo accesso aprile 2020). Bourdieu Pierre, Esquisse d'une théorie de la pratiqueprécédé de trois études d’ethnologie kabyle, Librairie Droz, Gèneve 1972; tr. it. Per una teoria della pratica: con tre studi di etnologia della cabila, Raffaello Cortina, Milano 2003. —, Les trois états du capital culturel, in «Actes de la recherche en sciences sociales», 30 (1979), pp. 3-6. —, The Forms of Capital, in Richardson J. (a cura di), Handbook of Theory and Research for the Sociology of Education, Greenwood Press, New York 1986, pp. 241-258. —, In Other Words: Essays Towards a Reflexive Sociology, Stanford University Press, Stanford 1990a; tr. it. Cose dette: verso una sociologia riflessiva, Orthotes, Napoli-Salerno 2013. —, The Logic of Practice, tr. di Richard Nice, Stanford University Press, Stanford 1990b; ed.

244

or. Le sens pratique, Minuit, Paris 1980; tr. it. Il senso pratico, Armando, Roma 2003. —, The Scholastic Point of View, in «Cultural Anthropology», 5, 4, (1990c), pp. 380-391. —, Photography: A Middle-Brow Art, Polity Press, Cambridge 1990d; ed. or. con Luc Boltanski,Castel R. Chamboredon J.C., Un art moyen: essai sur les usages sociaux de la photographie, Minuit, Paris 1965; tr. it. La fotografia. Usi e funzioni sociali di un’arte media, 2a ed., Guaraldi, Rimini 2004. —, Outline of a Sociological Theory of Art Perception, in The Field of Cultural Production: Essays on Art and Literature, a cura di Bourdieu P. e Johnson Randal, Columbia University Press, New Press 1993a, pp. 215-237. http://web. mit.edu/allanmc/www/bourdieu3.pdf. (ultimo accesso aprile 2020). “Éléments d’une théorie sociologique de la perception artistique”, Revue internationale des sciences sociales, special issue on “Les arts dans la société”, 20/4 (1968), pp. 5-14. —, Sociology in Question, sage Publications Ltd, London-Thousand Oaks 1993b; ed. or. Questions de sociologie, Minuit, Paris 1980. —, Manet and the Institutionalization of Anomie, in The Field of Cultural Production: Essays on Art and Literature, a cura di P. Bourdieu e Randal Johnson, Columbia University Press, New Press 1993c, pp. 238-253. —, The Rules of Art: Genesis and Structure of the Literary Field, Polity Press, Cambridge 1996; ed. or. Les Règles de l’art. Genèse et structure du champ littéraire, Seuil, Paris 1992; tr. it. Le regole dell’arte. Genesi e struttura del campo letterario, il Saggiatore, Milano 2005. —, Manet: A Symbolic Revolution, tr. di Peter Collier e Margaret Rigaud-Drayton. Malden, ma: Polity Press, Malden ma 2017; ed. or. Manet: une révolution symbolique, Seuil, Paris 2013. Bourdieu Pierre e Jean-Claude Passeron, Reproduction in Education, Society and Culture, sage Publications Ltd, London 1990, 2a ed.; ed.

or. La reproduction. Eléments pour une théorie du système d’enseignement, Minuit, Paris 1970; tr. it. La riproduzione, sistemi di insegnamento e ordine culturale, Guaraldi, Rimini 1972. Bourdieu Pierre e Jean-Claude Passeron, The Inheritors: French Students and Their Relation to Culture, tr. di R. Nice, University of Chicago Press, Chicago 1979; ed. or. Les héritiers, Minuit, Paris 1964. Bourdieu Pierre e Loïc Wacquant, An Invitation to Reflexive Sociology, Polity Press, Chicago 1992. Brock Andrew, Jeff Donahue e Karen Simonyan, Large-Scale gan Training for High Fidelity Natural Image Synthesis, in ArXiv: 1809.11096, settembre 2018. https://arxiv.org/ abs/1809.11096 (ultimo accesso aprile 2020). Caliskan Aylin, Joanna J. Bryson e Arvind Narayanan, Semantics Derived Automatically from Language Corpora Contain Human-like Biases, in «Science», 356, 6334 (2017), pp. 183-186. https://doi.org/10.1126/science.aal4230 (ultimo accesso aprile 2020). Cardon Dominique, Jean-Philippe Cointet e Antoine Mazières, Neurons Spike Back: The Invention of Inductive Machines and the Artificial Intelligence Controversy, in «Reveaux», 5, 211 (2018), pp. 173-220. Colman Andrew M., Game Theory and Its Applications, 1a ed. Oxford 1982, Routledge, London-New York 1995. Cortes Corinna e Vladimir Vapnik, Support-Vector Networks, in «Machine Learning», 20, 3 (1995), pp. 273-297. https://doi.org/10.1023/A:1022627411411 (ultimo accesso aprile 2020). Creswell Antonia, Tom White, Vincent Dumoulin, Kai Arulkumaran, Biswa Sengupta e Anil A. Bharath, Generative Adversarial Networks: An Overview, in «ieee Signal Processing Magazine», 35, 1 (2018), pp. 53-65. https://doi.org/10.1109/MSP.2017.2765202 (ultimo accesso aprile 2020).

Deng Jia, Wei Dong, Richard Socher, Li-Jia Li, Kai Li e Li Fei-Fei, ImageNet: A LargeScale Hierarchical Image Database, in «2009 ieee Conference on Computer Vision and Pattern Recognition», 2009, pp. 248-255. https:// doi.org/10.1109/CVPR.2009.5206848 (ultimo accesso aprile 2020). Dreyfus Hubert, What Computers Can’t Do, mit Press, Cambridge ma 1972; tr. it. Che cosa non possono fare i computer: i limiti dell’intelligenza artificiale, Armando, Roma 1988. Dreyfus Hubert L. e Stuart E. Dreyfus, Making a Mind versus Modeling the Brain: Artificial Intelligence Back at a Branchpoint, in «Daedalus», 117, 1 (1988), pp. 15-43. Durugkar Ishan, Ian Gemp e Sridhar Mahadevan, Generative Multi-Adversarial Networks, in ArXiv:1611.01673 [Cs], novembre 2016. http://arxiv.org/abs/1611.01673 (ultimo accesso aprile 2020). Edwards Paul N., A Vast Machine: Computer Models, Climate Data, and the Politics of Global Warming, mit Press, Cambridge ma 2010. Elman Jeffrey L., Finding Structure in Time, in «Cognitive Science», 14, 2 (1990), pp. 179-211. https://doi.org/10.1207/ s15516709cog1402_1 (ultimo accesso aprile 2020). Fukushima Kunihiko, Neocognitron: A Self Organizing Neural Network Model for a Mechanism of Pattern Recognition Unaffected by Shift in Position, in «Biological Cybernetics», 36, 4 (1980), pp. 193-202. Ghosh Arnab, Viveka Kulharia, Vinay Namboodiri, Philip H.S. Torr e Puneet K. Dokania, Multi-Agent Diverse Generative Adversarial Networks, in ArXiv:1704.02906 [Cs, Stat], aprile 2017. http://arxiv.org/abs/1704.02906 (ultimo accesso aprile 2020). Girard René, Mimesis and Violence: Perspectives in Cultural Criticism, in «Berkshire Review», 14 (1979), pp. 9-19.

245


Globus Gordon G., Derrida and Connectionism: Différance in Neural Nets, in «Philosophical Psychology», 5, 2 (1992), pp. 183-197. https:// doi.org/10.1080/09515089208573055 (ultimo accesso aprile 2020). —, The Postmodern Brain, John Benjamins Publishing, Amsterdam-Philadelphia 1995. Goldberg Yoav, A Primer on Neural Network Models for Natural Language Processing, in ArXiv:1510.00726, 2015. http://u.cs.biu.ac.il/ ~yogo/nnlp.pdf (ultimo accesso aprile 2020). Goodfellow Ian, nips 2016 Tutorial: Generative Adversarial Networks, in ArXiv:1701.00160 [Cs], dicembre 2016. http://arxiv.org/abs/ 1701.00160 (ultimo accesso aprile 2020). Goodfellow Ian, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville e Yoshua Bengio, Generative Adversarial Networks, in ArXiv:1406.2661 [Cs, Stat], giugno 2014. http:// arxiv.org/abs/1406.2661 (ultimo accesso aprile 2020). Hargreaves-Heap, Shaun e Yanis Varoufakis, Game Theory: A Critical Introduction, Routledge, London-New York 1995, 2a ed. 2004. He Kaiming, Xiangyu Zhang, Shaoqing Ren e Jian Sun, Deep Residual Learning for Image Recognition, in ArXiv:1512.03385 [Cs], dicembre 2015. http://arxiv.org/abs/1512.03385 (ultimo accesso aprile 2020). Hertzmann Aaron, Can Computers Create Art?, in «Arts», 7 , 18 (2018). https:// www.mdpi. com/2076-0752/7/2/18/htm (ultimo accesso aprile 2020). Hubel David H. e Torsten N. Wiesel, Receptive Fields, Binocular Interaction and Functional Architecture in the Cat’s Visual Cortex, in «The Journal of Physiology», 160, 1 (1962), pp. 106154. Introna Lucas D. e Helen Nissenbaum, Facial Recognition Technology: A Survey of Policy and Implementation Issues, Center for Catastrophe

246

Preparedness & Response, New York University 2009. Isola Phillip, Jun-Yan Zhu, Tinghui Zhou e Alexei A. Efros, Image-to-Image Translation with Conditional Adversarial Networks, in ArXiv:1611.07004 [Cs], novembre 2016. http:// arxiv.org/abs/1611.07004 (ultimo accesso aprile 2020). Jaques Natasha, Angeliki Lazaridou, Edward Hughes, Caglar Gulcehre, Pedro A. Ortega, D.J. Strouse, Joel Z. Leibo e Nando de Freitas, Social Influence as Intrinsic Motivation for MultiAgent Deep Reinforcement Learning, ottobre 2018. https://arxiv.org/abs/1810.08647 (ultimo accesso aprile 2020). Klingemann Mario, A hideaway in the wastelands of #Biggan, 2018. Infra pp.216-2017. Knuuttila Tarja, Models as Epistemic Artefacts: Toward a Non-Representationalist Account of Scientific Representation, Philosophical Studies of the University of Helsinki, 8, Edita Prima, Vantaa 2005a. —, Models, Representation, and Mediation, in «Philosophy of Science», 72, 5 (2005b), pp. 1260-1271. https://doi.org/10.1086/508124 (ultimo accesso aprile 2020). Lamont Michèle, How Has Bourdieu Been Good to Think With? The Case of the United States, in «Sociological Forum», 27, 1 (2012), pp. 228-237. LeCun Yann, Bernhard E. Boser, John S. DenDonnie Henderson, Richard E. Howard, Wayne E. Hubbard e Lawrence D. Jackel, Backpropagation Applied to Handwritten Zip Code Recognition, in «Neural Comput», 1, 4 (1989), pp. 541-551. https://doi.org/10.1162/ neco.1989.1.4.541 (ultimo accesso aprile 2020). ker,

LeCun Yann, Léon Bottou, Yoshua Bengio e Patrick Haffner, Gradient-Based Learning Applied to Document Recognition, in «Proceedings of the ieee», 86, 11 (1998), pp. 2278-2324. https://doi.org/10.1109/5.726791 (ultimo accesso aprile 2020).

Leonard Robert, Von Neumann, Morgenstern, and the Creation of Game Theory: From Chess to Social Science, 1900-1960, Cambridge University Press, Cambridge 2010. Lévi-Strauss Claude, The Savage Mind, The University of Chicago Press, Chicago 1966; ed. or. La pensée sauvage, Plon, Paris 1962; tr. it. Il pensiero selvaggio, il Saggiatore, Milano 1964. Lizardo Omar, The Cognitive Origins of Bourdieu’s Habitus, in «Journal for the Theory of Social Behaviour», 34, 4 (2004), pp. 375-401. https:// doi.org/10.1111/j.1468-5914.2004.00255.x (ultimo accesso aprile 2020). Mackenzie Adrian, Machine Learners: Archaeology of a Data Practice, mit Press, Cambridge ma 2017. Maton Karl, Habitus, in Pierre Bourdieu: Key Concepts, 1a ed. Michel Grenfell, 2008, Routledge, New York 2014. Merriman Ben, Rewriting the Rules of Art: Pierre Bourdieu’s “Manet: A Symbolic Revolution”, Los Angeles Review of Books, 19 novembre 2017. https://lareviewofbooks.org/ article/rewriting-the-rules-of-art-pierre-bourdieus-manet-a-symbolic-revolution/ (ultimo accesso aprile 2020). Mirza Mehdi e Simon Osindero, Conditional Generative Adversarial Nets, in ArXiv:1411.1784, novembre 2014. https://arxiv. org/abs/1411.1784 (ultimo accesso aprile 2020). Morgan Mary e Margaret Morrison, Models as Mediators: Perspectives on Natural and Social Science, Cambridge University Press, Cambridge 1999. Newell Allen, Physical Symbol Systems*, in «Cognitive Science», 4, 2 (1980), pp. 135-183. https://doi.org/10.1207/s15516709cog0402_2 (ultimo accesso aprile 2020). Noble Safiya Umoja, Algorithms of Oppression: How Search Engines Reinforce Racism, New York University Press, New York 2018.

Peirce Charles Sanders, Collected Papers of Charles Sanders Peirce, vol. 2, Elements of Logic, Harvard University Press, Cambridge MA 1932; tr. it. parziale Scritti di logica, a cura di Charles Hartshorne e Paul Weiss; scelta e traduzione di Aurelia Monti dai volumi 2-4 dei Collected Papers, La Nuova Italia, Firenze 1981. Piaget Jean, Genetic Epistemology, W.W. Norton & Co., New York 1971; ed. or. L’epistemologie genetique, puf, Paris 1970; tr. it. L’epistemologia genetica, Laerza, Bari 1971. Plunkett Kim e Virginia Marchman, U-Shaped Learning and Frequency Effects in a Multi-Layered Perception: Implications for Child Language Acquisition, «Cognition», 38, 1 (1991), pp. 43-102. https://doi.org/10.1016/0010-0277(91)90022-V (ultimo accesso aprile 2020). Plunkett Kim e Chris Sinha, Connectionism and Developmental Theory, in «British Journal of Developmental Psychology», 10, 3 (1992), pp. 209-254. https://doi.org/10.1111/j.2044835X.1992.tb00575.x (ultimo accesso aprile 2020). Poscic Antonio, The Pixels Themselves: An Interview With Mario Klingemann, in «The Quietus», 25 agosto 2018. https://thequietus.com/ articles/25188-mario-klingemann-ai-art-interview (ultimo accesso aprile 2020). Radford Alec, Luke Metz e Soumith Chintala, Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks, in ArXiv:1511.06434 [Cs], novembre 2015. http://arxiv.org/abs/1511.06434 (ultimo accesso aprile 2020). Rumelhart David E. e James L. McClelland, On Learning the Past Tenses of English Verbs, in Iid. (a cura di), Parallel Distributed Processing: Explorations in the Microstructure of Cognition, vol. 2, Psychological and biological models, mit Press, Cambridge ma 1986, pp. 216-271. http:// dl.acm.org/citation.cfm?id=21935.42475 (ultimo accesso aprile 2020).

247


Rumelhart David E., The Emergence of Cognitive Phenomena from Sub-Symbolic Processes, in Proceedings of the Sixth Annual Conference of the Cognitive Science Society, Erlbaum, Hillsdale NY 1984, pp. 59-62. Rumelhart David E., Geoffrey E. Hinton e Ronald J. Williams, Learning Representations by Back- Propagating Errors, in «Nature», 323, 6088 (1986), pp. 533-536. https://doi.org/10.1038/323533a0 (ultimo accesso aprile 2020). Rumelhart David E. e James L. McClelland (a cura di), Parallel Distributed Processing: Explorations in the Microstructure of Cognition, vol. 1, Foundations, mit Press, Cambridge ma 1986. https://dl.acm.org/doi/book/10.5555/104279 (ultimo accesso aprile 2020). Salimans Tim, Ian Goodfellow, Wojciech Zaremba, Vicki Cheung, Alec Radford e Xi Chen, Improved Techniques for Training gan, in nips’16: Proceedings of the 30th International Conference on Neural Information Processing Systems, Curran Associates Inc., New York 2016, pp. 2234-2242. http://dl.acm.org/citation.cfm?id= 3157096.3157346 (ultimo accesso aprile 2020). Saussure Ferdinand de, Cours de linguistique générale, Payot, Paris 1916; tr. it. Corso di linguistica generale, Laterza, Bari 1967. Sejnowski Terrence J., The Deep Learning Revolution, mit Press, Cambridge ma 2018. Simon Joel, Ganbreeder: Create Wild, Weird, and Beautiful Images, 2018. https://www.ganbreeder.app/ (ultimo accesso aprile 2020).

Smolensky Paul, On the Proper Treatment of Connectionism, in «Behavioral and Brain Sciences», 11 (1988), pp. 1-74.

Le gan e la questione della creatività nell’arte e nell’intelligenza artificiale

Steinkraus Dave, Patrice Y. Simard e Ian Buck, Using gpus for Machine Learning Algorithms, in Proceedings of the Eighth International Conference on Document Analysis and Recognition (icdar ’05.), ieee Computer Society, Washington DC 2005, pp. 1115-1119. https:// doi.org/10.1109/icdar.2005.251 (ultimo accesso aprile 2020).

Marian Mazzone

Suchman Lucy A., Plans and Situated Actions: The Problem of Human-Machine Communication, Cambridge University Press, Cambridge 1987. Topping Keith e Stewart Ehly (a cura di), Peer- Assisted Learning, Routledge, New York-London 1998. Turing Alan M., Intelligent Machinery, National Physical Laboratory Report, 1948. Vygotsky Lev S., Mind in Society: The Development of Higher Psychological Processes, nuova ed., Harvard University Press, Cambridge ma 1978; tr. it. Storia dello sviluppo delle funzioni psichiche superiori e altri scritti, Giunti-Barbèra, Firenze 1974.

Boden Margaret A., The Turing test and artistic creativity, «Kybernetes» 39, 2019, pp. 409-413. Clark Andy e David Chalmers, The extended mind, «Analysis» 58, 1998, pp. 7-19. Goodfellow Ian, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville e Yoshua Bengio, Generative adversarial nets, in «Advances in neural information processing systems», 2014, pp. 2672-2680. Elgammal Ahmed, Bingchen Liu, Mohamed Elhoseiny e Marian Mazzone, can: Creative adversarial networks, generating “art” by learning about styles and deviating from style norms, arXiv preprint arXiv:1706.07068, 2017.

Konsa Kurmo (Università di Tartu, Istituto di storia e archeologia), comunicazione via e-mail, marzo 2019. Klingemann Mario, sito web Quasimondo. com Martindale Colin, The clockwork muse: The predictability of artistic change, Basic Books, New York 1990. Marian Mazzone e Ahmed Elgammal, Art, creativity, and the potential of artificial intelligence, in «Arts» 8, 26, 2019. doi: 10.3390/ arts8010026 Monroy Antonio, Peter Bell e Björn Ommer, Morphological analysis or investigating artistic images, in «Image and Vision Computing» 32, 6, 2014, pp. 414-423.

Wacquant Loïc, Putting Habitus in Its Place: Rejoinder to the Symposium, in «Body & Society», 20, 2 (2014), pp. 118-139. https://doi. org/10.1177/1357034X14530845 (ultimo accesso aprile 2020).

Simonyan Karen e Andrew Zisserman, Very Deep Convolutional Networks for Large-Scale Image Recognition, in ArXiv:1409.1556 [Cs], settembre 2014. http://arxiv.org/abs/1409.1556 (ultimo accesso aprile 2020).

Zhu Jun-Yan, Taesung Park, Phillip Isola e Alexei A. Efros, Unpaired Image-to-Image Translation Using Cycle-Consistent Adversarial Networks, in ArXiv:1703.10593 [Cs], marzo 2017. http://arxiv.org/abs/1703.10593 (ultimo accesso aprile 2020).

Slezak Peter, Scientific Discovery by Computer as Empirical Refutation of the Strong Programme, in «Social Studies of Science», 19, 4 (1989), pp. 563-600. https://doi. org/10.1177/030631289019004001 (ultimo accesso aprile 2020).

Zwick Detlev e Nikhilesh Dholakia, The Epistemic Consumption Object and Postsocial Consumption: Expanding Consumer-Object Theory in Consumer Research, in «Culture, Markets, and Consumption», 9, 1 (2006), pp. 17-43.

248

Boden Margaret A., Computer models of creativity, «ai Magazine» 30, 3, 2009, pp. 23-34.

249


Set di dati e decadenza: The Fall of the House of Usher

Le gan e la mimesi Georgia Ward Dyer

Anna Ridler

1

Elgammal A., Liu B., Elhoseiny M., Mazzone M., can: Creative Adversarial Networks, Generating “Art” by Learning About Styles and Deviating from Style Norms, 21 giugno 2017.

Lange-Berndt P., How to Be Complicit with Materials, in Ead., Materiality (Documents of Contemporary Art), Whitechapel Art Gallery, London 2015.

2 Ganin Y., Kulkarni T., Babuschkin I., Ali Eslami S.M. e Vinyals O., Learning to write programs that generate images.

5

3

Goodfellow I.J., Pouget-Abadie J., Mirza M., Xu B., Warde-Farley D., Ozair S., Courville A., Bengio Y., Generative Adversarial Networks, eprint arXiv:1406.2661, 06/2014.

4

Gleick J., The Information: A History, A Theory, A Flood, HarperCollins, London 2011.

6

Borges J.L., A. Hurley, Collected fictions, Viking, New York 1998.

1

Benjamin W., Doctrine of the Similar, 1933, trad. inglese di K. Tarkowski, «New German Critique» 17, Special Walter Benjamin Issue (primavera 1979), pp. 65-69. Disponibile all’indirizzo: https://www.jstor.org/ stable/488010 [ed. it. Dottrina della similitudine, in Aura e choc, Einaudi, Torino 2012].

2 Benjamin W., On the Mimetic Faculty, 1933, Selected Writings 1927-1934, trad. inglese di E. Jephcott [ed. it. Sulla facoltà mimetica, in Angelus novus, Einaudi, Torino 1962]. 3

Picasso P., citato in L.J. Peter, Peter’s Quotations: Ideas for Our Time, Bantam Books, New York 1977/1979. 4

Berger J., Ways of Seeing, Penguin Books, London 1972 [ed. it. Questione di sguardi, traduzione di M. Nadotti, il Saggiatore, Milano 1998].

5 Mordvintsev A., Olah C., Tyka M., Inceptionism: Going Deeper into Neural Networks, Google Research Blog, 2015, disponibile all’indirizzo: http://googleresearch. blogspot.co.uk/2015/06/inceptionism-goingdeeper-into-neural.html

250

6

Lafrance A., When Robots Hallucinate, «The Atlantic», 2015, disponibile all’indirizzo: h t t p s : / / w w w. t h e a t l a n t i c . c o m / t e c h n o l ogy/archive/2015/09/robots-hallucinatedream/403498/

7 Watt W.C., Canons of Alphabetic Change, in de Kerckhove D., Lumsden C.J. (a cura di), The Alphabet and the Brain, Springer, Berlin 1988, disponibile all’indirizzo: https://doi. org/10.1007/978-3-662-01093-8_9 8 Un altro interessante percorso di ricerca potrebbe essere costituito dall’uso di altre tecniche di intelligenza artificiale al fine di quantificare la «somiglianza ai glifi» nell’ambito di un campionario di immagini di questo tipo. 9

https://twitter.com/ignotabooks?lang=en

10 Bridle J., Autonomous Trap 001, 2017, disponibile all’indirizzo: https://jamesbridle. com/works/autonomous-trap-001

251


Alla ricerca della creatività: le gan come paradigma dell’autonomia nel software per la composizione musicale Caterina Moruzzi

1 Boden M.A., The Creative Mind: Myths and Mechanisms, George Weidenfeld and Nicolson, London 1990, p. 1; tr. it. La mente creativa, Mondadori, Milano 1995. 2

Colton S., Creativity Versus the Perception of Creativity in Computational Systems, in «aaai Spring Symposium: Creative Intelligent Systems» (2008); B. Gaut, The Philosophy of Creativity, in «Philosophy Compass», 5, 12 (2010), pp. 1034-1046; Wiggins G., Searching for Computational Creativity, in «New Generation Computing», 24 (2005), pp. 209-222. 3

Wiggins G., A Preliminary Framework for Description, Analysis and Comparison of Creative Systems, in «Knowledge-Based Systems», 19 (2006), pp. 449-458 per un’elaborazione formale della teoria della creatività della Boden che si propone di risolverne alcuni aspetti incoerenti.

4

Wiggins G., Searching for Computational Creativity, cit.

5

Still A., d’Inverno M., A History Of Creativity For Future AI Research, in «Proceedings of the 7th International Conference on Computational Creativity», Pachet F., Cardoso A., Corruble V., Ghedini F. (a cura di) (iccc) (2016). 6 Minsky M., Why People Think Computers Can’t, in «AI Magazine», 3 (4), doi: https://doi. org/10.1609/aimag.v3i4.376 (1982) (ultimo accesso aprile 2020). 7

Albert R., Runco M., The History of Creativity Research, in Sternberg R.J. (a cura di), Handbook of Human Creativity, Cambridge University Press, New York 1999.

252

8

Bridy A. , Coding Creativity: Copyright and the Artificially Intelligent Author, in «Stanford Technology Law Review», 5 (2012), pp. 1-28; Dartnall T. (a cura di), Artificial Intelligence and Creativity, in «Studies in Cognitive Systems», 17 (1994).

9

Goldman A. (a cura di), Readings in Philosophy and Cognitive Science, mit Press, Cambridge ma 1993; Thagard P., Philosophy of Psychology and Cognitive Science, Elsevier, Amsterdam 2006. 10 Paul E.S., Kaufman S.B. (a cura di), The Philosophy of Creativity, Oxford University Press, Oxford 2014. 11

Van der Schyff D. et al., Musical Creativity and The Embodied Mind: Exploring The Possibilities of 4E Cognition And Dynamical Systems Theory, in «Music and Science», 1 (2018), pp. 1-18. 12 Dewey J., Art as Experience, Minton, Balch & Co., New York 1934; tr. it. Arte come esperienza, Aesthetica, Palermo 2010 e Elton M., Artificial Creativity: Enculturing Computers, in «Leonardo», 28 (1995), pp. 207-213. La dipendenza dal soggetto del concetto di creatività applicato a un prodotto è altresì la ragione che induce molti a non considerare il Test di Turing come una misura attendibile della creatività. Si vedano Ariza C., The Interrogator as Critic: The Turing Test and the Evaluation of Generative Music, in «Computer Music Journal», 33 (2009), pp. 48-70; Briot J.P., Hadjeres G., Pachet F., Deep Learning Techniques for Music Generation - A Survey, arXiv:1709.01620 [cs.sd] (2017) (ultimo accesso aprile 2020); Wiggins G.A., Pearce M.T., Müllensiefen D.,

Computational Modelling of Music Cognition and Musical Creativity, in The Oxford Handbook of Computer Music, Oxford University Press, Oxford 2011. 13

Si vedano Briot P., Hadjeres G., Pachet F., Deep Learning Techniques for Music Generation, cit.; D’Inverno M., J. McCormack (a cura di), Computers and Creativity, Springer, London 2012; Luck M., D’Inverno M., Creativity Through Autonomy and Interaction, in «Cognitive Computation», 4 (2012), pp. 332-346. Si veda Luck M, D’Inverno M., Creativity Through Autonomy and Interaction, cit. 14

15 Si veda Bown O., Experiments in Modular Design for the Creative Composition of Live Algorithms, in «Computer Music Journal», 35 (2011), pp. 73-85. 16

Si veda Dong H., Hsiao W., Yang L., Yang Y., Musegan: Multi-track Sequential Generative Adversarial Networks for Symbolic Music Generation and Accompaniment, arxiv:1709.06298 (2017) (ultimo accesso aprile 2020). 17

Si veda D’Inverno M., McCormack J. (eds.), Computers and Creativity, cit. 18

Si veda Jones D., Brown A.R., D’Inverno M., The Extended Composer: Creative Reflection and Extension With Generative Tools, in D’Inverno M., McCormack J. (a cura di), Computers and Creativity, cit. 19

Si vedano Jacob C. et al., Swarm Art: Interactive Art from Swarm Intelligence, in «Leonardo», 40 (2007), pp. 248-255; Johnson C., Romero Cardalda J.J., Genetic Algorithms In Vi­sual Art and Music, in «Leonardo», 35 (2002), pp. 175-184. Si veda inoltre Vasconcellos Grubow, OK Computer: The Devolution of Human Creativity and Granting Musical Copyrights to Artificially Intelligent Joint Authors, in «Cardozo Law Review», 40 (2018), p. 387, per una discussione sulla contitolarità e sulla necessità di definire la creatività allo scopo di determinare la titolarità del copyright

nel caso di interazioni tra umani e intelligenze artificiali nella generazione di musica. 20

Per un’ampia analisi degli algoritmi per la generazione musicale si veda Nierhaus G., Algorithmic Composition: Paradigms of Automated Music Generation, Springer, London 2009. Riguardo alle gan si veda Goodfellow I. et al., Generative Adversarial Networks, arXiv:1406.2661 (2014) (ultimo accesso aprile 2020). 21

Si veda http://kvfrans.com/variational-autoencoders-explained/ per una spiegazione relativa agli auto-codificatori variazionali (ultimo accesso aprile 2020). Si veda https://openai.com/blog/glow/ per un’introduzione a un modello generativo a flusso che utilizza come metodo la massimizzazione della verosimiglianza (ultimo accesso aprile 2020). 22

23

Si veda https://openai.com/blog/energybased-models/ per un’introduzione ai moduli a energia di Openai (ultimo accesso aprile 2020). 24

Si vedano Dong H., Hsiao W., Yang L., Yang Y., Musegan, cit.; Engel J. et al., ganSynth: Adversarial Neural Audio Synthesis, in icrl (2019); Yang L., Yang Y., MidiNet: A Convolutional Generative Adversarial Network for Symbolic-domain Music Generation Using 1d and 2d Conditions, arXiv:1703.10847 (2017) (ultimo accesso aprile 2020). 25 Si veda il paragrafo I limiti delle gan per alcuni esempi recenti dei successi riportati dalle gan nel campo delle arti visive. 26 Si vedano https://www.google.com/doodles/celebrating-johann-sebastian-bach e A. Huang et al., Counterpoint by Convolution, arXiv:1903.07227 (2019) (ultimo accesso aprile 2020). 27 Si vedano Goodfellow I. et al., Generative Adversarial Networks, cit., e Chen, Zhai, Ritter, Lucic, Houlsby, Self-Supervised Generative Adversarial Networks, arXiv:1811.11212 (2018) (ultimo accesso aprile 2020).

253


28

Goodfellow I. et al., Generative Adversarial Networks, cit., p. 1. 29

Si veda Yang L., Yang Y., Chou S., MidiNet, cit. 30

Si veda Engel S. et al., ganSynth: Adversarial Neural Audio Synthesis, cit.

38

Si vedano Galanter R., Computational Aesthetic Evaluation, cit.; Takagi H., Interactive Evolutionary Computation: Fusion of the Capabilities of ec Optimization and Human Evaluation, in «Proceedings of the ieee», 89 (2001), pp. 1275-1296.

31

Si veda Dong H., Hsiao W., Yang L., Yang Y., Musegan, cit.

Si veda Turing A., Computing Machinery and Intelligence, in «Mind», 49 (1950), pp. 433460.

32

40 Si

Si veda Briot J.P., Hadjeres G., Pachet F., Deep Learning Techniques for Music, cit., capitolo 5. Va sottolineato che spesso il corpus sonoro utilizzato per l’addestramento, quando non contiene rumore casuale o note musicali, è costituito da musica classica o romantica. Le motivazioni di tale scelta possono essere varie: (a) questo tipo di musica è in gran parte non soggetta al pagamento di royalty, (b) la struttura e lo stile di questo materiale sono codificati in modo più ampio, o (c) il grande pubblico ha familiarità con questo stile e può quindi apprezzare meglio le creazioni realizzate dal software.

39

Thagard P., Philosophy and Machine Learning, in «Canadian Journal of Philosophy», 20, (1990), pp. 261-276. 41 Si veda Boden M.A., Artificial Intelligence and Natural Man, Basic Books, New York 1981.

Briot P., Hadjeres G., Pachet F., Deep Learning Techniques for Music Generation, cit.

Si vedano Levinson R., Experience-based Creativity, in Dartnall T. (a cura di), Artificial Intelligence and Creativity, in «Studies in Cognitive Systems», 17 (1994), pp. 161-179; Thagard P., Stewart T.C., The aha! Experience: Creativity Through Emergent Binding in Neural Networks, in «Cognitive Science», 35 (2011), pp. 1-33; Van der Schyff D. et al., Musical Creativity and The Embodied Mind, cit.

34

43

33

Si veda Chu H., Urtasun R., Fidler S., Song From PI: A Musically Plausible Network for Pop Music Generation, arXiv:1611.03477 (2016) (ultimo accesso aprile 2020). Le rnn non sono tuttavia esenti da problemi; si veda Pascanu R., Mikolov T., Bengio Y., On the Difficulty of Training Recurrent Neural Networks, arXiv:1211.5063 (2012) (ultimo accesso aprile 2020). Si veda inoltre il paragrafo 4.3. 35

Si veda Chen T., Zhai X., Ritter M., LuM., Houlsby N., Self-Supervised Generative Adversarial Networks, cit. cic

36

Si veda P. Galanter, Computational Aesthetic Evaluation: Steps Towards Machine Creativity, in «Proceeding siggraph ‘12» (2012).

37

Arges K. et al., Evaluation of Musical Creativity and Musical Metacreation Systems, doi: http://dx.doi.org/10.1145/0000000.0000000, (2015), p. 2 (ultimo accesso aprile 2020).

254

42

Per esempio, FlowComposer, DeepBach, e GenJam si basano tutti sul principio di imitazione. emi, composer

44 Si potrebbe peraltro obiettare che anche molti compositori umani compongono imitando, almeno in qualche misura, la musica creata da altri. 45

Elgammal A., Liu B., Elhoseiny M., Mazzone M., can: Creative Adversarial Networks, Generating “Art” by Learning About Styles and Deviating from Style Norms, arXiv:1706.07068v1 (2017), p. 5 (ultimo accesso aprile 2020). 46

Ibidem.

47 Si veda Meyer L.B., Style and Music: Theory, History, and Ideology, University of Pennsylvania Press, Philadelphia 1989. 48

Uno degli aspetti problematici legati alla

definizione di «stile» sta nel fatto che, così come il concetto di creatività, anche quello di stile può essere in parte dipendente dal soggetto. Per di più, sarebbe lecito domandarsi se lo stile debba o meno essere necessariamente «intenzionale» – se cioè l’attore debba necessariamente avere l’intenzione di creare uno stile, o al contrario quest’ultimo possa manifestarsi per caso. 49 Si

veda https://www.theguardian.com/ technology/2016/mar/15/googles-alphago-seals-4-1-victory-over-grandmaster-lee-sedol (ultimo accesso aprile 2020).

50

Nella teoria dei giochi, l’equilibrio di Nash si crea quando uno dei giocatori cessa di modificare le proprie azioni, a prescindere da ciò che potrebbe fare l’avversario. Nel caso specifico, i due giocatori sono il generator e il discriminator. 51

Salimans T., Goodfellow I. et al., Improved Techniques for Training gan, arXiv:1606.03498 (2016), p. 1 (ultimo accesso aprile 2020). 52

Tra le altre difficoltà relative all’addestramento delle gan vi sono il problema della scomparsa del gradiente e quello della convergenza dei modi (mode collapse). Per i dettagli tecnici si vedano Chen T., Zhai X., Ritter M., Lucic M., Houlsby N., Self-Supervised Generative Adversarial Networks, cit.; Pascanu, Mikolov, Bengio, On the Difficulty of Training Recurrent Neural Networks, cit.; Salimans T., Goodfellow I. et al., Improved Techniques for Training gan, cit. e https://medium.com/@ jonathan_hui/gan-why-it-is-so-hard-to-traingenerative-advisory-networks-819a86b3750b (ultimo accesso aprile 2020). 53

Tra le soluzioni proposte figurano tecniche quali la discriminazione minibatch (si veda T. Salimans, I. Goodfellow et al,. Improved Techniques for Training gan, cit.), i dcgan (si veda Radford A., Metz L., Chintala S., Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks, arXiv: 1511.06434 [2015]; ultimo accesso apri-

le 2020) e la distanza di Wasserstein (si veda Dong H., Hsiao W., Yang L., Yang Y., Musegan, cit.). 54

Esempi di musica composta mediante sono disponibili ai seguenti indirizzi: https://magenta.tensorflow.org/performance-rnn, http://www.hexahedria.com/2015/08/03/ composing-music-with-recurrent-neural-networks/ e http://people.idsia.ch/~juergen/blues/. Esempi di musica composta mediante gan sono disponibili agli indirizzi http:// mogren.one/publications/2016/c-rnn-gan/ e https://salu133445.github.io/musegan/results (ultimo accesso aprile 2020). rnn

55

Per esempio, il ritratto intitolato Edmond de Belamy realizzato da Obvious mediante gan e Memories of Passersby di Mario Klingemann. 56

Si veda Karras T. et al., A Style-Based Generator Architecture for Generative Adversarial Networks, arXiv:1812.04948 (2018) (ultimo accesso aprile 2020).

57

Si veda Zakharov E. et al., Few-Shot Adversarial Learning of Realistic Neural Talking Head Models, arXiv:1905.08233 (2019) (ultimo accesso aprile 2020). 58

Si veda Mogren O., c-rnn-gan: Continuous Recurrent Neural Networks With Adversarial Training, arXiv:1611.09904 (2016) (ultimo accesso aprile 2020).

59

Si veda Yang L. , Chou S., Yang Y., MidiNet, cit. 60

Si vedano Dong H., Hsiao W., Yang L., Yang Y., Musegan, cit.; Elgammal A., Liu B., Elhoseiny M., Mazzone M., can: Creative Adversarial Networks, cit. Lee S., Hwang U., Min S., Yoon S., Polyphonic Music Generation with Sequence Generative Adversarial Networks, arXiv:1710.11418 (2017) (ultimo accesso aprile 2020); Salimans T., Goodfellow I. et al., Improved Techniques for Training gan, cit. Si veda Wiggins G.A., Pearce M.T., MülD., Computational Modelling of Music Cognition and Musical Creativity, cit. 61

lensiefen

255


62

Si veda Thagard P., Stewart T.C., The Experience, cit.

aha! 63

Si veda Bridy A., Coding Creativity, cit.

64

Si vedano Bridy A., Coding Creativity; VaGrubow G. J., ok Computer.

sconcellos 65

Si veda Vasconcellos Grubow G. J., Computer. 66

ok

Si vedano Collins N., Automatic Composition of Electroacoustic Art Music Utilizing Machine Listening, in «Computer Music Journal»,

256

36 (2012), pp. 8-23; Moffat D., Kelly M., An Investigation into People’s Bias Against Computational Creativity in Music Composition, in «Proceedings of the Third Joint Workshop on Computational Creativity» (2006). 67

Si veda Ariza C., The Interrogator as Critic,

cit. 68

Si veda Ariza C., The Interrogator as Critic, cit.; Boden M.A. (a cura di), Dimensions of Creativity, mit Press, Cambridge 1994.

257


A hideaway in the wastelands: nuove sfide filosofiche dell’ai art Alice Barale

Per alcuni degli utilizzi commerciali delle gan, cfr. supra. 1

2

Un esempio particolarmente chiaro è il sito ganbreeder.app, di cui parla nel suo saggio M. Castelle, che permette agli utenti di generare in automatico strane immagini, ibridi di diversi animali o tipi di oggetti esistenti. Cfr. supra, p. 21. 3

Cfr. su questo supra, p. 21.

Colli G. , La nascita della filosofia, Adelphi, Milano 1977. 4

Cfr. su questo Gebauer G., Wulf C., Mimesi. Arte, cultura, società, a cura di Borsari A., Bononia University Press, Bologna 2017; cfr. anche C. Wulf, Homo imaginationis. Le radici estetiche dell’antropologia storico-culturale, a cura di Desideri F. e Portera M., Mimesi, Milano 2017. 5

Su questo tema cfr. nel presente volume il saggio di Mazzone M.: supra, p. 53. Sul difficile problema della agi, cfr. Boden M., Artificial Intelligence: A Very Short Introduction, Oxford University Press, Oxford 2018, pp. 18-49. 6

7

Cfr. su questo supra.

Cfr. Bailey J., ai Artist Robbie Barrat And Painter Ronan Barrot Collaborate On «Infinite Skulls», in «Artnome», https://www.artnome. com/news/2019/1/22/ai-artist-robbie-barratand-painter-ronan-barrot-collaborate-on-infinite-skulls

8

Cfr. Benjamin W., Origine del dramma barocco tedesco, Carocci, Roma 2018. 9

10 Bailey J., AI Artist Robbie Barrat And Painter Ronan Barrot Collaborate On «Infinite Skulls», cit.

258

11

Ibidem.

12 Ciò non significa, appunto, negare l’autorialità. Ma quest’ultima dove va collocata: nell’opera d’arte o nell’algoritmo? Barrat si è molto risentito quando ha scoperto che il collettivo Obvious, anch’esso presente in questo volume, ha utilizzato un algoritmo che il giovane studioso aveva condiviso su Github per produrre una serie di ritratti, uno dei quali è stato venduto a Christie’s per più di 400.000 dollari. Su questa vicenda cfr. supra, pp. 15-16.

Cfr. Benjamin W., L’opera d’arte nell’epoca della sua riproducibilità tecnica, a cura di F. Desideri e M. Montanelli, Donzelli, Roma 2019.

13

A riguardo cfr. ancora Boden M., Artificial Intelligence, cit., pp. 34 ss.

14

Benjamin W., Infanzia berlinese intorno al millenovecento, Einaudi, Torino 2007.

15

Cfr. la presentazione che Memo Akten dà della sua opera: http://www.memo.tv/portfolio/ learning-to-see/ 16

17

Ibidem.

Diversa la scelta degli artisti che decidono di costruire il loro proprio dataset. Cfr. per questo l’opera di Anna Ridler Crollo della casa degli Usher, cfr. supra, p. 113. 18

19 http://www.memo.tv/portfolio/lear-

ning-to-see/ 20 Proprio l’imperfezione del mezzo, da questo punto di vista, potrebbe costituire il suo maggior interesse. Per questo stimolante spunto cfr. di nuovo il saggio di Ridler A., supra, p. 113.

21 http://www.memo.tv/portfolio/learning-

to-see/

in digital Art, in “Studi di estetica”, anno xlvi, iv serie, 3/2018, p. 40.

22

30

Zhang M., Biggan: A New State of the Art in Image Synthesis, in «Synced», 2 ottobre 2018, https://medium.com/syncedreview/biggan-a-new-state-of-the-art-in-image-synthesiscf2ec5694024. Sui pregiudizi che si esprimono in ImageNet cfr. Ridler A., supra, p. 113. 23

Klingemann M., testo di presentazione di Hyperdimensional Attractions, courtesy of Onkaos: cfr. infra, p. 104. 24

Ibid., p. 104.

25 https://twitter.com/quasimondo/status/

1064230996793614338. Su questa operazione di Kingemann cfr. anche il saggio di Castelle M., supra, p. 21. 26 https://twitter.com/quasimondo/status/

1064230996793614338 27

I primi episodi, realizzati tra la fine degli anni Settanta e i primi anni Ottanta, sono stati Guerre Stellari (Episodio iv), L’impero colpisce ancora (Episodio v) e Il ritorno dello Jedi (Episodio vi). A questi sono seguiti tre prequel, tra la fine degli anni Novanta e i primi anni Duemila, e tre sequel, negli ultimi anni. Un nuovo episodio è uscito nel 2020.

28

Primo in senso genetico, perché girato nel 1977. Nell’insieme prequel e sequel girati anni dopo è diventato il iv.

29

Cfr. ad es. ElgammalA., When the line between machine and artist becomes blurred, in “The Conversation”, October 2018 (https://theconversation.com/when-the-line-between-machine-and-artist-becomes-blurred-103149); Miller A., Can machines be more creative than humans?, in “The Guardian”, 4 marzo 2019 (https://www.theguardian.com/technology/2019/mar/04/can-machines-be-more-creative-than-humans); Verdicchio M., The digital

Cfr. su questo Desideri F., Forme dell’estetica: Dall’esperienza del bello al problema dell’arte, Laterza, Roma-Bari 2004, cap. ii. L’opera di Klingemann The Butcher’s Son è parte di una serie di sei opere, intitolata Imposture Series. È importante osservare che le altre cinque opere sono molto diverse da questa: magre ed evanescenti figure, più simili ad androidi che a umani alcune, e un’evanescente fanciulla in un’altra (cfr. supra, p. 91). 31 Klingemann M., testo di presentazione della serie Imposture, cfr. supra, p. 91. 32

Imposture, cfr. supra, p. 91.

33

Le due installazioni sono state esposte rispettivamente a Seoul Mediacity Biennale (6 settembre-18 novembre 2018) e al Barbican Centre di Londra (maggio 2019).

34

Esposta in occasione della 31esima conferenza Neural Information Processing Systems (nips 2017), Long Beach, CA, USA.

35

Steels L., The Talking Heads Experiment. Origin of Words and Meanings, Language Science Press, Berlin 2015. Il progetto di cui Steels tratta risale al 1999.

36

Ibid., p. 6.

37

Ibid., pp. 7-8.

38

Ibidem.

39 Per l’idea del nostro immaginario come mondo esterno delle gan cfr. Mazzone M., p. 53. 40

Questo tema della sospensione del controllo è espresso in modo particolarmente efficace e profondo nell’opera e nella riflessione di Ridler A.: cfr. supra, p. 113.

259


WHO’S WHO

Alice Barale Studiosa di Estetica, Alice Barale collabora con l’Università degli Studi di Firenze e di Milano Statale. È redattrice della rivista «Itinera» (https://riviste. unimi.it/index.php/itinera) e corrispondente di «Aisthesis» (https://oajournals.fupress.net/index.php/aisthesis). Ha studiato a Pisa, Pavia, Firenze, Venezia, e compiuto vari soggiorni di ricerca al Warburg Institute di Londra e al Walter Benjamin Archiv di Berlino. Si è occupata a lungo di Aby Warburg e di Walter Benjamin. Di quest’ultimo ha curato una nuova edizione e traduzione italiana de L’Origine del dramma barocco tedesco (Carocci, 2018). Tra i suoi progetti attuali, la prosecuzione della ricerca filosofica sul colore a partire da diverse prospettive (Il giallo del colore, Jaca Book, 2020), e la riflessione sul rapporto tra arte e intelligenza artificiale. In uscita per Jaca Book è anche un volume che raccoglie alcuni suoi saggi sul rapporto di Benjamin e di Warburg con l’opera di Shakespeare (Unarmed Arms: percorsi shakespeariani in Aby Warburg e Walter Benjamin, 2021). A Benjamin e Warburg, Alice Barale ha dedicato una monografia (La malinconia dell’immagine, Firenze 2009), una curatela (Energia e rappresentazione: Warburg, Panofsky, Wind, a cura di A. Barale, F. Desideri, S. Ferretti, 2016) e diversi articoli (tra cui: «To call fools into a circle», 2020; «Unbewaffnetes Auge», 2019; Stuff that matters, 2018; Baroque Sherlock, 2017; «Collectione et quasi compressione», 2016).


Michael Castelle

Mario Klingemann

Michael Castelle è Assistant Professor presso il Centre for Interdisciplin-ary Methodologies dell’Università di Warwick e Turing Fellow presso l’Alan Turing Institute di Londra (2018-2020). Ha conseguito un Ph.D. in Sociologia presso l’Università di Chicago e un Sc.B. in Computer Science alla Brown University. La sua attuale ricerca si concentra sull’epistemologia sociale e storica dell'apprendimento automatico, in rapporto con la teoria sociologica e antropologica.

Mario Klingemann è un pioniere nel campo delle reti neurali, del computer learning e dell'ai art. Ha lavorato con prestigiose istituzioni, tra cui la British Library, la Cardiff University e la New York Public Library, ed è Artist in Residence presso Google Arts and Culture. Le sue opere sono state esposte in tutto il mondo in istituzioni quali il MoMA e il Metropolitan Museum of Art di New York, la Photographers’s Gallery di Londra, il zkm di Karlsruhe e il Centre Pompidou di Parigi. Klingemann ha ricevuto il British Library Labs Artistic Award nel 2016 e nel 2018 ha vinto il Lumen Prize, dedicato alle opere realizzate attraverso la tecnologia. La sua installazione Memories of Passersby i è entrata nella storia nel marzo del 2019 come la prima opera ai autonoma a essere messa all’asta con successo da Sotheby’s.

@mccastelle https://castelle.org

262

@quasimondo http://facebook.com/mario.klingemann www.quasimondo.com


Marian Mazzone

Vera Minazzi

Marian Mazzone è esperta in new media e arte moderna e contem-poranea. Si occupa di arte computazionale e computer science in relazione con la storia dell’arte. Negli ultimi anni, ha lavorato alla Rutgers University come membro dell'Art & Artificial Intelligence Lab, curando numerose ricerche. Il suo lavoro ha due focus principali: la creatività nell’apprendimento automatico, e l’analisi degli stili e dei modelli visuali nella storia dell'arte per prevederne trasformazioni e sviluppi attraverso le reti neurali.

Vera Minazzi ha studiato musicologia e psicologia, ha lavorato in diversi ambiti e progetti informatici, anche inerenti alla musica. Senza mai lasciare nella custodia il suo clarinetto, è approdata all'editoria dove attualmente è Editore di Jaca Book, storica casa editrice indipendente con un ampio catalogo di filosofia, arti e scienze umane. Nel panorama editoriale italiano e internazionale, la casa editrice si caratterizza per i progetti che in varie forme mettono in dialogo le discipline, come nell'Atlante storico della musica nel Medioevo o come nella collana Psyché di recente apertura.

@MarianMazzone www.marianmazzone.weebly.com

264

265


Caterina Moruzzi

Obvious

Caterina Moruzzi è ricercatrice post-dottorato presso l'Università degli Studi di Torino, dove si occupa di intelligenza artificiale, creatività e innovazione. Ha conseguito il dottorato di ricerca nel 2018 presso l'Università di Nottingham con una tesi sull'ontologia delle opere musicali e un Master in Filosofia presso l’Università di Bologna, città in cui si è diplomata in Pianoforte presso il Conservatorio G.B. Martini. Contribuisce attivamente alla ricerca nei campi dell'Estetica e della Filosofia dell’Arte, presenziando a conferenze in tutto il mondo e pubblicando su riviste di grande rilievo.

Obvious è un collettivo parigino composto da Pierre Fautrel, Hugo Caselles-Dupré e Gauthier Vernier, tre ricercatori, artisti e amici attivi nel campo della creazione artistica attraverso l’intelligenza artificiale, che utilizzano i modelli più recenti di apprendimento automatico. Obvious aspira a democratizzare l'uso dell'intelligenza artificiale a scopi creativi. Il collettivo rivista la storia dell’arte di diverse civiltà, e la loro opera Edmomd de Belamy è entrata nella storia a ottobre 2018 da Christie's New York, come il primo quadro firmato con un algoritmo mai battuto all'asta.

@CaterinaMoruzzi www.caterinamoruzzi.wixsite.com/caterinamoruzzi

@obv_ious https://www.facebook.com/obviousart/ www.obvious-art.com

266

267


Anna Ridler

Georgia Ward Dyer

Anna Ridler è un’artista e ricercatrice britannica. ma in Information Experience Design al Royal College of Art e ba in English Literature and Language alla Oxford University con una fellowship al Creative Computing Institute della University of the Arts di Londra. Ha esposto presso istituzioni quali il V&A Museum, la Tate Modern, il Barbican Centre, il Centre Pompidou, HeK Basel, il zkm Karlsruhe, Ars Electronica, il Sheffield Documentary Festival e il Leverhulme Centre for Future Intelligence. Ha vinto il dare Art Prize 20182019. Artnet l'ha indicata fra i nove "artisti pionieri" nell'uso creativo dell'ai.

Georgia Ward Dyer è un'artista, scrittrice, curatrice e ricercatrice che lavora all’incrocio tra arte, filosofia e tecnologia, collaborando con scienziati di diversi discipline. Si è laureata in Filosofia presso l’Università di Cambridge, la University of the Arts di Londra e il Royal College of Art. Ha pubblicato ricerche commissionate da organizzazioni quali l'Arts Council England, il Parlamento Europeo e la Fondazione internazionale per l'innovazione nesta, per la quale ha anche curato una serie di eventi fra cui il FutureFest. Le sue opere d’arte sono state esposte in istituzioni come il Victoria and Albert Museum e la Wellcome Collection di Londra.

@annaridler www.annaridler.com

@GeorgiaWD www.nesta.org.uk/team/georgia-ward-dyer

268

269


CREDITI ICONOGRAFICI

Le gan e la questione della creatività nell’arte e nell’intelligenza artificiale Pagg. 52, 60-73: courtesy Marian Mazzone

Le gan e la mimesi Pagg. 136-141: courtesy Georgia Ward Dyer

Mario Klingemann, Memories of Passersby I, 2018 Pagg. 76, 78-89: courtesy Onkaos © Mario Klingemann

La Famille de Belamy e i Sogni elettrici di Ukiyo: reinterpretazioni e accelerazioni Pagg. 168, 176-191: courtesy Obvious

Imposture Series, 2017 Pagg. 90-97: courtesy Onkaos © Mario Klingemann Uncanny Mirror, 2018 Pagg. 98-103: courtesy Onkaos © Mario Klingemann Hyperdimensional Attractions Series, 2019 Pagg. 104-111: courtesy Onkaos © Mario Klingemann

Gan e musica, on the road Pag. 196: courtesy François Pachet e Fiammetta Ghedini A hideaway in the wastelands: nuove sfide filosofiche dell’ai art Pagg. 221-223: Robbie Barrat e Ronan Barrot; pagg. 224-225: courtesy Robbie Barrat; pagg. 226-229: courtesy Memo Akten; pag. 233, 235-237, 239 : courtesy Onkaos © Mario Klingemann

Traduzione dall’inglese di Cristiano Screm dei testi di Michael Castelle, Mario Klingemann, Marian Mazzone, Caterina Moruzzi, Obvious, Anna Ridler, Georgia Ward Dyer Impaginazione e redazione Jaca Book Copertina e grafica Paola Forini / Jaca Book

Stampa e legatura Grafiche Stella San Pietro di Legnago -Verona (VR) ottobre 2020

Set di dati e decadenza: Fall of the House of Usher Pagg. 112-127: courtesy Anna Ridler

ISBN 978-88-16-60601-2 Editoriale Jaca Book via Frua 11, 20146 Milano, tel. 02/48561520 libreria@jacabook.it; www.jacabook.it Seguici su



Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.