L’intelligenza artificiale è un campo in rapida crescita che sta cambiando il modo in cui viviamo e lavoriamo. Una delle sue applicazioni più sorprendenti, che è diventata una vera mania sul web, è la capacità di elaborare testi ed immagini. In entrambi i casi il sistema funziona con delle istruzioni testuali: per i testi c’è Chat GPT-3 di Open AI, con cui si formula una domanda su qualunque argomento e si attende, in pochi secondi, la risposta. Questo testo che state leggendo è stato in parte elaborato con l’intelligenza artificiale.
E’ nel campo della generazione delle immagini però che si vedono i risultati più strabilianti. Ci sono varie piattaforme allo scopo, gratuite e pagamento. Per iniziare a provare consiglio anzitutto Stable Diffusion (gratuito, approccio abbastanza facile per i novizi), e quindi Midjourney, con 25 immagini gratis e poi a pagamento, partendo da 10 euro al mese: l’accesso è purtroppo complicato da una confusionaria piattaforma chiamata “Discord”.
Chiunque, con relativo poco impegno, anche completamente a digiuno di grafica o fotografia, può ottenere immagini abbastanza stupefacenti in pochi minuti. Ho provato entrambe le piattaforme e, per ora, uso principalmente Midjourney: dopo aver imparato come si formulano correttamente i comandi (prompt) più complessi e mirati a quello che si vuole ottenere, genera bellissime immagini senza troppi sbattimenti. Per chi volesse impegnarsi seriamente e approfondire, su Youtube esiste una marea di tutorial che aiutano parecchio a imparare e a superare le difficoltà iniziali.
La facilità di accesso a questa tecnologia così sofisticata ha fatto gridare l’allarme a legioni di fotografi, grafici, disegnatori, illustratori, giornalisti, che temono di essere spazzati via da questa autentica rivoluzione. Tuttavia, osservo, anche quando fu inventata la fotografia molti dissero che sarebbe stata la morte della pittura. Naturalmente non è successo. Per una semplice ragione: chi ha talento, intelligenza, originalità, preparazione e creatività, sarà sempre un spanna sopra agli altri che si improvvisano.
Certamente i mediocri saranno spazzati via, anche se è difficile prevedere l’impatto di questa tecnologia riguardo la produzione delle immagini. Pensiamo solo ai costi: per fare una qualsiasi foto “concettuale” in studio, occorre un fotografo, un assistente, uno studio, attrezzature fotografiche molto costose con macchine, obiettivi, luci, flash, fondali, a volte modelli o modelle, e ovviamente giorni di prove per ottenere il risultato voluto. Peggio ancora se se si deve operare all’esterno, con trasferte fisiche alla location prescelta e con tutte le difficoltà del caso: dall’aspettare la luce “giusta” al meteo avverso che non collabora.
Tutto questo ambaradan per fare una foto o avere una immagine non sarà più necessario in tantissimi casi. Vuoi un dinosauro T-REX in un giardino pubblico alla luce della sera? Presto fatto, bastano pochi comandi testuali e si ha una immagine di sicuro impatto in pochi minuti. Lo vuoi all’alba invece che al tramonto, in un deserto o in una foresta, o nel salotto di casa? Nessun problema: basta modificare il “prompt”, ovvero la sequenza di frasi, parole e parametri tecnici e battere l’invio sulla tastiera, comodamente seduti al computer. Chiunque capisce che i costi tra reale e virtuale sono imparagonabili. Senza contare che ottenere certe immagini, per esempio al Polo Nord o su Marte, non sarebbe proprio possibile, se non con un lavoro enorme (e costoso) di disegno in 3D e post-produzione.
Così come gli smartphone hanno abbassato l’asticella di accesso alla produzione di buone foto a milioni di persone, anche l’AI permette a chiunque o quasi di generare immagini notevoli con poco sforzo. Per generare l’immagine del dinosauro in apertura, ad esempio, ho usato questo semplice comando:
“old woman along a rainy and dark wooded avenue leads a giant T-Rex on a leash in the background, low angle view, ultra wide angle, ultra realistic photo, v4 –ar 3:2”
Come si vede, nulla di troppo difficile. Tuttavia, è importante sottolinearlo, anche nell’intelligenza artificiale “non ci sono pasti gratis”. Se si vogliono immagini mirate, o si cerca un effetto particolare, è necessario fare diversi tentativi per ottenere un risultato valido, perché le immagini che si ottengono ai primi tentativi sono spesso imprevedibili e non è semplice capire come “ragiona” l’intelligenza artificiale. Di solito servono una decina di tentativi per avere un buon risultato, a volte anche molti di più.
Quello che fa veramente la differenza, è avere una preparazione e cultura visiva che non si improvvisa, perché si acquisisce in anni di studio: storia dell’arte, architettura, fotografia, grafica, cinema, illustrazione eccetera. La preparazione in campo fotografico, in particolare, è utilissima: l’intelligenza artificiale è in grado di simulare addirittura il tipo di ottica (dal grandangolare al teleobiettivo), l’apertura di diaframma, il tempo di otturazione, il tipo di pellicola, persino il tipo di macchina fotografica e la marca (!), potendo emulare addirittura anche lo stile dei grandi fotografi. Allo stesso modo, le immagini generate possono assumere, con opportuni comandi, lo stile pittorico di artisti famosi, da Giotto a Picasso eccetera, oppure lo stile dei fumetti Marvel o dei manga giapponesi. Non ci sono quasi limiti alla fantasia!
Nel tentativo di contrastare l’intelligenza artificiale, molti hanno sollevato la (presunta) violazione del copyright, perché l’AI sfrutta migliaia o milioni di immagini che trova in rete, senza chiedere alcun consenso agli autori. Di ciascuna immagine però l’AI sfrutta solo una parte infinitesimale, e l’immagine prodotta è una immagine inedita. Se provate a cercarla su Google, non la trovate. Non è possibile risalire alle immagini originali, alle parti copiate o elaborate, e men che meno ad un unico autore.
Mancando del tutto la somiglianza tra l’immagine prodotta dall’AI e quelle di origine da cui deriva ed è stata elaborata, è praticamente impossibile rivendicare un copyright. E’ come se un autore di un romanzo rivendicasse la violazione del copyright perché qualcuno ha usato le sue stesse parole o frasi. Certo la lingua è la stessa d’accordo, i vocaboli anche, le singole frasi possono essere simili o uguali, ma se non c’è una copiatura di paragrafi o pagine intere, come si possono accampare dei diritti?
Una cosa è certa: se una piattaforma come Midjourney (o altre che usano l’intelligenza artificiale), violasse il copyright, sarebbe stata fatta chiudere in una settimana. Se nessuno ci è riuscito, significa che la violazione è teorica, ipotetica, labile e comunque non adeguatamente dimostrabile, almeno finora. Volenti o nolenti, questa tecnologia oggi c’è e non potrà essere fermata, per una semplice ragione: offre dei vantaggi grandiosi.
L’intelligenza artificiale amplia enormemente le possibilità creative, verso nuovi e inimmaginabili orizzonti. Tuttavia, come detto, senza un bagaglio di cultura visiva piuttosto vasta, ottenere buoni risultati non è così facile come può sembrare. E’ una tecnologia stupefacente ma attualmente ancora acerba. Uno dei difetti più noti, ad esempio, è la difficoltà di riprodurre le mani: la mano dell’uomo è una struttura assai complessa e può assumere molte forme differenti (aperta o chiusa, con ogni dito indipendente dagli altri e con tutti i movimenti intermedi). L’AI non di rado si confonde e produce mani con sei o sette dita (polidattilia). Analoga difficoltà incontra con le zampe degli animali, che talvolta hanno sei o otto zampe. Altro difetto riscontrato sono i denti. Le dentature, specie in volti visti di profilo, sono talvolta lunghissime e sembrano quelle di una murena, a volte addirittura in più file come gli squali. Tocca quindi improvvisarsi dentisti e odontotecnici per togliere molari in eccesso con Photoshop, per far tornare i sorrisi più umani. Questi sono difetti di gioventù a cui si rimedia abbastanza facilmente con qualche intervento di fotoritocco. In ogni caso è certo che sono problemi che i programmatori risolveranno presto, man mano che milioni di nuove foto, profittando dell’enorme aumento di utilizzo da parte degli utenti, saranno date in pasto all’intelligenza artificiale e ai suoi algoritmi.
I tentativi di fermare o contrastare l’avvento della intelligenza artificiale somigliano a quelle dei luddisti nel 1900, che distruggevano le macchine tessili. Molte professioni sono scomparse nel tempo: cocchieri, arrotini, ombrellai, così come anche tanti operai non specializzati, sono stati spazzati via dal progresso tecnologico. Piuttosto che cercare di combattere l’intelligenza artificiale, credo sia molto più utile capire come poterla sfruttare al meglio.
Poiché non ho mai temuto la tecnologia, anch’io mi sono gettato a capofitto ad esplorare questa fantastica rivoluzione. Questi che vedete in questo post sono dunque i risultati che ho ottenuto dopo meno di un mese di prove e di studio.
C’è ancora molto da lavorare, da imparare e da studiare, ma l’intelligenza artificiale applicata alle immagini, personalmente, la trovo semplicemente entusiasmante. E voi cosa ne pensate? 🙂
Alcune fotogallery su Facebook:
Ricchi e poveri a Londra nel 1800
L’odissea dell’esploratore Shackelton in Antartide
Viaggio virtuale a l’Habana, Cuba 1950
Italo americani a New York, 1920-1930
American Cars
Case da sogno in montagna
Nuovi rifugi avveniristici in alta montagna
Aviatori nelle due Guerre mondiali
Soldati nella Grande Guerra
Inverno nelle Alpi, 1920
Mondo rurale e intelligenza artificiale
(C) 2023 Tutti i diritti riservati, Alessandro Ghezzer
Fantastico. Semplicemente fantastico Alessandro. Mi sto appassionando a questa tecnologia provando con versioni demo. Non so quale scegliere fra le tante che ho letto sulla pagina fb, quale mi consigli ? Grazie un caro saluto. William
secondo me, Midjourney, parti dalla versione base a pagamento con 10 euro al mese