Notizie / Giochi

Proteggere l’arte dell’intelligenza artificiale generativa è vitale, oggi e domani

L'intelligenza artificiale generativa è ovunque nel settore dell'intrattenimento in questo momento e molti nel settore dei giochi sono entusiasti di trovare nuovi modi per integrarla nei loro prodotti, con sviluppatori ed editori di giochi come Ubisoft e Square Enix fino ai titolari di piattaforme e società di hardware come Epico e Nvidia. Questa nuova ossessione industriale sta ancora prendendo forma e molte domande rimangono senza risposta su quanto potrebbe costare in futuro, chi avrà accesso ad esso e per quale scopo verrà effettivamente utilizzato, per non parlare dei timori per il lavoro. perdite e altri danni. Ma dietro tutto ciò si nasconde una domanda più grande che minaccia di far scoppiare la bolla traballante dell’intelligenza artificiale generativa: l’intero boom è basato sul lavoro rubato?

La creazione e l'addestramento di sistemi di machine learning spesso richiedono dati: beaucoup di dati. A volte siamo fortunati e possiamo creare i nostri dati. Quando OpenAI ha addestrato un bot a giocare partite 1v1 Mid in Dota 2, lo ha fatto attraverso un processo chiamato apprendimento per rinforzo, facendo giocare il bot contro se stesso più e più volte, con l'unico feedback su chi ha vinto e chi ha perso. Questo feedback, a volte chiamato “ricompensa”, aiuta un sistema di apprendimento automatico a giocare una sorta di gioco “caldo e freddo”, modificando il suo cablaggio interno per cercare di ottenere una ricompensa migliore la prossima volta che esegue la colorazione. Se sei abbastanza grande da ricordare il gioco Black & White (o, Dio non voglia, Creatures), allora quei giochi funzionavano secondo un principio simile. Se il tuo animaletto ha fatto una buona cosa, dagli un premio, e se ha appena gettato diversi abitanti del villaggio in un lago, lo sgridi (o dagli un premio, se preferisci).

A volte non possiamo creare i nostri dati. Se vogliamo addestrare un'intelligenza artificiale a diventare un artista, non possiamo limitarci a scarabocchiare e imparare dai risultati, perché non possiamo definire facilmente quale dovrebbe essere il feedback. Nell'1v1 Mid di DOTA 2, se muori, il gioco finisce e ci sono obiettivi simili per Chess, Go, Starcraft e molti altri giochi a cui l'IA ha provato a giocare. Nell’arte, definire vincitori e vinti è notevolmente più difficile. Quindi dobbiamo trovare dati che già esistono, un set di dati artistici che assomigli già al tipo di cose che vorremmo che il nostro sistema di apprendimento automatico fosse in grado di fare. Ma dove lo troviamo? Dove troviamo la risposta a tutti i problemi della vita: su siti web a caso.

Dota 2 è uno dei tanti giochi che sono stati utilizzati per addestrare gli strumenti di intelligenza artificiale su come vincere le partite. | Credito immagine: Valvola

È probabile che se hai sentito parlare di un sistema di apprendimento automatico che genera arte – Midjourney, Stable Diffusion, DALL-E – è stato addestrato su milioni o miliardi di immagini recuperate direttamente da Internet. La maggior parte di questi set di dati non sono filtrati e vengono raccolti da pagine sparse sul Web, in particolare da siti con contenuti facilmente accessibili, come Flickr, Reddit o database di immagini. Sono anche enormi, con un set di dati popolare, LAION-5b, che ne contiene oltre cinque miliardo immagini. Queste immagini vengono tutte raccolte automaticamente, con pochissimi tentativi di filtrare il contenuto. Di conseguenza, i set di dati utilizzati per addestrare questi modelli di intelligenza artificiale sono pieni di contenuti protetti da copyright, materiale illegale e informazioni personali. Ed è tutto integrato nei prodotti di intelligenza artificiale a scopo di lucro che gran parte di noi utilizza ogni giorno, inclusi sviluppatori di giochi, giornalisti e giocatori stessi.

Questo è il motivo principale per cui vedrai così tante persone pubblicare online post che parlano di "furto" di contenuti da parte dell'intelligenza artificiale. Uno degli effetti più noti di questi set di dati oscuri e legalmente discutibili è che puoi chiedere a un'intelligenza artificiale di imitare lo stile di un particolare artista, come Greg Rutkowski che ha illustrato giochi come la serie Anno e giochi di carte come Magic. : L'incontro. Il lavoro di Rutkowski è molto apprezzato, ampiamente condiviso online e chiaramente etichettato con il suo nome, il che significa che un'intelligenza artificiale vedrà molti esempi del suo lavoro, come ha scoperto una volta. Ma ci sono molti altri esempi di cui potresti non sentire mai parlare o di cui potresti non venire mai alla luce. Ad esempio, AI Dungeon, che utilizzava GPT-2 di OpenAI per generare storie di giochi di ruolo, ha preso e utilizzato migliaia di storie di avventure da una comunità online senza permesso, provocando molta delusione da parte degli autori originali (nota che quasi ogni thread su quel collegamento è piuttosto schifoso, ma è comunque lì per il tuo contesto).

Il furto a volte è semplice, a volte complicato. Quando mi trovo in una lotta contro un boss a Valheim per la quale i miei amici hanno passato ore a prepararsi e io raccolgo tutto il bottino come un Roomba fantasy e affamato, chiaramente non si tratta di un furto: è solo una condivisione di ricchezza. Nel mondo reale, dove sono coinvolti tribunali e sistemi legali, il furto è molto più grigio. I giochi vengono spesso criticati per aver "rubato" cose da altri giochi o media, che si tratti dell'apparizione di creature in Palworld, di balli in Fortnite o di interi giochi, come nel caso di Ridiculous Fishing di Vlambeer e Threes di Asher Volmer. Ma non sempre siamo d'accordo su cosa sia il furto, soprattutto nelle aule di tribunale. Le cause legali di Fortnite furono tutte archiviate, ma nel caso di piccoli sviluppatori indipendenti il ​​cui lavoro era stato clonato, non avevano praticamente alcun ricorso legale. Decidere cosa costituisce un furto purtroppo spesso riguarda più il potere che la giustizia.

In questo momento, ci sono diverse cause legali in corso in tutto il mondo contro diversi modelli, aziende e set di dati di intelligenza artificiale per aver violato tutti i tipi di leggi e regolamenti diversi. È stato dimostrato che alcuni modelli memorizzano informazioni personali e le divulgano in seguito, mentre altri sono stati addestrati su contenuti dannosi o riproducono opere protette da copyright. Argomenti giuridici più tecnici approfondiscono i dettagli di questi sistemi: ad esempio, la semplice formazione su materiale protetto da copyright costituisce una violazione del copyright. Non è chiaro quale di questi argomenti reggerà in tribunale. Le aziende sostengono che tutto ciò rientra nel fair use, che il contenuto dannoso è un difetto temporaneo nel sistema che può essere corretto in seguito e che gli accordi di licenza aiuteranno a fornire sollievo agli artisti in futuro.

Ma spesso non si tratta necessariamente di ciò che è legale. Oggi, ma su come vogliamo che il mondo funzioni in futuro. Nell’ultimo secolo ci sono stati moltissimi esempi in cui abbiamo regolamentato la tecnologia non perché questa violi le leggi esistenti, ma perché consente alle persone di aggirare quelle leggi in modi che nessun altro potrebbe aspettarsi. Tuttavia, gli argomenti a difesa di questo sfruttamento su larga scala del lavoro creativo non colgono il punto. Questa non è una questione di legalità, ma una questione di umanità. È logico proteggere il lavoro creativo e le persone che lavorano duramente per realizzarlo, perché svolge un ruolo molto importante nella società.

Immagine Palworld di un amico Fuddler

Palworld ha recentemente ricevuto molte critiche sul design dei suoi mostri Pal.Credito immagine: Fucile da caccia/carta da sasso tascabile

È questo danno a lungo termine che molti creativi e ricercatori dell’IA temono di più. Proprio come i recenti licenziamenti nel settore dei videogiochi, gli effetti dei grandi cambiamenti nel settore richiedono tempo per essere pienamente avvertiti. Tutti i giochi che avrebbero dovuto uscire in un dato anno probabilmente usciranno, e molti di loro saranno divertenti, e potresti chiederti se questi licenziamenti abbiano davvero influito su qualcosa? Ma potrebbero volerci anni per notare l’impatto di un simile sconvolgimento, e decenni per invertirlo. Il motivo per cui oggi è stato possibile costruire questi sistemi di intelligenza artificiale generativa è perché avevano decenni, se non secoli, di creatività umana da osservare su Internet. Se svolgono un ruolo nella svalutazione o destabilizzazione dei posti di lavoro che hanno aiutato queste persone a creare quest’arte, da quale cultura si potranno imparare lezioni alla fine di questo secolo? Anche se sei un irriducibile acceleratore dell’intelligenza artificiale, molti temono che abbiamo infettato permanentemente Internet con così tanti contenuti generati dall’intelligenza artificiale che potrebbe essere impossibile riqualificare un sistema di intelligenza artificiale sui contenuti creati dagli esseri umani.

La nostra industria dei videogiochi è sorprendentemente fragile, anche se per certi versi sembra diventare sempre più gigantesca con il passare dei decenni. Molte delle idee più brillanti della sua storia, molti dei creatori più famosi o dei giochi più amati, sono nati dai margini dell'industria o di altri media, spesso da persone in situazioni economiche vulnerabili. Piccoli cambiamenti che al momento sembrano innocui spesso hanno effetti di vasta portata – ed esistono già prove del fatto che l’intelligenza artificiale generativa ha influenzato la qualità e la quantità del lavoro creativo indipendente. Che si pensi che l’intelligenza artificiale generativa sia positiva o negativa, sembra irrispettoso ignorare le preoccupazioni e le lamentele di persone che hanno lavorato così duramente, per poca ricompensa, per creare la comunità ricca e bella da cui proviene il nostro passato. Non importa cosa dicano i tribunali, non importa quali regolamenti vengano approvati, non importa come appariranno queste aziende quando le acque si saranno calmate, molti danni potrebbero essere già stati fatti.