Notizie / Giochi

Uno sguardo più da vicino a DeepMind, l'IA di Google che alimenta StarCraft 2

31 maggio 2020 Questa funzionalità è stata originariamente rilasciata a gennaio 2019.

Saresti perdonato per supporre che la tecnologia AI di DeepMind si sia già dimostrata valida.

Nel 2016, il famoso laboratorio di informatica ha assistito a uno dei suoi programmi di intelligenza artificiale che ha fatto l'impensabile e ha vinto una partita di Go contro l'allora campione del mondo - e l'essere umano - Lee Sedol. Padroneggiare l'antico gioco da tavolo cinese era solo un esempio dell'apprendimento automatico che DeepMind spera possa eventualmente utilizzare per rivoluzionare settori come la scienza, l'assistenza sanitaria e l'energia.

Per la prossima tappa di questo viaggio, DeepMind ha rivolto la sua attenzione a StarCraft II. L'RTS di sette anni può ancora essere una sensazione di eSport, ma non è un ovvio passo avanti rispetto a Go. Dopotutto, e con le scuse a Blizzard, il gioco di strategia astratto di 2500 anni è considerato l'apice del gioco design, profondità strategica e complessità elegante. Ma il bello di Go - e di quell'altro grande sparring partner di intelligenza artificiale, gli scacchi - è che è ordinato con precisione e strettamente strutturato. Nonostante le scoraggianti combinazioni di possibili mosse offerte da questi giochi, la loro profondità non è necessariamente completata dall'ampiezza.

Un RTS multiplayer, d'altra parte, è un po' più caotico. I migliori giocatori professionisti di StarCraft II possono ottenere oltre 800 azioni significative con mouse e tastiera al minuto. È un gioco di strategia dinamico e irregolare giocato alla velocità di un inferno di proiettili, in cui una miriade di sistemi di interazione si spingono in un groviglio sconcertante. StarCraft II richiede ai suoi giocatori di gestire l'incertezza e dare un senso agli ambienti spaziali sfumati. Tutto questo è piuttosto una sfida per un'IA.

Vignette YouTube

In quanto tale, DeepMind ha creato un programma di intelligenza artificiale chiamato AlphaStar, con un obiettivo nella vita: padroneggiare il multiplayer competitivo di StarCraft II. In effetti, è già andato uno contro uno con alcuni dei migliori giocatori del mondo.

Ecco perché mi ritrovo in uno studio televisivo ad hoc allestito presso la sede di Google nel Regno Unito. Nelle ultime settimane, DeepMind, di proprietà dell'alfabeto dei genitori di Google, ha inviato AlphaStar a combattere contro gli stimati professionisti del Team Liquid Dario "TLO" Wünsch e Grzegorz "MaNa" Komincz. Ora la società è pronta a condividere i giochi preregistrati e i commentatori che non hanno mai visto i giochi prima sono stati reclutati per fornire energia. Viene impostata una scena molto fluida.

Quello che stanno per rivelare sembra importante. Non si tratta solo di IA contro un paio di compagni di squadra di eSport. AlphaStar sfida la nozione di abilità nei giochi, le conseguenze potrebbero cambiare il modo in cui giocano i giocatori professionisti umani, il modo in cui vengono sviluppati i titoli futuri e, naturalmente, il modo in cui l'IA aumenta le capacità umane in tutto il mondo.

DeepMind ha iniziato costruendo un giocatore artificiale di StarCraft II senza il senso del gioco, delle regole o delle strategie. Ma ha continuato a sintonizzarsi, a guardare mezzo milione di giochi di StarCraft umani, imparando tutto il tempo. AlphaStar ha imitato, sperimentato, fallito e imparato. Questo è il processo combinato di apprendimento profondo e apprendimento per rinforzo al centro dell'offerta di DeepMind.

Alla BlizzCon 2018 all'inizio di novembre, AlphaStar aveva afferrato le regole dell'RTS e padroneggiato alcune strategie di base basate su macro. Il 10 dicembre, dopo aver giocato molte partite contro diverse versioni di se stessa, l'IA ha sconfitto il più abile giocatore umano di StarCraft del Team DeepMind. Era ora di salire di livello.

Nove giorni dopo, il manager del Team Liquid TLO è volato nel Regno Unito. Come giocatore professionista di StarCraft II, ha schierato tutte le diverse razze del gioco, ma è conosciuto come un giocatore Zerg estremamente capace. AlphaStar, tuttavia, si era concentrato su Protoss vs. Protoss per mantenere il loro apprendimento coerente. Una partita solo Protos contro TLO sarebbe quindi un primo test perfetto e delicato: lanciare l'agente di DeepMind contro un esperto fuori dalla sua zona di comfort.

Auto senza pilota: Ecco come Codemasters insegna all'IA a guidare

All'inizio dello streaming, AlphaStar sconfigge TLO nel primo gioco usando uno stile di gioco piuttosto non convenzionale, rifiutandosi di bloccare una rampa soffocante, un approccio ben consolidato data la mappa selezionata. Fuori dal cancello, l'IA ha preso il comando sugli umani e non sembra troppo interessata a ballare al ritmo delle convenzioni. Nonostante tutta la teoria su cui i giocatori di StarCraft sono ossessionati, AlphaStar sta già facendo le cose in modo diverso.

Vignette YouTube

L'agente DeepMind dovrebbe, tuttavia, essere il più umano possibile. Ci sono limiti alla velocità con cui può interagire e concessioni per garantire che il suo approccio non lo sia se i giochi astratti vengono resi ingiocabili. In effetti, TLO ha effettuato più "azioni al minuto" di AlphaStar nel loro primo scontro, dimostrando che non ci sono ragioni per sostenere che prevale un vantaggio ingiusto in termini di velocità.

"Ho iniziato questa partita con molta fiducia", ha detto TLO della sua sconfitta, con un sorriso confuso. Successivamente, il giocatore del Team Liquid afferma di aver imparato dall'esperienza e di sentirsi pronto a battere AlphaStar nelle prossime partite.

Ma le cose vanno un po' diversamente. Ad ogni turno, AlphaStar cambia strategia. L'IA è sempre implacabile, sempre efficiente, ma mai prevedibile. TLO è battuto 5-0.

DeepMind chiaramente non si stava trattenendo. AlphaStar in realtà combina cinque diversi agenti, qualcosa come una diffusione di diverse versioni di se stesso. Inoltre, DeepMind afferma che AlphaStar ha giocato circa 200 anni di giochi, un fatto in cui TLO ha chiaramente preso conforto. Ma in realtà, è più paragonabile all'apprendimento umano di quanto si possa pensare.

Questi 200 anni includono tutto ogni versione di AlphaStar ha imparato a giocare da solo. Allo stesso modo, un giocatore di StarCraft II con 500 ore di gioco alle spalle eredita anche l'apprendimento collettivo dei giocatori che li hanno preceduti e di coloro con cui hanno combattuto. Siamo tutti più della nostra stessa esperienza; centinaia di anni in più.

In ogni caso, era ora di raccogliere la sfida. MaNa è sia un talento che un giocatore sicuro di sé concentrato sui Protoss. Sicuramente ora AlphaStar incontrerebbe la sua partita?

Dopo cinque sconfitte consecutive per mano di AlphaStar, MaNa sembra essere in parti uguali esasperato, elettrizzato e affascinato. Come TLO, è stato chiaramente colto di sorpresa. Sebbene AlphaStar segua le regole del gioco alla lettera, semplicemente non aderisce alle strategie di gioco consolidate che i giocatori di StarCraft II hanno sviluppato collettivamente.

Chat in tempo reale: le migliori giochi RTS su pc

MaNa ottiene, almeno, una grazia salvifica per se stesso, così come per il pubblico quando si tratta di eSport e forse dell'umanità in generale. DeepMind ospita una partita dal vivo in studio, trasmette verruche e tutto il resto. E sembra essere il primo gioco contro un professionista in cui l'IA di DeepMind è stata bloccata dall'uso della fotocamera del giocatore. AlphaStar non vede il gioco come tale, ma è già stato in grado di capire un'intera area della partita, piuttosto che sperimentarla attraverso una visuale della telecamera.

Questa volta MaNa vince ed è chiaramente estremamente sollevato.

Con le telecamere spente, c'è un senso collettivo di illuminazione nello studio temporaneo di DeepMind. AlphaStar potrebbe aver perso la sua ultima battaglia, ma un punteggio finale di 11-1 a favore dell'IA ha mandato tremori. E i giocatori professionisti si sentono ottimisti e riflessivi.

TLO ci dice che MaNa una volta ha adottato una tattica che ha visto implementare AlphaStar e l'ha usata nei giochi del mondo reale. Se AlphaStar può continuare a cambiare il suo stile di gioco in modi imprevedibili, forse gli umani possono imparare nuovi approcci ad esso, proprio come l'IA impara osservando gli umani. Possiamo vedere nuove teorie di gioco dirompenti che sorgono negli eSport competitivi che non erano originariamente progettati da organismi biologici.

Nel frattempo, il team di DeepMind discute con entusiasmo delle implicazioni di giocatori di intelligenza artificiale altamente qualificati sullo sviluppo del gioco. Alla fine potrebbero sperare di vedere la loro tecnologia migliorare le catene di approvvigionamento globali, i soccorsi in caso di calamità e il lavoro dei professionisti medici, ma per ora il concetto di intelligenza artificiale a misura d'uomo gioca da tutte le parti. Cosa potrebbe significare AlphaStar per i test di gioco? Le sue capacità potrebbero non solo valutare la validità del design di un determinato gioco, ma anche alimentare il processo creativo? L'IA potrebbe riuscire a creare giochi perfettamente bilanciati, senza interferenze umane?

Spostare: Cannon lancia i migliori giochi di strategia su PC

Forse, sta pensando TLO. Ma sottolinea che un gioco perfettamente bilanciato potrebbe non essere intrinsecamente un buon gioco. Dopotutto, sono state le minuscole imperfezioni di equilibrio che hanno permesso ai giocatori di StarCraft II di costruire una libreria così densa di teoria dei giochi attorno al loro amato RTS. È da qui che viene la capacità di estro individuale e le svolte drammatiche del destino.

L'IA potrebbe già renderci migliori, ma ciò non significa che la perfezione sia perfetta per i giochi.