Notizie / Giochi

Google annuncia Imagen, un generatore di immagini basato sull'intelligenza artificiale con affermazioni di "fotorealismo senza precedenti"

Google annuncia Imagen, un generatore di immagini basato sull'intelligenza artificiale con affermazioni di "fotorealismo senza precedenti"

Google Imagen è il nuovo generatore di testo a immagine AI disponibile. Non è stato rilasciato nel pubblico dominio. Ma, mentre annunciava il nuovo modello di intelligenza artificiale, la società ha condiviso il documento di ricerca, uno strumento di benchmarking chiamato Drawbench per fare confronti oggettivi con i concorrenti di Imagen e alcune immagini stupide per il tuo divertimento soggettivo. Evidenzia anche il potenziale danno di questa tecnologia.

Google Imagen: ecco come funziona un modello da testo a immagine

L'idea è che tu dica semplicemente quello che vuoi che il generatore di immagini AI evochi e fa esattamente questo.

Le immagini presentate da Google sono probabilmente le migliori del gruppo e poiché lo strumento AI non è disponibile al grande pubblico, suggeriamo di prendere i risultati e le affermazioni con le pinze.

Ad ogni modo, Google è orgoglioso delle prestazioni di Imagen e forse del motivo per cui ha rilasciato un benchmark per i modelli di intelligenza artificiale da testo a immagine chiamato DrawBench. Per quel che vale, i grafici di Google rivelano il vantaggio di Imagen su alternative come Dall-E 2 di OpenAI.

Disegna la panca

Tuttavia, proprio come la soluzione di Open AI o altrove, tutte le applicazioni simili hanno difetti intrinseci, ovvero sono suscettibili di risultati sconcertanti.

Proprio come il "pregiudizio di conferma" negli esseri umani, che è la nostra tendenza a vedere ciò in cui crediamo e crediamo a ciò che vediamo, anche i modelli di intelligenza artificiale che filtrano grandi quantità di dati possono cadere in questi pregiudizi. È stato dimostrato più e più volte che questo è un problema con i generatori di testo in immagine. Quindi Imagen di Google sarà diverso?

Nelle stesse parole di Google, questi modelli di intelligenza artificiale codificano "diversi pregiudizi sociali e stereotipi, tra cui un pregiudizio generale verso la generazione di immagini di persone dalla pelle più chiara e una tendenza per le immagini che ritraggono professioni diverse a sembrare diverse".

La società Alphabet potrebbe ancora filtrare determinate parole o frasi e alimentare buoni set di dati. Ma con la scala di dati su cui operano queste macchine, non tutto può essere vagliato o non tutti i problemi possono essere risolti. Google lo ammette, affermando che "[I] requisiti di dati su larga scala dei modelli di immagini di testo [...] hanno portato i ricercatori a fare molto affidamento su grandi set di dati, per lo più non curati e recuperati dal web [...] Gli audit dei set di dati hanno rivelato che questi i set di dati tendono a riflettere stereotipi sociali, punti di vista oppressivi e associazioni denigratorie o altrimenti dannose a gruppi di identità emarginati.

Quindi, come dice Google, Imagen "non è adatto per l'uso pubblico in questo momento". Se e quando sarà disponibile, prova a dirgli: "Ehi Google Imagen, non c'è paradiso". È facile se ci provi. Niente inferno sotto di noi. Sopra di noi, nient'altro che il cielo”.

Per altre notizie, recensioni, funzionalità, guide all'acquisto e tutto ciò che riguarda la tecnologia, continua a leggere Digit.in.