Immobili
Veicoli

AvanTIMeta riesce a creare video dai testi

17.10.22 - 08:00
Meta ha sviluppato una tecnologia di Intelligenza Artificiale capace di creare brevi clip partendo da un semplice testo.
AvanTi
Meta riesce a creare video dai testi
Meta ha sviluppato una tecnologia di Intelligenza Artificiale capace di creare brevi clip partendo da un semplice testo.

I ricercatori di Meta hanno sviluppato una tecnologia basata sull’intelligenza artificiale in grado di realizzare clip video di alta qualità a partire da un semplice testo scritto. Il modello si chiama Make-A-Video e tecnicamente si tratta di un’AI di tipo generativo, capace cioè di produrre contenuti sulla base di brevi informazioni comunicate dagli utenti. La tecnologia può anche creare video da immagini fisse o generare altri clip simili basati su un’unica sequenza.

Make-A-Video è la prosecuzione di quanto Meta aveva già fatto con Make-A-Scene, strumento presentato a luglio che offre il suo sistema di traduzione di testo in immagini e che permette di accostare al testo uno schizzo disegnato dall’utente per affinare il risultato dell’immagine creata ex novo dall’AI. Con Make-A-Video Meta ha fatto qualcosa di nuovo: è riuscita a trasformare il testo in video (T2V, Text to Video). Il modello di machine learning è cioè capace d'interpretare il testo digitato dall’utente e di rappresentarlo sotto forma di filmato.

Make-A-Video non richiede dati testo-video accoppiati, ovvero con la descrizione testuale del video, per addestrare il modello. Questo per via dello scarso numero di dataset testo-video disponibili e per la complessità della loro creazione, dato che la descrizione deve considerare lo spazio ma anche il tempo. I ricercatori di Meta sono quindi partiti da un più semplice modello T2I a cui hanno aggiunto altri dati alla dimensione spazio (la modifica dello stesso soggetto in base al frame) e hanno dato vita alla dimensione tempo, cioè alla serie di frame che compongono il filmato finale, creando fotogrammi intermedi.

Sul proprio sito web Meta ha pubblicato diversi esempi di creazioni generate dalla propria AI, classificati nelle categorie “realisti”, “surrealisti” e “stilizzati”. I video della prima categoria raffigurano scene di vita quotidiana, come una coppia che cammina sotto la pioggia o un cavallo che si abbevera, ma sono ricavati in maniera totalmente virtualizzata dalla tecnologia partendo da input scritti (come “horse drinking water”). Le produzioni surrealiste sono più creative, riuscendo per esempio a far volare cani vestiti da supereroi. Le clip stilizzate, invece, includono dipinti a olio in movimento o sequenze da cartone animato.

“I video sono stati generati da un sistema di intelligenza artificiale creato dal nostro team di Meta. Gli dai una descrizione testuale e crea un video per te”, ha spiegato Mark Zuckerberg in un post. «È un progresso sorprendente, è molto più difficile generare video rispetto alle foto perché oltre a generare correttamente ogni pixel, il sistema deve anche prevedere come cambieranno nel tempo. Make-A-Video risolve questo problema. Speriamo di avere una versione beta che più persone possano provare presto».

Bisogna dire che per ora Make-A-Video non è disponibile per tutti gli utenti internet, ma per provare l’AI è necessario presentare una domanda di registrazione al programma Meta Test. Inoltre, consapevole dei potenziali usi distorti, Meta appone sulle produzioni una filigrana con il proprio marchio, soprattutto per evitare che video fasulli siano adoperati per propagare false informazioni.

COMMENTI
 
NOTIZIE PIÙ LETTE