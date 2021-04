Negli ultimi anni, grazie ad algoritmi sempre più complessi, l’Intelligenza Artificiale è stata in grado di replicare modelli complessi ricavati dal mondo reale e persino generare dati sintetici di alta qualità come immagini credibili di opere d’arte, articoli di giornale e volti di persone. Oggi la ricerca si è spinta ulteriormente in avanti e lo ha fatto nel campo della biologia.

Un team internazionale di ricercatori, che include le Università di Tartu, Parigi e Padova, è infatti riuscito a creare al computer frammenti di genomi artificiali con caratteristiche reali partendo da un database genomico esistente. I ricercatori, in sostanza, hanno sviluppato un algoritmo in grado di generare il codice genetico di persone inesistenti.

Gli scienziati hanno adoperato due approcci basilari per creare i genomi artificiali. Innanzitutto, hanno addestrato un tipo di Intelligenza Artificiale chiamato Generative Adversarial Network (GAN) con dati reali presi da un database genomico. L’AI funziona in modo tale che, dato un set di addestramento, questa “apprende” a generare nuovi dati con le stesse statistiche del set di addestramento. In seguito, hanno utilizzato una macchina di Boltzmann ristretta (RBM), che sarebbe un modello grafico probabilistico, comprensivo di un certo numero di parametri, che se applicato ad una distribuzione di dati è in grado di fornirne una rappresentazione.

I ricercatori hanno effettuato diverse analisi per confrontare le caratteristiche dei genomi artificiali con quelle dei genomi reali e, man mano che procedevano, hanno perfezionato il loro lavoro. In questo modo sono riusciti a replicare genomi umani realistici quasi indistinguibili dalla realtà.

«Per quanto possa sembrare sorprendente, questi genomi artificiali, che emergono da pacchetti di dati inizialmente presi a caso e poi modellati, imitano le complessità che possiamo osservare all’interno di popolazioni umane reali e, per la maggior parte delle proprietà, non sono distinguibili dagli altri genomi della biobanca che abbiamo usato per addestrare il nostro algoritmo, tranne che per un dettaglio: non appartengono a nessun donatore umano», ha affermato Luca Pagani, uno degli autori senior dello studio e docente all’Università di Padova.

Nell’articolo pubblicato sulla rivista PLOS Genetics, il team di scienziati che ha sviluppato il progetto sul genoma artificiale ha dichiarato che le loro false sequenze genetiche hanno un valore reale come strumento per gli studiosi di genetica. Secondo i ricercatori, infatti, questi codici di DNA potrebbero aiutare un’ulteriore sperimentazione genetica, senza tuttavia compromettere la privacy delle persone reali che dovrebbero rinunciare ai propri dati genetici.

«Anche se rilevare problemi di privacy tra migliaia di genomi potrebbe sembrare la ricerca di un ago in un pagliaio, la combinazione di più misure statistiche ci ha permesso di ovviare il più possibile a questo importante problema. Pensiamo che questo nostro sforzo possa portare miglioramenti nella valutazione e progettazione del modello generativo e alimenterà il campo dell’apprendimento automatico», ha concluso Flora Jay, coordinatrice dello studio e ricercatrice del CNRS nel laboratorio interdisciplinare di informatica LRI / LISN dell’Université Paris-Saclay.

AvanTi