Con l’occasione delle due giornate romane dell’evento scientifico internazionale dal titolo “MICROBIOTA FMT in IBD”, appena conclusosi presso l’Università Cattolica del Sacro Cuore abbiamo incontrato il Prof. Andrea Damiani, responsabile del Facility Innovation Hub, ICT Fondazione Gemelli IRCCS. Con lui abbiamo affrontato alcuni aspetti di attualità del rapporto tra le tecnologie digitali e il mondo della ricerca nelle scienze biomediche. L’intervista integrale, in due parti, è come sempre pubblicata sul nostro canale YouTube.
D “Le tecnologie digitali moltiplicano la possibilità dei ricercatori di disporre di una grande mole di dati. Ma questo comporta anche qualche rischio rispetto alla riservatezza di queste informazioni. Facciamo il punto?”
Damiani “In tutti gli studi clinici, per la verità, più dati ci sono e più sofisticati sono i modelli che si possono apprendere. Esistono malattie rare in cui i casi ogni anno sono veramente pochi, ma esistono anche degli studi che contengono talmente tante variabili da necessitare di grandi numeri.
La soluzione è nota da tempo: si mettono insieme molti istituti di ricerca che possono condividere i dati (…) E allora ci vuole una soluzione che consenta di apprendere modelli, addestrare modelli di machine learning. O di intelligenza artificiale, senza far muovere i dati dal luogo in cui sono stati raccolti. Questo è l’approccio del federated learning che promette e mantiene l’apprendimento dello stesso modello, come se i dati fossero stati veramente accentrati, ma senza farli muovere dal luogo dove sono stati raccolti e che ne e responsabile.
D “Metodologia avanzata o condivisa? Qual è l’approccio migliore?”
“Servono entrambe afferma il Prof. Damiani nella seconda parte dell’intervista perché da un lato c’è della matematica sotto ed è quella matematica che assicura che il risultato di addestramento che otteniamo sarà identico a quello che si sarebbe ottenuto accentrando i dati, e questo non è poco.
Cedere la tecnologia per assicurare che anche questo avvenga con totale rispetto della privacy dei pazienti. Ma poi c’è metodologia perché occorre prima di tutto mettersi d’accordo sul sistema terminologico comune.
Proviamo a fare un esempio: facciamo uno studio in cui ci sono tre ospedali, ogni ospedale ha il suo dataset, ma prima di poter parlare di un federated learning i responsabili dello studio in questi tre ospedali devono incontrarsi.
Devono mettersi d’accordo su quali sono le variabili che si useranno e soprattutto devono essere certi di aver chiamato le stesse cose con lo stesso nome. Quindi l’aspetto metodologico riguarda soprattutto i medici ricercatori che diventano assolutamente fondamentali per riuscire a mantenere il valore che originariamente c’è nei dati.
D “Se ne avvantaggia più la ricerca o la clinica?”
Damiani “Noi possiamo essere un acceleratore, un’eccellente acceleratore perché, come prima dicevamo, se riusciamo a condurre studi su 3000 pazienti, quando sarebbe stato possibile farli su 300 è chiaro che questo accelera il percorso dalla ricerca alla clinica, ma poi serve ovviamente la collaborazione dei medici ricercatori e su questo c’è poco da fare. Il più grande studio che abbiamo fatto come Gemelli, in questo modo, è stato di 30.000 pazienti e risale al 2017.”
D “Una domanda in chiusura: dobbiamo essere preoccupati per la sicurezza dei nostri dati sensibili?”
Damiani “Ogni volta che durante incontri, lezioni o qualche lettura, si parla di questo argomento, la raccomandazione più importante è: ricordate che quando avete trasmesso un vostro dato su una qualsiasi piattaforma, quel vostro dato non è più vostro. Ma è replicabile infinite volte, in infiniti luoghi nel futuro ed è riconducibile ad altri database che si accumulano e che parlano di voi.
E fra cinque o sei anni qualcuno potrebbe divertirsi a mettere insieme queste diverse osservazioni e diversi dati che riguardano la vostra vita e ricostruire delle cose che nemmeno voi sapevate. Ma che effettivamente sono avvenute, quindi la raccomandazione rimane questa per aver cura dei propri dati. Primo passo è evitare di caricarli, per qualsiasi motivo, su siti non sicuri.”




