Il mondo dei Big Data sta entrando sempre di più anche nel campo della ricerca e dello sviluppo di nuovi farmaci e, considerando la quantità di dati e le numerose possibilità di incrociarli, la sua gestione supera di gran lunga il livello nazionale e persino quello europeo per approdare necessariamente al mondo globale.
I Big Data in farmacologia sono rappresentabili da grandi aggregazioni di informazioni legate strettamente alle popolazioni che assumono i farmaci, come dati biometrici (tra questi, ad esempio, altezza, peso, pressione, quantità di grasso corporeo, etc.), dati correlati alle abitudini delle popolazioni, dati omogenei sugli obiettivi che si vogliono raggiungere con la terapia, compresi quelli sugli effetti collaterali, dati di riferimento sull’andamento naturale delle stesse patologie e dati sulla durata della risposta farmacologica nel tempo. Alcune altre variabili biologiche, tra cui anche quelle geografiche, sono importanti per stabilire gli effetti dei medicinali, così come ha un peso significativo sapere se l’effetto di un farmaco può essere influenzato da variabili non-biologiche delle popolazioni, cioè come determinati stili di vita possano realmente modificare il modo in cui un farmaco esprime la sua efficacia o modifica il profilo di sicurezza (per esempio consumo di alcolici e possibili danni epatici).
Pensiamo alla UK Biobank. È un agglomerato enorme di dati: circa mezzo milione di adulti britannici ha donato campioni di sangue e urine, ha acconsentito a farsi misurare altezza e peso, ha risposto alle domande sugli stili di vita e la dieta adottati e ha dato informazioni sulla propria storia medica. Un gruppo di ricerca studierà come la salute di queste persone cambierà nel tempo, utilizzando ampi dati che abbraccino le cure primarie, le statistiche ospedaliere e i registri su tumore e decessi. Lo scopo? Studiare le cause, la prevenzione e il trattamento di malattie comuni, ma anche scoprire gli eventuali legami con l’ambiente e le funzioni cognitive.
Attraverso la raccolta e l’analisi di dati sanitari è pertanto possibile definire in maniera più accurata le malattie e sviluppare un’attività di sorveglianza che favorisca l’individuazione di nuove risposte e misure di sanità pubblica.
Ricordate John Snow? Quando nel 1854 si diffuse il colera nel quartiere di Soho, a Londra, Snow ne studiò la diffusione, utilizzando una piantina della città e la mappatura della diffusione dei casi nei diversi periodi. Questo metodo gli permise di notare che i casi si concentravano attorno ad una pompa dell’acqua presente nel distretto di Soho e di fermare la malattia, bloccando la pompa stessa. Recentemente un gruppo di ricercatori dell’Università di Oxford con sede in Nepal e Vietnam ha avuto un approccio simile per studiare la diffusione del tifo in Nepal: ha infatti combinato il sequenziamento del DNA con le rilevazioni GPS per mappare i casi di tifo ed è riuscito a rintracciare l’origine dei focolai, fornendo così un esempio concreto dei benefici che potremmo ottenere combinando insieme diversi set di dati.
Le più recenti tecniche di sequenziamento del DNA offrono potenti strumenti per identificare le cause delle malattie, aiutare la diagnosi, prevedere le risposte ai trattamenti e determinare quali possano essere le migliori cure per il paziente. Uno studio a livello mondiale, guidato da Dominic Kwiatkwoski, ha ad esempio dimostrato come attraverso queste tecniche si possano affrontare problemi di portata globale, in grado di mettere in pericolo centinaia di migliaia di vite. La diffusione in Cambogia di alcuni parassiti della malaria resistenti al farmaco antimalarico più efficace è stata, infatti, controllata attraverso il monitoraggio genetico dei parassiti stessi.
Se si pensa ai database contenenti dati individuali, tra cui quelli genetici, è inevitabile porsi il problema della privacy, che va affrontato dal punto di vista giuridico per bilanciare le esigenze di trasparenza e la necessità dei soggetti che partecipano alla ricerca di essere tutelati nella loro riservatezza. Tuttavia, l’ingresso dei Big Data nel mondo della farmacologia porta con sé un potenziale grande vantaggio per la salute dell’uomo: il beneficio che ne consegue è legato alla capacità di incrociare enormi masse di dati e analizzare così una quantità ineguagliata di informazioni, riferite a milioni di pazienti e pertanto in grado di consentire analisi di ampia portata mai tentate sinora.
Quella dei Big Data è una disciplina che richiede, in tutte le fasi del processo, l’intervento di strumenti molto più sofisticati rispetto a quelli tradizionali. Se da un lato è vero che l’intelligenza artificiale e quella umana devono completarsi per trasformare i dati in informazioni e le informazioni in conoscenza (passaggi non proprio scontati), su cui si possano prendere delle decisioni a carattere universale, dall’altro la cooperazione tra le intelligenze umane, che non sarà – almeno a breve termine – imitabile da programmi computazionali, è la caratteristica che rende davvero unica la specie umana e che servirà anche per innovare lo sviluppo farmaceutico negli anni a venire.
Luca Pani
Editoriale su agenziafarmaco.gov.it