(DIRE) Roma, 20 nov. - Mai come oggi gli scienziati, i regolatori, i decisori pubblici hanno avuto a disposizione strumenti e fonti in grado di generare e rendere pubblicamente disponibile una mole così vasta di dati e informazioni sulla salute. È convinzione ampiamente condivisa che dalla capacità di "dare un senso" a questi dati dipenderà la corretta definizione delle direttrici della ricerca, delle valutazioni regolatorie e delle politiche sanitarie.
Questa sfida, stimolante e attrattiva, pone le basi per una convergenza di interessi, competenze e professionalità che potranno produrre benefici per la salute e per i sistemi sanitari ma anche per il progresso della conoscenza e per lo sviluppo economico. Tuttavia, affinchè si colgano i frutti auspicati, sarà necessario impegnarsi a superare i limiti attuali nella generazione, analisi e interpretazione dei dati e nell'applicazione delle conoscenze acquisite.
In particolare il riferimento è ai profili legali, etici e deontologici della rilevazione e della diffusione di dati sanitari individuali; alla possibilità di valutarne correttamente la rilevanza e la qualità e di confrontare e integrare i dati prodotti da una pluralità di fonti e provenienti da database diversi; alla disponibilità di tutte le parti coinvolte a fornire un contributo attivo e qualificato, investendo anche sulla formazione.
L'AIFA ha puntato molto sull'informatizzazione dei propri database (si pensi ad esempio ai Registri di Monitoraggio o alla Rete Nazionale di Farmacovigilanza) e sullo sviluppo di competenze nell'HTA e nella Sanità digitale nella convinzione che le evidenze regolatorie provenienti da dati omogenei e certificati sull'uso dei farmaci possano orientare i sempre più complessi processi decisionali in materia di salute.
In quest'ottica, riveste grande interesse il dibattito internazionale sulle prospettive e i limiti nella gestione e nella valorizzazione di grandi quantità di dati sanitari. In un recente commento su Nature, Julian H. Elliott (senior research fellow dell'Australasian Cochrane Centre presso l'Università di Monash, e responsabile della ricerca clinica presso l'Unità di Malattie Infettive dell'Alfred Hospital di Melbourne), Jeremy Grimshaw (senior scientist all'Ottawa Hospital Research Institute e professore di medicina all'Università di Ottawa) e colleghi sottolineano come sia necessario sviluppare una "scienza di sintesi dei dati" in grado di connettere l'enorme varietà di informazioni sulla salute.
"Possiamo sequenziare l'intero nostro genoma e quello dei nostri batteri, virus e tumori. Ogni visita dal medico può essere tracciata dai registri elettronici. Device indossabili, applicazioni per smartphone e siti di social-networking possono fornire informazioni sulla fisiologia, i comportamenti, la dieta, i movimenti e le interazioni con gli altri. Grazie ai movimenti a favore dell'open access e ai cambiamenti normativi, un maggior numero di dati sarà reso pubblicamente disponibile. Eppure - scrivono Elliott e Grimshaw - è sempre più difficile, anche per gli esperti, scovare tra le informazioni disponibili le risposte alle domande sulla salute. I dati sono presenti in domini diversi, vengono generati utilizzando metodi diversi e sono memorizzati in diverse infrastrutture - dai server privati degli ospedali alle piattaforme globali come il Database of Genotypes and Phenotypes (dbGaP)".
Sono tre gli aspetti su cui Elliott e Grimshaw si soffermano: la condivisione dei dati, la gestione dei bias e la connessione delle informazioni. "Siamo convinti - scrivono - che per consolidare i dati provenienti da fonti diverse in un corpo di evidenze completo e coerente su cui i decisori possano operare, i ricercatori hanno bisogno di sfruttare al meglio i metodi e gli strumenti attuali per la sintesi dei dati e di svilupparne di migliori".
Combinare dati o informazioni provenienti da fonti o tipologie di studi differenti può fornire una comprensione più profonda di un fenomeno, come nel caso della cisapride (un farmaco per il reflusso gastro-esofageo oggi ritirato dal commercio), autorizzato negli USA nel 1993 sulla base dei dati raccolti in studi clinici di oltre dieci anni. "L'associazione del farmaco a disturbi fatali del ritmo cardiaco - ricordano gli Autori - è stata compresa solo quando i dati provenienti dagli studi clinici sono stati consolidati con quelli di grandi studi di coorte e a lungo termine, che hanno registrato gli effetti della cisapride in migliaia di persone. Allo stesso modo - aggiungono - il quadro offerto dalla sorveglianza convenzionale dell'influenza (che comporta la raccolta di dati provenienti dalle strutture di assistenza primaria) può non essere al passo con ciò che sta realmente accadendo sul campo. Google, invece, raccoglie informazioni in tempo reale basate sull'uso dei termini di ricerca relativi ai sintomi influenzali, ma questi risultati possono essere imprecisi. Le migliori conoscenze quasi sicuramente provengono dall'aggregazione di questi diversi tipi di dati".
"Metodi formali per la sintesi delle evidenze - scrivono Elliott e Grimshaw - sono stati sviluppati nelle scienze sociali negli anni Settanta e poi adottati in molte branche della scienza; sono anche alla base dei processi decisionali ad alto impatto, come quelli che riguardano le autorizzazioni dei medicinali. Comportano generalmente l'identificazione e il confronto di tutti i dati disponibili e rilevanti; la valutazione dei punti di forza e vulnerabilità ai bias di ogni fonte; e la decisione su come gestire le diverse fonti di dati a seconda del loro rigore e della domanda posta. Poi, se è il caso, può essere condotta una meta-analisi o una valutazione qualitativa, che incorpora le informazioni".
Il problema - affermano gli Autori - è che molti ricercatori impegnati nella combinazione e nell'analisi di grandi insiemi di dati che sono a rischio di correlazioni spurie, come i dati genomici o le cartelle cliniche elettroniche, non sono a conoscenza degli strumenti di sintesi delle evidenze e della loro potenziale utilità. Al contrario, molti esperti di sintesi delle evidenze spesso non hanno familiarità con i metodi utilizzati per analizzare grandi quantità di dati relativi alla salute". Queste differenze andrebbero quindi combinate e integrate.
Un'altra questione riguarda la gestione dei bias. "Gli scienziati hanno bisogno di cogliere i rischi di bias associati a ogni tipo di dato e di integrare tali rischi nelle loro analisi. Per le sperimentazioni cliniche e gli studi osservazionali, gli analisti possono utilizzare l'approccio Cochrane Risk of Bias.
Sono necessari metodi simili per consentire l'individuazione e la riduzione delle distorsioni in altri tipi di dati, come i dati di social-networking e quelli provenienti dai device mobili. Tali metodi devono essere integrati in nuovi sistemi analitici sviluppati per guidare il processo decisionale e di assistenza sanitaria (come ad esempio quelli basati sul natural language processing e sul machine learning)".
"Nel breve e medio termine - propongono gli Autori - per sostenere le collaborazioni tra biologi computazionali, informatici, clinici, ricercatori e specialisti nella sintesi delle evidenze saranno fondamentali le conferenze, i programmi di finanziamento e una ristrutturazione dei dipartimenti delle università e degli istituti. Nel lungo termine, potrà emergere un nuovo tipo di analista, abile a valutare e combinare in modo appropriato diversi tipi di dati".
Ma cosa potrebbero comportare nella pratica questi cambiamenti? "Uno degli obiettivi della Precision Medicine Initiative statunitense (PMI) - scrivono Elliott e Grimshaw - è ridurre il rischio di ammalarsi di cancro. Ciò significa comprendere gli effetti della miriade di fattori genomici, comportamentali e ambientali e le loro interazioni. Il valore dell'Iniziativa sarà rafforzato se i dati provenienti da domini molto diversi potranno essere combinati facilmente e in modo appropriato. Un altro obiettivo dell'Iniziativa è sviluppare nuove terapie oncologiche. Sistemi migliori per la sintesi dei dati metterebbero al servizio dello sviluppo dei farmaci conoscenze più ricche e precise provenienti dalle cosiddette scienze 'omiche' ("-omics"), dagli studi sugli animali e dalla sperimentazione umana precoce. Inoltre, chi finanzia l'assistenza sanitaria, come il National Health Service in Gran Bretagna e Medicare negli Stati Uniti, potrebbe comprendere meglio i benefici e i rischi di un farmaco nel mondo reale sintetizzando dati provenienti da studi clinici, studi di coorte, esperienze dei pazienti riferite attraverso le applicazioni mobili e sociali, e i sistemi di farmacovigilanza. Non stiamo proponendo un unico modello adatto per tutti gli approcci - concludono gli Autori - ma la società non ha bisogno di isole di analisi dei dati che supportano inferenze contrastanti. Poiché i set di dati ampi e diversificati diventano sempre più numerosi, dobbiamo fare in modo che si sviluppino in parallelo metodi rigorosi e affidabili per dar loro un senso".
È quanto anche l'AIFA si propone di realizzare implementando e valorizzando i propri database.
(Wel/ Dire)