Données de santé : quels bénéfices pour notre système de santé ?
Par Emma Ros, chargée d’études au programme santé à l’Institut Montaigne
Chaque jour, notre système de santé et ses acteurs produisent de nombreuses données de santé qui viennent alimenter les dossiers médicaux, les bases de remboursement de l’Assurance maladie ou encore les cohortes de recherche. Ces données, de nature hétérogène, représentent un potentiel immense pour la performance et le pilotage de notre système de santé.
Données de santé : de quoi parle-t-on ?
Le Règlement européen sur la protection des données (RGPD) définit la donnée de santé comme une donnée qui renseigne sur la santé physique ou mentale d’une personne. Ces données personnelles peuvent regrouper les données dites médico-administratives (les dépenses de santé et remboursements des soins) ou encore les données cliniques du patient (antécédents, comorbidités, résultats de tests médicaux, etc.). On peut également citer les données génomiques ou générées par les patients via les objets connectés. D’autres types de données, à l’image des données environnementales, peuvent également être considérées comme des données de santé.
Ces données de nature hétérogène peuvent être utilisées à des fins spécifiques. On distingue typiquement l’utilisation primaire : soit les informations qui sont générées dans le cadre d’une prise en charge d’un patient et regroupées au sein de dossiers médicaux électroniques ; de l’utilisation secondaire qui constitue la réutilisation de ces données à des fins de recherche ou de pilotage de notre système de santé. Cette utilisation secondaire est réalisée à partir de données pseudonymisées pour lesquelles les informations directement identifiantes de la personne (tels que le nom, prénom, date de naissance) sont remplacées par un identifiant.
Quels sont les usages de la donnée de santé ?
En plus de constituer une formidable opportunité économique (une exploitation des données de santé aurait un potentiel de création de valeur de 7,3 milliards d’euros), les données de santé constituent une source d’information précieuse à même de générer de nombreux usages en dehors du seul soin.
Le Healthcare Data Institute identifie trois usages à l’utilisation secondaire des données de santé. Les données de santé peuvent être ainsi utilisées à des fins de recherche afin d’étudier la pertinence d’un parcours de soins ou encore d’identifier des nouvelles stratégies thérapeutiques (médicaments, thérapies digitales) pour une pathologie définie.
L’utilisation secondaire des données représente également une opportunité pour le développement d’innovations technologiques, à l’image des algorithmes d’intelligence artificielle (IA), qui offrent une aide à la décision pour les professionnels de santé, une meilleure précision dans le diagnostic ou encore une prédiction dans les récidives. À titre d’exemple, des chercheurs américains ont récemment mis au point une IA prédisant le risque de développer un cancer du sein 5 ans avant l’apparition des symptômes.
Pour finir, les données de santé représentent un atout clé dans le pilotage de notre système de santé. Lors de la crise Covid-19, les données ont été au cœur de la gestion de la crise avec la création des plateformes SI-DEP et Data vaccin Covid permettant un suivi en temps réel des campagnes de dépistage et de vaccination. D’autres modèles de pilotage par la donnée peuvent également être envisagés à l’image du modèle de responsabilité populationnelle, qui nécessite un accès en temps réel aux données cliniques d’un bassin de population.
Des initiatives nationales et européennes qui contribuent à la construction d’un écosystème de la donnée de santé
La France dispose de nombreux atouts à même de structurer l’écosystème de la donnée de santé. On peut notamment citer le Système national des données de santé (SNDS) créé en 2016 qui regroupe les données de remboursement de l’Assurance maladie du Sniiram, les données d’activité des établissements de santé issues du PMSI et les données des causes médicales de décès du CépiDC. Le SNDS devrait également être prochainement enrichi avec des informations relatives au handicap issues des MDPH. Cette base constitue une base nationale d’une richesse unique en Europe : elle regroupe chaque année 1,5 milliard de feuilles de soins de ville et 12 à 15 millions de séjours hospitaliers et offre un historique des données pouvant aller jusqu’à 20 ans. La Cnam met aussi à disposition des outils de data visualisation de ses données issues du SNDS, à l’image de l’outil data pathologies et de la récente plateforme data professionnels de santé libéraux.
Depuis 2019, la France dispose également d’un acteur clé dans la gouvernance des données de santé, le Health Data Hub qui a pour ambition d’être un guichet unique à destination des porteurs de projets et d’offrir un catalogue recensant et chaînant les bases de données existantes. Le Health Data Hub est également à la tête d’un consortium chargé de mettre en place le projet préfigurateur de l’Espace européen des données de santé (EHDS).
Malgré ces différentes initiatives qui ont permis de structurer une gouvernance des données de santé (selon l’OCDE, la France se positionne en 4e position en termes de gouvernance des données de santé avec l’existence d’autorités et de bases nationales), l’absence d’une stratégie nationale fait prendre du retard à la France par rapport à ses voisins européens. En effet, elle n’atteint que la 14e place en termes de maturité de ses bases. Une feuille de route nationale dédiée aux données de santé est en cours de construction : cette dernière devra identifier des leviers d’actions prioritaires aux freins auxquels sont encore confrontés les acteurs de la recherche et de l’innovation.
Quelles priorités pour une stratégie nationale autour des données de santé ?
De nombreuses barrières complexifient l’accès et l’utilisation des données de santé en France. Tout d’abord, la multiplicité des bases existantes en santé publique ralentit leur identification et interopérabilité : en 2021, le département Etalab recensait 172 bases de données existantes dans le domaine de la santé gérées par 79 gestionnaires différents. Il devient essentiel d’identifier et de construire des bases prioritaires de données de santé publique.
Par ailleurs, les données de santé demeurent de nature hétérogène et peu standardisées, complexifiant leur réutilisation. La création d’entrepôts de données de santé hospitaliers constitue une première brique à la structuration des données hospitalières et aura pour objectif de créer des jeux de données (soit des ensembles homogènes de données) spécifiques par grand centre hospitalier. Néanmoins, afin de s’assurer de l’interopérabilité entre ces différentes bases et faciliter leur usage, ces data sets devront convenir d’un modèle de standardisation de la donnée commun, à l’image des critères OMOP ou FHIR.
La question du financement de ces entrepôts devra également être au cœur de la stratégie nationale. Les 33 premiers entrepôts de données de santé ont reçu un montant de 40 millions d’euros sur 3 ans. Bien que significatifs, ces financements semblent insuffisants pour assurer la mise en oeuvre et le fonctionnement nominal de tels entrepôts : un groupe de travail du Health Data Hub estimait ainsi à 2 millions d’euros par an le coût de développement d’un seul entrepôt (sur 5 ans) et un coût de 3 millions d’euros par an pour son fonctionnement nominal. Des modalités de financements pérennes, à l’image de la mise en place de financements mixtes, doivent constituer une réflexion prioritaire.
Pour finir, la création d’entrepôts de données de santé de ville représente un enjeu stratégique : ces données, bien plus nombreuses que les données hospitalières constituent un indicateur clé de la santé d’une population d’un territoire. Bien que les données du SNDS renseignent sur les dépenses de santé des soins de ville, elles manquent de données à caractère médical et ne permettent pas de retracer le motif et le diagnostic des consultations médicales de ville. Des projets mobilisant les données de santé de ville à l’image de la Platform for Data in Primary Care émergent mais doivent être pérennisés afin de mobiliser les données de santé de ville dans la recherche comme dans le pilotage de notre système de santé.