Entrepôts de données de santé : cinq erreurs juridiques que les établissements découvrent souvent trop tard

Sommaire

Comprendre ce qu’est réellement un entrepôt de données de santé
Première erreur : confondre l’entrepôt avec un projet de recherche
Deuxième erreur : mal qualifier la base légale du traitement
Troisième erreur : croire que la pseudonymisation rend les données anonymes
Quatrième erreur : négliger la gouvernance de l’entrepôt
Cinquième erreur : considérer la conformité comme une étape ponctuelle
Un enjeu central pour l’avenir du numérique en santé

Les entrepôts de données de santé occupent aujourd’hui une place croissante dans l’écosystème du numérique en santé. En permettant de structurer et de réutiliser de grandes quantités de données issues du système de soins, ils constituent un levier majeur pour la recherche médicale, l’évaluation des pratiques et l’innovation thérapeutique.

Mais derrière ces projets scientifiques et technologiques se cache une réalité souvent sous-estimée : la mise en place d’un entrepôt de données de santé est avant tout un projet fortement encadré juridiquement.

Leur création et leur exploitation s’inscrivent dans un cadre réglementaire exigeant, qui combine les dispositions du RGPD, les règles prévues par la loi Informatique et Libertés et les exigences du référentiel adopté par la CNIL pour les entrepôts de données de santé.

Dans la pratique, les difficultés rencontrées par les porteurs de projet ne proviennent généralement pas de la technologie utilisée, mais d’une anticipation insuffisante de ces exigences juridiques et organisationnelles.

Certaines erreurs apparaissent ainsi régulièrement lors de la conception ou de la gouvernance de ces dispositifs

Comprendre ce qu’est réellement un entrepôt de données de santé

Avant d’identifier ces difficultés, il est nécessaire de rappeler ce que recouvre juridiquement la notion d’entrepôt de données de santé.

Un entrepôt de données de santé (EDS) est une base de données structurée, constituée afin de centraliser et d’organiser des données issues du système de soins (données médicales, biologiques, administratives ou issues du parcours patient) dans le but de permettre leur réutilisation pour des travaux d’étude, d’évaluation ou de recherche.

Contrairement à un traitement ponctuel de données dans le cadre d’un protocole scientifique déterminé, l’entrepôt constitue une infrastructure pérenne destinée à accueillir plusieurs projets successifs.

Cette caractéristique explique pourquoi la CNIL a adopté un référentiel spécifique encadrant leur constitution et leur exploitation. Ce cadre vise à concilier deux exigences fondamentales :

favoriser la recherche et l’innovation médicale
garantir un niveau élevé de protection des données de santé

Ces données appartiennent en effet à la catégorie des données sensibles au sens de l’article 9 du RGPD, ce qui implique un régime juridique particulièrement exigeant.

Première erreur : confondre l’entrepôt avec un projet de recherche

L’une des erreurs les plus fréquentes consiste à assimiler l’entrepôt lui-même à une activité de recherche.

En réalité, il convient de distinguer deux niveaux de traitement juridiquement autonomes.

Le premier traitement correspond à la constitution et à la gestion de l’entrepôt. Il s’agit d’organiser une base de données destinée à accueillir des informations issues du soin et à permettre leur réutilisation ultérieure.

Le second traitement correspond à l’utilisation des données de cet entrepôt dans le cadre de projets spécifiques, par exemple une étude épidémiologique ou un projet de recherche clinique.

Cette distinction est essentielle car les exigences juridiques ne sont pas identiques.

L’entrepôt constitue une infrastructure de gouvernance des données. Les projets de recherche, eux, doivent être examinés individuellement et validés selon des procédures spécifiques.

Ignorer cette distinction conduit parfois à considérer l’entrepôt comme une autorisation implicite pour toute utilisation future des données. Or le cadre réglementaire impose précisément l’inverse : chaque projet doit être encadré et évalué.

Deuxième erreur : mal qualifier la base légale du traitement

Le choix de la base légale constitue un point structurant pour tout projet d’entrepôt de données de santé.

Dans la majorité des cas, les entrepôts mis en place par des établissements de santé reposent sur l’exercice d’une mission d’intérêt public. Cette base juridique permet de traiter certaines données de santé lorsqu’elles sont nécessaires à des activités d’intérêt général, telles que la recherche ou l’évaluation du système de soins.

Certaines organisations envisagent toutefois d’utiliser le consentement des patients comme fondement du traitement.

En pratique, cette approche est rarement adaptée à un entrepôt de grande ampleur. Le consentement doit être libre, spécifique et révocable à tout moment. Dans un dispositif destiné à alimenter de multiples projets sur une longue période, la gestion de ces retraits devient rapidement complexe.

Le choix de la base légale doit donc être analysé dès la conception du projet, car il conditionne l’ensemble du dispositif d’information des patients, la gestion de leurs droits et la gouvernance de l’entrepôt.

Troisième erreur : croire que la pseudonymisation rend les données anonymes

Les entrepôts de données de santé reposent généralement sur des mécanismes de pseudonymisation.

La pseudonymisation consiste à remplacer les éléments directement identifiants d’une personne — comme son nom ou son numéro de sécurité sociale — par un identifiant technique.

Cette technique réduit les risques d’identification directe, mais elle ne transforme pas les données en données anonymes.

La différence est fondamentale.

Une donnée anonyme ne permet plus d’identifier une personne, même indirectement. Elle sort alors du champ d’application du RGPD.

Une donnée pseudonymisée, en revanche, reste juridiquement une donnée personnelle dès lors qu’il existe un moyen raisonnable de réidentifier la personne concernée.

Dans le contexte hospitalier, la réidentification reste souvent possible, notamment pour assurer le suivi médical ou vérifier certaines informations. Les données pseudonymisées doivent donc être protégées avec le même niveau d’exigence que les autres données personnelles.

Confondre ces deux notions conduit parfois à sous-estimer les obligations juridiques qui s’appliquent aux entrepôts.

Quatrième erreur : négliger la gouvernance de l’entrepôt

Un entrepôt de données de santé ne se résume pas à une base de données technique. C’est un dispositif qui doit être encadré par une gouvernance institutionnelle et scientifique solide.

Le référentiel de la CNIL insiste sur l’importance d’une organisation permettant de contrôler les accès aux données et d’encadrer leur utilisation.

Cette gouvernance repose généralement sur plusieurs niveaux de contrôle : validation des projets de recherche, encadrement des accès aux données, traçabilité des consultations et supervision des résultats produits.

Sans ces mécanismes, l’entrepôt risque de devenir une base de données ouverte à des usages multiples, parfois éloignés des finalités initiales du projet.

Dans le domaine des données de santé, cette dérive n’est pas seulement un risque juridique. Elle constitue également un risque éthique, car la confiance des patients dans l’utilisation de leurs données repose précisément sur l’existence de ces garde-fous.

Cinquième erreur : considérer la conformité comme une étape ponctuelle

La création d’un entrepôt de données de santé est souvent perçue comme un projet ponctuel, comparable à la mise en place d’un nouvel outil informatique.

Or la conformité d’un tel dispositif ne se limite pas à sa phase de lancement.

Un entrepôt est un système évolutif. Les données qu’il contient s’enrichissent, de nouveaux projets sont lancés, de nouveaux chercheurs accèdent aux informations.

Cette évolution permanente implique un suivi continu de la conformité.

La documentation juridique doit être mise à jour, les accès aux données doivent être régulièrement contrôlés et les mécanismes de gouvernance doivent être évalués dans le temps.

Autrement dit, la conformité d’un entrepôt ne peut être considérée comme acquise une fois pour toutes. Elle repose sur un processus de supervision permanent.

Un enjeu central pour l’avenir du numérique en santé

Les entrepôts de données de santé représentent un levier majeur pour le développement de la recherche médicale et l’amélioration du système de soins.

Ils permettent d’exploiter des volumes de données considérables afin de mieux comprendre les pathologies, d’évaluer les pratiques médicales et de développer de nouvelles approches thérapeutiques.

Mais cette promesse scientifique ne peut se réaliser que si la gouvernance de ces données est à la hauteur des enjeux.

La protection des données de santé n’est pas un frein à l’innovation. Elle constitue au contraire une condition essentielle de la confiance des patients et de la légitimité des projets de recherche.

Dans un domaine où les données sont particulièrement sensibles, la qualité du cadre juridique et éthique devient un élément structurant du développement du numérique en santé.

Le logiciel RGPD du DPO

Les DPO internes, vous disposez de documentations et d’outils intuitifs, permettant la collaboration avec vos équipes.

Les DPO mutualisés et externes (consultants freelance, cabinets d'avocats ou de conseil, institutions publiques), en plus de disposer des mémes fonctionnalités que les DPO internes pour tous vos clients, vous gérez ensemble sur une seule plateforme.

Pour partager cet article sur les réseaux sociaux

Articles et actualités RGPD

Pseudonymisation, anonymisation et données de santé : ce que la sanction IQVIA révèle sur une confusion aux conséquences majeures

IQVIA sanctionnée 5 M€ par la CNIL : pseudonymisation ≠ anonymisation. Ce que cette décision impose concrètement à toutes les organisations.En savoir plus

Article 50 de l'IA Act : obligations de transparence, mode d'emploi