M4.2 : SH GUILLON
Le Big Data et BD en santé
I. Introduction et concepts
A. Objectif
- Connaître le concept de BD
- Définit le BD en santé
- Connaître les objectifs du BG en santé et son utilisation
- Connaître le concept d’entrepôt de données de santé et Health Data Hub
- Connaître l’importance des droits des personnes et la protection des données personnelles
o Ethique de la recherche en matière de BD
B. Le phénomène de Big Data
Le Big Data c’est l’explosion des données numériques a obligé les chercheurs à trouver de nouvelles
manières de voir et d’analyser le monde.
Ainsi né le « Big Data » en 1997
C’est un concept permettant de stocker un nombre indicible d’informations et pour visualiser les
« grandes ensembles de données ».
On a une apparition de nouveaux ordres de grandeur concernant la capture, la recherche, le partage, le
stockage, l’analyse et la présentation des données.
C. Le Big Data c’est quoi ?
Littéralement, c’est les données massives (mégadonnées)
C’est un ensemble très volumineux de données qu’aucun outil classique de gestion de base de
données ou de gestion de l’information ne peut vraiment travailler.
Chaque jour environ 2,5 trillions d’octets de données : ce sont des informations provenant de partout (vidéos,
informations climatiques, signaux GPS, …), la définition peut être variable selon les communautés qui s’y
intéressent.
Une approche transdisciplinaire nécessaire pour comprendre l’intérêt et les limites selon les disciplines,
comme en santé.
Le BG permet à tous d’accéder en temps réel à des bases de données géantes :
Analyse de données de masse
Outils spécifiques répondant à la règle des 3V (cf GAFAM)
o Volume des données considérables à traiter
o Grande Variété d’informations (venant de diverses sources, non-structurées, organisées,
Open…)
o Vélocité : fréquence de création, collecte et partage de ces données
Cela nécessite des techniques innovantes d’Intelligence Artificielle : traitement automatique du langage,
machine learning, data lake…
D. Nouvelle place dans la société
L’arrivée du Big Data : nouvelle révolution
Comme la découverte de la vapeur (début du 19e siècle)
Electricité (fin du 19e siècle)
Et l’information (fin du 20e siècle)
Dans tous les cas, considéré comme un bouleversement de la société ! Mais en santé aussi !!
1 sur 5
, M4.2 : SH GUILLON
E. Données massives = BD en santé
Dossier patient informatisé :
- Données clinico-biologiques
- Données OMICS
- Signaux et Images
Autres sources :
- Assurance maladie (SNII-RAM) nouveau SNDS (Système National des Données de Santé)
- INSEE : données démographiques
- Registres épidémiologiques : cancers, …
- Bases de données recherche : ex recherche clinique
Le corps humain est une source de BD
Les BD en santé explosent car la quantité est très importante.
On pourrait économiser 300 à 450 milliards en optimisant le système de santé en utilisant le BD. On pourrait
diminuer de 20 % la mortalité des patients.
Donc ici, on voit que l’amélioration de l’état de santé d’une population pourrait ! être améliorer.
F. La règle des 3V
II. Objectifs en santé
- Identifier des facteurs de risques de maladies comme cancers ou diabète : mettre en place outils
de prévention cohérents et plus efficaces.
- Développer des systèmes d’aide au diagnostic et des outils : personnaliser des traitements,
vérifier l’efficacité des traitements, identifier d’éventuelles complications récurrentes (amélioration de
la pharmacovigilance)
- Effectuer une veille sanitaire, ou prédire la survenue d’épidémies
Le Big Data est donc une aide précieuse à la conduite des politiques de santé, pour l’optimisation
du système de soins.
2 sur 5
Le Big Data et BD en santé
I. Introduction et concepts
A. Objectif
- Connaître le concept de BD
- Définit le BD en santé
- Connaître les objectifs du BG en santé et son utilisation
- Connaître le concept d’entrepôt de données de santé et Health Data Hub
- Connaître l’importance des droits des personnes et la protection des données personnelles
o Ethique de la recherche en matière de BD
B. Le phénomène de Big Data
Le Big Data c’est l’explosion des données numériques a obligé les chercheurs à trouver de nouvelles
manières de voir et d’analyser le monde.
Ainsi né le « Big Data » en 1997
C’est un concept permettant de stocker un nombre indicible d’informations et pour visualiser les
« grandes ensembles de données ».
On a une apparition de nouveaux ordres de grandeur concernant la capture, la recherche, le partage, le
stockage, l’analyse et la présentation des données.
C. Le Big Data c’est quoi ?
Littéralement, c’est les données massives (mégadonnées)
C’est un ensemble très volumineux de données qu’aucun outil classique de gestion de base de
données ou de gestion de l’information ne peut vraiment travailler.
Chaque jour environ 2,5 trillions d’octets de données : ce sont des informations provenant de partout (vidéos,
informations climatiques, signaux GPS, …), la définition peut être variable selon les communautés qui s’y
intéressent.
Une approche transdisciplinaire nécessaire pour comprendre l’intérêt et les limites selon les disciplines,
comme en santé.
Le BG permet à tous d’accéder en temps réel à des bases de données géantes :
Analyse de données de masse
Outils spécifiques répondant à la règle des 3V (cf GAFAM)
o Volume des données considérables à traiter
o Grande Variété d’informations (venant de diverses sources, non-structurées, organisées,
Open…)
o Vélocité : fréquence de création, collecte et partage de ces données
Cela nécessite des techniques innovantes d’Intelligence Artificielle : traitement automatique du langage,
machine learning, data lake…
D. Nouvelle place dans la société
L’arrivée du Big Data : nouvelle révolution
Comme la découverte de la vapeur (début du 19e siècle)
Electricité (fin du 19e siècle)
Et l’information (fin du 20e siècle)
Dans tous les cas, considéré comme un bouleversement de la société ! Mais en santé aussi !!
1 sur 5
, M4.2 : SH GUILLON
E. Données massives = BD en santé
Dossier patient informatisé :
- Données clinico-biologiques
- Données OMICS
- Signaux et Images
Autres sources :
- Assurance maladie (SNII-RAM) nouveau SNDS (Système National des Données de Santé)
- INSEE : données démographiques
- Registres épidémiologiques : cancers, …
- Bases de données recherche : ex recherche clinique
Le corps humain est une source de BD
Les BD en santé explosent car la quantité est très importante.
On pourrait économiser 300 à 450 milliards en optimisant le système de santé en utilisant le BD. On pourrait
diminuer de 20 % la mortalité des patients.
Donc ici, on voit que l’amélioration de l’état de santé d’une population pourrait ! être améliorer.
F. La règle des 3V
II. Objectifs en santé
- Identifier des facteurs de risques de maladies comme cancers ou diabète : mettre en place outils
de prévention cohérents et plus efficaces.
- Développer des systèmes d’aide au diagnostic et des outils : personnaliser des traitements,
vérifier l’efficacité des traitements, identifier d’éventuelles complications récurrentes (amélioration de
la pharmacovigilance)
- Effectuer une veille sanitaire, ou prédire la survenue d’épidémies
Le Big Data est donc une aide précieuse à la conduite des politiques de santé, pour l’optimisation
du système de soins.
2 sur 5