Synthèse complète du cours de biostatistiques Q1 : introduction à la biostatistiques, statistiques descriptives, erreur type et intervalle de confiance, introduction aux tests d'hypothèses, corrélation et régression linéaire, données de survie, table de contingence RxC, tests de liaison, co...
Chapitre 1 – Introduction à la statistique (chap. 1 et 2)
L’épidémiologie - Exemple
Choléra à Londres en 1854.
On pensait qu’il se transmettait par l’air, chez les personnes moins fortunées, stigmatisation de certaine population.
John Snow a initié l’épidémiologie en prenant une carte de Londres et a répertorié chaque maison où il y avait le choléra. Sur
83 victimes dans un même quartier, toutes sauf 10 étaient plus proche de la pompe que de toutes les autres pompes.
Il questionna les victimes et toutes se servaient effectivement de cette pompe.
Exemple récent de biostatistique
Covid 19 :
1000 cas en mars alors qu’il y en avait peut-être 30 000 parce que beaucoup moins de personnes testées comparé à l’heure
d’aujourd’hui ! Les chiffres d’aujourd’hui n’ont plus rien à voir avec les chiffres de mars. En mars ce n’était que les cas les plus
grave. Aujourd’hui on teste tout le monde, même non malade. Chiffres non comparables !!
Objectifs du cours
• Comprendre les termes statistiques de base (population, échantillon,. . .)
• Analyser graphiquement et numériquement des données
• Reformuler une question de recherche en termes d’hypothèses statistiques
• Choisir la méthode statistique adaptée et savoir l’appliquer – interpréter les résultats
• Interpréter le résultat d’un test d’hypothèses présenté
Définition de la statistique
La statistique est la discipline qui étudie :
- Les méthodes de réduction de données (statistiques descriptives)
® Exemple : données d’un hôpital : taux d’hospitalisation (x années x milliers de patients), facturation, etc.
® Résumé des données disponibles
- La variabilité (échantillonnage)
® S’il n’y avait pas de variabilité entre les individus, on aurait pas besoin de statistiques.
- Les populations (statistiques inférentielles)
® Exemple : nouveau vaccin pour le Covid, tester chez une certaine population, pas chez tout le monde (on
utilise un échantillon de population) -> l’intention de la firme pharmaceutique est que le vaccin
fonctionne globalement dans la population et pas uniquement dans l’échantillon.
® Degré de confiance !
La BIOstatistique est l’application de la statistique aux sciences de la vie.
1
,On est intéressé par une population d’individus (ex. les européens âgés de plus de 65 ans, les hôpitaux, les animaux, …). On
désigne cette population générale : population de taille N – infinie. On en extrait un échantillon représentatif de taille n –
fini et mesurable.
Dans ces individus de la population, on est intéressé par des variables (âge, poids, groupe sanguin, est ce que le patient va
contracter la corona dans les 6 mois qui suivent la vaccination, etc.).
• Tant qu’on décrit les données au niveau de l’échantillon -> statistique descriptive. On se limite à décrire l’échantillon.
Ex : proportion de fumeur, poids moyen, proportion d’hommes, nombre de cas de Covid, nombre d’hospitalisation,
nombre de personnes aux soins intensifs.
• A partir de l’échantillon, on émet une hypothèse ou une conclusion sur une population -> statistiques inférentielles. Ex :
j’ai testé 2000 individus et j’ai tester mon vaccin sur eux, ça fonctionne, le bénéfice risque est positif. J’ai suffisamment
de confiance pour émettre cette conclusion sur la population globale.
Table des matières
1. Introduction à la statistique – Ancelle chap 1-2
2. Statistique descriptive graphique et numérique – Ancelle chap 3-6
3. Erreur type et intervalle de confiance – Ancelle chap 7-9
4. Introduction aux tests d’hypothèses – Ancelle chap 10 Example du t de Student (non)apparié – Ancelle chap 11
5. Corrélation et régression linéaire – Ancelle chap 12 & 14
6. Données de survies – Ancelle chap 20
7. Tables de contingences RxC – Ancelle chap 11 & 13
8. Comparaison d’échantillons indépendants – Ancelle chap 13
9. Comparaison d’échantillons appariés – Ancelle chap 13
10. Questions / réponses et discussion de l’article
2
,Les variables
Variable = une caractéristique ou un facteur susceptible de prendre une valeur différente selon les individus (ou les unités
statistiques) étudiés.
La taille, la couleur des cheveux, la durée d’incubation d’une maladie = variable.
Performance au 100 m = variable qui change de jour en jour.
Plusieurs types de variables selon les valeurs qu’elles sont susceptibles de prendre. On peut les différencier en 2 groupes :
variables quantitatives qu’on mesure et variables qualitatives qu’on observe et qu’on dénombre.
Les variables quantitatives
Variables caractérisées par des valeurs numériques (variables que l’on peut mesurer). Elles sont exploitables
arithmétiquement.
Variable quantitative continue Variable quantitative discrète Variable temporelle
Peuvent prendre n’importe quelle Variables numériques discontinues Utilisent les unités de mesure du
valeur numérique dans l’intervalle des (nombres entiers). Il n’existe aucune temps.
observations. L’ensemble des valeurs valeur intermédiaire possible. Il s’agit
possibles appartient à l’ensemble des de nombres entiers. Une variable Ex : âge de la grossesse, date de début
nombre réels. Il existe une infinité de discrète est le résultat d’un de la grossesse, date de naissance,
valeurs théoriques possibles. dénombrement. heure de début d’une gastro, temps
que je passe dans un hôpital, durée
Ex : poids, taille, taux de cholestérol, Variable qu’on peut mesurer mais ne d’hospitalisation des patients, …
PA. peut être qu’un nombre entier. Ex :
nombre d’enfants dans une famille = Souvent une complexité statistique
à Nombres à virgule valeur unique. cachée ! Faire attention aux
problèmes cachés !
Ex : nombre de rechute d’une maladie
par an, rappel d’un vaccin, parité, Évolution temporelle de la tuberculose
dentition. à New-York : croissance majeure et
puis à partir de 2002 -> chute
à Nombres entiers drastique = instauration du DOT
(thérapie dans les centres médicaux
uniquement, gros contrôle de
l’administration de la thérapie =
observance thérapeutique). On voit
vraiment que ça marche. Donnée qui
se mesure au cours du temps.
Variables qualitatives
Variables qui n’ont pas de valeur numérique. Leurs valeurs sont des qualités réparties en classes. On dénombre les effectifs
appartenant à chacune des classes.
Variable qualitative Variable qualitative Variable binaire
ordinale nominale
Elles s’expriment en classe Les classes ou catégories ne Type particulier de variable qualitative nominale qui ne
qui peuvent être ordonnées peuvent pas être peut prendre que deux valeurs.
selon une échelle de valeurs hiérarchisées : elles sont
(d’où le nom de variables nommées mais pas On les appelle aussi :
ordinales). ordonnées. L’ordre de
présentation est arbitraire. - Variables dichotomiques
Ex : niveau d’étude, Elles partagent la population en 2 parties
complication d’une Ex : groupe sanguin, état (malade/sain, vivant/mort, homme/femme, etc.)
maladie, score civil, nationalité, religion,
- Variables booléennes
d’appréciation de ce livre. accident.
Peuvent prendre la valeur « VRAI » ou « FAUX »
3
, - Variables de Bernoulli
Codés 1 et 0
Ex : état de santé, survie, sexe, tabagisme, statu dans une
étude épidémiologique, statut vaccinal, exposition à un
aliment, caractère génétique, réussite à l’examen de stat,
présence d’une maladie (diabétique, HTA, corona, …).
Exemple issu de l’article :
- Age : variable quantitative continue
- Nombre d’homme : variable binaire
- Diabète, hyperlipidémie, hta : binaire
- Diagnostic : angine instable : binaire
- Nombre de stent posés par lésions : quantitative
discrète
Résumé
On distingue plusieurs types de variables selon les valeurs qu’elles sont susceptibles de prendre : variables quantitatives qu’on
mesure, variables qualitatives qu’on dénombre.
Quantitatives Qualitatives
Continues Ordinales
Discrètes Nominales ou catégorielles
Temporelles Binaires ou dichotomiques
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller florencemarchal. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.04. You're not tied to anything after your purchase.