Garantie de satisfaction à 100% Disponible immédiatement après paiement En ligne et en PDF Tu n'es attaché à rien
logo-home
College aantekeningen Statistische Modellen 1 €4,89   Ajouter au panier

Notes de cours

College aantekeningen Statistische Modellen 1

1 vérifier
 84 vues  9 achats
  • Cours
  • Établissement

In dit document komen de colleges van Hoekstra (bachelor) en Kramer (pre-master) samen. Zowel alle powerpoints van Nestor als de pdf's en colleges van de pre-master zijn hierin opgenomen. Zo vormt dit document een compleet beeld van alle kennis voor het tentamen!

Aperçu 4 sur 62  pages

  • 18 mars 2021
  • 62
  • 2020/2021
  • Notes de cours
  • Hoekstra en kramer
  • Toutes les classes

1  vérifier

review-writer-avatar

Par: Roypicek19 • 1 année de cela

avatar-seller
Statistische modellen 1

Herhaling Kramer inleiding onderzoek
Inleiding onderzoek: beschrijvingen geven van verdelingen van scores op variabelen in een dataset

Univariate beschrijvingen (je hebt 1 variabele die je bekijkt)
• Boxplot, histogram, stemplot
• Gemiddelde, mediaan, modus
• SD, range, IQR
• Frequentietabellen

Bivariate beschrijvingen (je bekijkt de verhouding van twee variabele tot elkaar)
• Spreidingsdiagram, kruistabellen
• Correlatie, gowers, rho, tau, kappa

Drie soorten kenmerken/variabelen
1. Onafhankelijke variabelen: hebben gevolgen maar zijn geen gevolgen
Vb: al dan niet bijles hebben gehad
2. Afhankelijke variabelen: zijn gevolg
Vb: behaalde tentamencijfers
Causaliteit: bijles veroorzaakt tentamencijfer (Schematisch: A → B)
Niet causaal schematisch: A – B
3. Indirecte controlevariabelen: kenmerken die te onderzoeken relatie beïnvloeden
Vb: collegeaanwezigheid

Meetniveau van een variabele
Soort variabele Meetniveau
Categorische variabelen (ook wel kwalitatieve Nominaal
variabelen genoemd) Ordinaal
Kwantitatieve variabelen Interval
Ratio

➢ Meetniveau ligt niet vast, gebruiker kiest meetniveau
➢ Geeft aan welke informatie in scores op variabele je serieus neemt

Een eerste blik op data (beschrijvend)
Inspecteer scores per variabele
1. Grafisch / Frequentietabel: eerst plaatjes maken. Je zoomt in op het deel waar scores
zichtbaar zijn en uitschieters rapporteer je apart.
2. Samenvattingsmaten: nu ga je dingen uitrekenen.
a. Centrummaten (mediaan, gemiddelde, mode)
b. Spreidingsmaten
i. Spreidingsmaten gebaseerd op hoever scores van elkáár afliggen: Range, Five
number summary, IQR
ii. Spreidingsmaten gebaseerd op hoever scores van gemiddelde afliggen:
Variantie, Standaarddeviatie

Let hierbij op:
1. Verdeling van scores (vorm, uitbijters)
2. Centrum (‘midden’) van scores
3. Spreiding van scores

,Gemiddelde, mediaan, modus
➢ Verdeling symmetisch: mediaan = gemiddelde = modus
➢ Verdeling niet symmetisch = scheve verdeling = mediaan en gemiddelde niet gelijk.
Gemiddelde < mediaan = staart aan de linkerkant (linksscheve verdeling).
Gemiddelde > mediaan = staart aan de rechterkant (rechtsscheve verdeling)
➢ Verdeling scheef? GEMMEDIAANMODUS




Grafische weergave boxplot




Variantie (tussenstap naar standaarddeviatie)
1. Bereken de gemiddelde scoren
2. Bereken de afwijkingen tussen individuele
scores en gemiddelde
3. Bereken het gemiddelde van gekwadrateerde afwijkingen
• Door te kwadrateren tellen extreme scores zwaarder mee
• Uitkomst vertelt je wat de gemiddelde gekwadrateerde afstand
tot het gemiddelde is… wordt daarom alleen gebruikt om mee
door te rekenen → zie volgende

,Variantie en standaarddeviatie
Variantie: Standaarddeviatie:




➢ Let op: Delen door N- 1 (statische reden)
➢ De standaarddeviatie vertelt je dan wat (globaal genomen) de ongekwadrateerde
gemiddelde afstand tot het gemiddelde is. Een grotere standaarddeviatie staat dan dus gelijk
met meer spreiding in scores bij de variabele

Verdelingen – Curves
Curve beschrijft het verloop van de staven ‘heel aardig’.
➢ Soms teken je in een grafiek een curve. Dit hoeft niet helemaal perfect te zijn, maar het
verloop van bijv. staven aardig beschrijven.
➢ Wiskundig model
➢ Ondervangt nadelen van de histogram: je kunt heel makkelijk rekenen welk deel van de
mensen in een bepaald deel of interval passen. Relatief eenvoudig uit te rekenen.
➢ Geeft aan hoeveel van de scores in een willekeurig te kiezen interval vallen
➢ Altijd boven de x-as
➢ Totale oppervlakte onder de curve is op 1 gesteld.
➢ Oppervlakte boven een bepaald interval geeft aan welk deel van de scores in dat specifieke
interval viel.
➢ Curve geeft geen frequenties/getallen. Y-waarde zelf is niet interpreteerbaar. Je moet alleen
naar oppervlaktes onder de curve kijken. Je weet niet hoeveel mensen in een bepaald
gebied/oppervlakte zitten, maar wel welk deel van de mensen.

Voordelen van dichtheidscurve
1. Je kan eenvoudig bepalen hoeveel van de scores in een willekeurig te kiezen interval vallen
2. Je zit niet vast aan de frequentie per klasse van scores
Nadeel: afhankelijk van dikte staafjes.




Kenmerken dichtheidscurve
1. Ligt altijd boven de X-as
2. Totale oppervlakte onder de curve is 1 (= 100%)
3. Oppervlak onder de curve voor een bepaald interval van waarden geeft aan welk deel van de
scores in dit interval valt = ‘dichtheid’ van scores in dat interval

, NB: dichtheidscurve geeft geen frequenties
➢ Y-waarde zelf niet interpreteerbaar
➢ Alleen naar oppervlaktes onder de curve kijken

Symmetrische (unimodale) verdeling
➢ Gemiddelde = mediaan = modus
➢ Standaarddeviatie (s) = afstand tussen midden en buigpunt

Normale verdelingen
➢ Er is niet 1 normale verdeling, maar een hele klasse
➢ Met verschillen in gemiddelde () en standaardafwijking ()




Wat is er zo belangrijk aan die normale verdelingen?
➢ Veel verdelingen in de praktijk (bijv. IQ, lengte per geslacht) zijn ongeveer normaal
➢ Uitkomsten van kansprocessen vaak vrijwel normaal verdeeld
➢ Nuttig bruikbaar bij bepaling van onzekerheidsmarges van betrouwbaarheidsintervallen
(statistische modellen 1)
➢ Ze hebben algemene eigenschappen. Je kunt daar altijd van op aan en mee rekenen.
Echter: ook veel verdelingen in de praktijk zijn niet normaal, maar wel interessant.

Hoe controleer je of verdeling ongeveer normaal is?
1. Maak een histogram en kijk of je ‘klokvorm’ hebt
Maar: histogram is sterk afhankelijk van intervalbreedte (breedte staafjes)
2. Gebruik daarom: ‘Normal Quantile Plot’

Les avantages d'acheter des résumés chez Stuvia:

Qualité garantie par les avis des clients

Qualité garantie par les avis des clients

Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.

L’achat facile et rapide

L’achat facile et rapide

Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.

Focus sur l’essentiel

Focus sur l’essentiel

Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.

Foire aux questions

Qu'est-ce que j'obtiens en achetant ce document ?

Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.

Garantie de remboursement : comment ça marche ?

Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.

Auprès de qui est-ce que j'achète ce résumé ?

Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur AMBR. Stuvia facilite les paiements au vendeur.

Est-ce que j'aurai un abonnement?

Non, vous n'achetez ce résumé que pour €4,89. Vous n'êtes lié à rien après votre achat.

Peut-on faire confiance à Stuvia ?

4.6 étoiles sur Google & Trustpilot (+1000 avis)

74534 résumés ont été vendus ces 30 derniers jours

Fondée en 2010, la référence pour acheter des résumés depuis déjà 14 ans

Commencez à vendre!
€4,89  9x  vendu
  • (1)
  Ajouter