Dit is een samenvatting van het vak Statistiek 2 in semester 1 van het 2e jaar. Het document omvat de nodige informatie uit de PowerPoint slides en het handboek en extra uitleg vanuit de les.
Rangcorrelatie van Spearman ............................................................................................................ 31
Chikwadraat voor kruistabellen.......................................................................................................... 32
10 Kiezen van de juiste toets ....................................................................................................................... 34
0
,Hoofdstuk 1: Herhaling
1 Herhaling
1.1 Variabelen en operationaliseren
Variabelen = allerlei zaken die je kan meten met cijfers of kan indelen in categorieën.
• Kwantitatief: met cijfers
• Kwalitatief: zonder cijfers
• Continu: oneindig veel waarden (lengtes: 1,77m; 1,689m)
• Discreet: aantal waardes (haarkleur: blond, bruin, …)
• Opgedeeld in meetniveaus:
1. Nominaal: enkel categorieën (geslacht, verschillende smaken chocolade)
2. Ordinaal: waarden met rangorde (opleidingsniveau, likert-schaal, militaire rang)
3. Interval: betekenisvolle verschillen tussen waarden (IQ, psychologische testscores)
4. Ratio: kan niet onder 0 gaan (gewicht, lengte, inkomen)
• Onafhankelijk: waarvan we denken dat het invloed zal hebben, gaan we manipuleren
• Afhankelijk: wat we willen meten
Operationaliseren = variabelen meetbaar maken.
→ Twee voorwaarden voor meten:
• Betrouwbaarheid: hoe goed meet de test wat we willen meten?
• Validiteit: meet de test wat we willen meten?
1.2 Steekproeven
Steekproef = het deel van de populatie dat wordt onderzocht, wanneer de populatie te groot is.
→ Inductieve statistiek: verantwoorde uitspraken doen over de populatie aan de hand van een steekproef
1.2.1 Volledig aselecte steekproef
Elk element van de populatie heeft een gelijke kans om in de steekproef te worden opgenomen
• Niet altijd representatief (meer jongens dan meisjes)
• Vaak moeilijk realiseerbaar in de praktijk
1.2.2 Niet-aselecte steekproeven
Sneeuwbalsteekproef
Vertrekt van 1 respondent aan wie vervolgens gevraagd wordt andere respondenten te contacteren
• Voordeel: mensen die moeilijk bereikbaar zijn worden makkelijker bereikt
• Nadeel: kans is groot dat mensen sterk op elkaar lijken
Gelegenheidssteekproef
Keuze van respondenten wordt overgelaten aan ondervrager → mensen die men makkelijk kan vinden
• Voordeel: goedkoop, snel
• Nadeel: niet geschikt voor populatieschattingen
Quotasteekproef
Onderzoeker bepaalt kenmerken van de populatie die men ook wil zien in steekproef (verdeling
jongens/meisjes)
1
,Hoofdstuk 1: Herhaling
1.2.3 Belang van (goede) steekproeven
• Niet-aselecte steekproeven zijn niet altijd geschikt voor inductieve statistiek
• Goede steekproefselectie is essentieel in onderzoek
• Keuze voor steekproef steeds kunnen onderbouwen
1.3 Frequentieverdelingen
• Verschillende soorten:
• Absolute frequenties: hoe vaak komt een bepaalde waarde voor in de steekproef
• Relatieve frequenties: ten opzichte van het totaal (%)
• Verschillende visuele voorstellingen (afhankelijk van meetniveau):
• Taartdiagram (nominaal)
• Staafdiagram (nominaal of ordinaal)
• Stamdiagram, histogram, boxplot (interval)
• Percentielscores: plaats van een score in het geheel
• Kwartiel (25%)
• Deciel (10%)
1.4 Centrummaten
Centrummaten geven aan wat de centrale tendens is van de verdeling → op welk punt de meeste scores zitten
• Modus = waarde die het meest voorkomt. (elk meetniveau)
• Mediaan = middelste waarde bij gerangschikte waarnemingen. (min ordinaal)
• Gemiddelde = som van alle waarden gedeeld door aantal waarnemingen. (min interval)
• Bij een symmetrische verdeling: modus = mediaan = gemiddelde
1.5 Spreidingsmaten
Spreidingmaten toont hoe ver scores uit elkaar liggen
• Interkwartielafstand: P75 – P25
• Variantie (s²): gemiddelde van de gekwadrateerde afwijkingsscores van elke uitslag ten opzichte van
gemiddelde
• Standaarddeviatie (s): de vierkantswortel van de variantie
• Standaardscores (z-scores): drukt uit hoeveel standaarddeviaties een geobserveerde score boven of
onder het gemiddelde zit
1.6 De normale verdeling
• Altijd klokvormig en symmetrisch
• Verschillen enkel in gemiddelde en standaarddeviatie
• Dankzij dit model kunnen gemakkelijk observaties afgeleid worden
2
, Hoofdstuk 2: Inductieve statistiek
2 Inductieve statistiek
2.1 De empirische cyclus
1. Ondubbelzinnige vraagstelling
2. (On)afhankelijke variabelen bepalen en operationaliseren
3. Representatieve steekproef
4. Gegevens verzamelen
5. Beschrijvende analyse: centrummaten, spreidingsmaten, …
6. Inductieve analyse: kunnen we de steekproef generaliseren naar de populatie?
7. Conclusies → kan vaak aanleiding geven tot nieuwe vraagstelling
2.2 Problemen in inductieve statistiek
• Statistiek geeft nooit 100% zekerheid:
• Onderzoek meestal in steekproeven → geen perfecte afspiegeling van populatie
• Foutieve variatie en toevallige meetfouten mogelijk
• Daarom berust het op kansberekening:
• Inschatten hoe zeker we zijn van onze conclusies
• Wanneer zijn zulke uitspraken toegestaan? => significantie
2.3 Statistische significantie
Statistische significantie = term die onderzoekers gebruiken om aan te geven dat het onwaarschijnlijk is dat hun
resultaten op toeval gebaseerd zijn.
• Zijn de verschillen tussen de resultaten betekenisvol? → statistisch significant?
• Is het verschil in scores eerder klein of is het groot genoeg?
• Klein: te wijten aan toevalligheden
• Groot: verschil zal er waarschijnlijk ook zijn in populatie
• Statistische significantie helpt ons om onze hypothesen te toetsen => hypothesetoetsing
2.4 Kansberekening
1. Vertrekpunt: “er is geen verschil” (= nulhypothese)
2. Hoe groot is de kans dat de geobserveerde data te wijten is aan toeval?
• Waarschijnlijk toeval? → nulhypothese (geen effect in populatie)
• Kleine kans dat het toeval is? → alternatieve hypothese (wel effect in populatie)
→ Kansberekening gaat ervan uit dat er in de werkelijkheid geen verschil is
• Hoe moeten we die kans berekenen?
• Kansverdelingen (standaardnormale verdeling)
• Verschillende hypothesetoetsen
• Wat is dan een ‘grote’ en een ‘kleine’ kans?
• 5% of 0.05 meest courant
2.5 Hypothesetoetsing
Toetsingssituaties kunnen heel uiteenlopend zijn → uiteenlopende toetsen
3
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper SamenvattingenBachelor. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,99. Je zit daarna nergens aan vast.