Samenvatting Statistiek 1. Incl. uitleg hoe je een berekening moet intypen in je grafische rekenmachine. In het rood aangegeven wat belangrijk is voor het tentamen. Voor dit vak was geen boek. 8,8 tentamencijfer
Samenvatting Statistiek
Verzamelen van gegevens → Rangschikken → Analyseren → Bepaalde conclusie trekken
Het rangschikken en analyseren van gegevens = beschrijvende statistiek. VB. aloude volkstelling. Er wordt
dan niet naar verbanden of verklaringen gezocht. Als we wel naar verbanden zoeken m.b.v. statistische
methoden dan is het mathematische statistiek.
Trekken van conclusies uit gegevens= mathematische statistiek (toetsen en schatten)
Populatie= de verzameling van onderzoekseenheden waarop het onderzoek betrekking heeft. Men doet een
steekproef, omdat het verzamelen van gegevens van een gehele populatie tijdrovend en kostbaar is. Deze
steekproef moet wel representatief en aselect (willekeurig) zijn.
Variabelen
- Een variabele is een geoperationaliseerd begrip waarvan precies is aangegeven hoe het wordt
gemeten. Variabelen variëren en dus verschillende waarden aannemen. Zo heeft de variabele
‘woningtype’. VB de waarden ‘koopwoning’ en ‘huurwoning’
- Er zijn discrete variabelen (waarden zijn gehele getallen) en continue variabelen (verschil tussen
twee waarden kan willekeurig klein zijn).
o VB aantal vrienden op facebook → discrete variabele (dit kan geen komma getal zijn, want
je kan geen 1,5 vriend hebben)
o VB gemiddelde tijd per dag op facebook → continue variabele (de ene zit 1,5 uur op
facebook en de ander 45 min, dit kunnen komma getallen zijn maar kan ook discreet zijn
(1 uur op facebook))
Operationaliseren en meten: meetniveaus (NOIR) 4 schalen:
1. Nominaal
o Enkel onderscheid in categorieën
o Geen sprake van ordening
o VB: geslacht, woonplaats, huurwoning, koopwoning
2. Ordinaal
o Onderscheid in de categorieën, én er zit een ordening in de categorieën
o VB. maat kleding (S, M, L, XL). Helemaal mee eens, mee eens, neutraal, oneens, helemaal
oneens.
o Verschillen tussen deze uitkomsten zijn betekenisloos.
3. Interval
o Verschillen tussen de uitkomsten zijn wel van betekenis.
o Er is géén absoluut nulpunt, het interval tussen 2 schaalpunten heeft een numerieke
betekenis
o VB: temperatuur in graden Celsius, bouwjaar, Fahrenheit. Huis A (1970) is 20 jaar ouder
dan B (1990) en 15 jaar ouder dan C (1985)
4. Ratio
o De verhouding tussen 2 schaalpunten heeft een numerieke betekenis, er is wél een
absoluut nulpunt
o VB: lengte, gewicht, inkomen, Kelvin
Nominale en ordinale schalen worden soms ook wel categorale schalen genoemd. Berekenen van een
rekenkundig gemiddelde is uit den boze.
Interval en ratioschalen worden ook wel metrische schalen genoemd. Berekenen van een gemiddelde is wel
mogelijk en vaak zinvol.
Voorbeelden
- Het aantal verkochte oranje tompouces op Koningsdag → discreet
- De dikte van een tompouces → continu
- Het aantal milliliters regen in de maand april → continu
- Welke kleur had de tompouce toen u hem kocht: → nominaal
o Roze, Oranje, Wit of Anders
, - Hoeveel biertjes heb je thuis gedronken op Koningsdag: → 2
ordinaal
o 0 bier
o 1-2 bier
o 3-4 bier
o Meer dan 4 bier
- Heb je het Wilhelmus meegezongen op Koningsdag? → nominaal
o Ja, uit volle borst
o Ja, heel zachtjes
o Ja, gedeeltelijk (wist de tekst niet meer)
o Nee
Rangschikken
Om een indicatie te krijgen hoeveel klassen er gekozen moeten worden, gebruikt men ook wel eens deze
vuistregel: kies het aantal klassen ongeveer gelijk aan de wortel uit het aantal waarnemingen. Als bij een
indeling in gelijke klassen een aantal klassen zeer slecht bezet zouden zijn, kan men beter met klassen van
ongelijke breedte werken.
Frequentieverdelingen
- Absolute frequentie: het aantal waarnemingen per klasse
Relatieve freq. =
Frequentie : - Relatieve frequentie: ten opzichte van iets anders bepaald is. Deel van het totaal.
Totale frequentie Het aantal waarnemingen per klasse : het totaal aantal waarnemingen x 100%
- Cumulatieve frequentie of relatieve cumulatieve frequentie: percentage van
hoogstens een bepaalde waarde. Valide percentages bij elkaar optellen. Het
aantal waarnemingen dat in totaal beneden een bepaalde grens ligt. De cumulatieve frequentie kan
zowel absoluut als relatief genomen worden. 1e relatieve freq. + 2e relatieve freq. = 2e cum. 2e cum
+ 3e relatieve freq = 3e etc.
Relatief freq. Cum.freq
2 2
Data indelen in klassen 5 2+5= 7
Overzichtelijkheid voor de lezer staat voorop. In 1 oogopslag duidelijk zijn. 13 13 + 7= 20
24 24+20= 42
30 30+42= 72
Grafieken
1. Cirkeldiagram (taartdiagram, pie-chart) Rel. freq.= L2 : totaal frquentie
o Nominale variabelen
o Als je procentuele verschillen (aandeel) wil laten zien. Vlakverdeling geeft de relatieve
frequentie in percentage aan.
o Geschikt wanneer je te maken hebt met gegevens die gemeten worden op een categorale
schaal
2. Staafdiagram (bar chart)
o Nominale- of ordinale variabelen
o Staven los van elkaar tekenen, niet aan elkaar vast.
o Geschikt wanneer je te maken hebt met gegevens die gemeten worden op een categorale
schaal.
o Komt ook weleens voor in de vorm van een naalddiagram of een beelddiagram
3. Histogram
o Scale variabelen (interval en ratio variabelen)
o Geschikt wanneer je te maken hebt met gegevens die gemeten worden op een metrische
schaal
o Frequentiedichtheid= frequentie : klassenbreedte
o Bestaat uit aaneengesloten kolommen. Als je een histogram maakt van een
frequentieverdeling met ongelijke klassenbreedten is de frequentiedichtheid niet altijd
gelijk aan de frequentie.
4. Boxplot
o Scale variabelen (interval en ratio variabelen)
Centrale liggen
Voor centrale ligging speelt dit een rol:
- Maatstaven
- Spreiding van de waarnemingsuitkomsten
, 3
Ligging en spreiding bij frequentieverdelingen
Je kan indelen in:
- Losse waarnemingen
o Frequenties
o Geen frequenties
▪ Als het aantal orders allemaal 1 is, want dan heeft het geen zin om het aantal te
noemen.
- Klasse waarnemingen
o Klassen
o Klassengrenzen
o Aantal waarnemingen binnen een klasse
Centrummaten (maatstaven) voor ligging bij losse waarnemingen
- Waar ligt het zwaartepunt van de frequentieverdeling
o Wat hebben de meeste studenten gehaald (modus)
o Wat is het gemiddelde cijfer
- Gemiddelde = de som van alle scores : het aantal scores → x met een streepje erop
- Mediaan is de middelste waarneming ná ordening in grootte! → Xme
o Oneven aantal waarnemingen → middelste waarneming
o Even aantal waarnemingen → gemiddelde van de middelste 2 waarnemingen
o Als er uitschieters zijn
o GR rekent deze uit
- Modus geeft de waarneming met de hoogste frequentie aan (vaakst voorkomt) → Xmo
o Als er meerdere waarnemingen zijn die een gelijke (hoogste) frequentie hebben, is de
modus niet gedefinieerd (een gedeelde 1e plaats is niet mogelijk).
o VB. een 7,8 en een 5,6 komen het meeste voor. Als dit zo is dan is de modus geen goede
centrummaat te gebruiken
Percentielscore is een cumulatief percentage
Kwartiel- en deciel score = de scores worden opgedeeld in groepjes van respectievelijk 25% en 10%.
Sigma ∑
Sigma ∑ staat voor sommatie
→ optellen
Wiskundigen gebruiken vaak
de letter x met een ‘index’ (i)
die van 1 tot n loopt
Andere gemiddelden
Heel vaak bedoelen we met ‘het gemiddelde’ het rekenkundig
gemiddelde. Maar er zijn meerdere gemiddelden (verzonnen
receptjes om een centrummaat te bepalen):
- Gewogen gemiddelde
- Voortschrijdend gemiddelde
- Meetkundig gemiddelde
- Harmonisch gemiddelde
- Getrimd/ geminoriseerd gemiddelde
Welke centrummaat is bij deze variabele het meest geschikt en
waarom?
- Gemiddeld aantal whatsapp berichten van 15 V&M
studenten: 20, 43, 55, 34, 67, 47, 59, 61, 26, 37, 635, 39, 24, 32, 53 → mediaan, want die 635
trekt het gemiddelde erg omhoog.
- Lievelingskleur van 15 V&M studenten: geel, blauw, blauw, rood, groen, oranje, paars, blauw,
rood, roze, groen, blauw, geel, blauw, zwart →modus, kijken welke het meeste voorkomt.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller EvelineSchipperHR. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.16. You're not tied to anything after your purchase.