Hf 1: gegevens verwerken
Beschrijvende statistiek = resultaten ve steekproef verzamelen en verwerken grote
hoeveelheid aan resultaten overzichtelijk maken gegevenstabel,
figuur, grafiek, gemiddelde waarde, spreiding rond gemiddelde.
Kort: door meer overzicht ontstaat meet inzicht.
Kansrekening = opstellen ve theoretische redenering met als doel zo effectief mogelijk om te
gaan met onzekerheden en binnen een dergelijke omgeving toch
gefundeerde keuzes te kunnen maken gebaseerd op veronderstellingen
waarvan we aannemen dat ze bij de werkelijkheid aansluiten. Het is een brug
tussen de beschrijvende en de inductieve statistiek.
Inductieve (beslissende) statistiek = nagegaan in hoeverre kenmerken ve steekproef
kenmerken vd populatie zijn op basis vd resultaten
wordt door schatten en toetsen tot een algemene
uitspraak gekomen over het onderzochte verschijnsel.
Gegevens verzamelen
Doel statistisch onderzoek in de praktijk = het nemen van beslissingen of doen van
voorspellingen met betrekking tot een populatie op basis van info in een steekproef.
Populatie = verzameling van alle te bestuderen objecten
Steekproef = deelverzameling vd populatie waarop waarnemingen verricht worden.
Omvang = aantal elementen in de steekproef.
Variabelen = kenmerken die bij de elementen vd populatie onderzocht worden.
Datamatrix = verzamelde gegevens
Statistische gevolgtrekking = schatting, voorspelling, besluit op basis vd gemaakte
waarnemingen door de ganse populatie.
Betrouwbaarheidsmaat = mate van onzekerheid
Steekproef en populatie
Manier waarop gegevens verzameld worden = afhankelijk vh soort onderzoek.
enquête: gebruik maken ve vragenformulier, antwoorden worden geregistreerd.
observatieonderzoek: onderzoeker observeert de experimentele eenheden in hun d.
d. natuurlijke omgeving en hij registreert de relevante variabele
experiment: onderzoeker legt handeling op aan de te onderzoeken eenheden. Voordeel:
d onderzoeker creëert zelf een # condities er kunnen betere resultaten verkregen c. c.
c. worden.
Operationeel gedefinieerd: het moet duidelijk zijn wie of wat er onderzocht moet worden.
Steekproefkader: administratieve weergave ve populatie moet perfect overeenkomen
met populatie.
steekproefkader te klein: bepaalde elementen hebben geen enkele kans om deel uit te
maken vd stekproef.
steekproefkader te groot: er komen elementen in de steekproef terecht die helemaal niet
in de populatie zitten.
,Een steekproef is dus niet altijd representatief voor een hele populatie.
Een representatieve steekproef = aselect alle elementen in de steekproef hebben gelijke
kans om voor te komen.
Onzuivere steekproef bepaalde elementen hebben meer kans om voor te komen.
Randomisatie = methode voor het trekken ve aselecte steekproef de elementen worden
willekeurig geloot.
Een steekproef moet ook betrouwbaar zijn bij herhaling vd steekproeftrekking wordt
globaal gezien dezelfde resultaten verkregen. Het wordt bepaald door de omvang vd
steekproef en de variabiliteit vd onderzochte eigenschap. Hoe groter de omvang vd
steekproef hoe betrouwbaarder deze zal zijn.
Variabelen
Kwantitatieve variabelen = numerieke waarden
Discrete variabelen = eindig of aftelbaar oneindig aantal verschillende waarden
het aantal ogen ve worp met een dobbelsteen. Het kan slechts een bepaald #
waarden aannemen 1, 2, 3, 4, 5, 6
Continue variabelen = de waarden liggen in een interval tijd, afstand, gewicht
er wordt gewerkt met afgeronde getallen, maar het kunnen kommagetallen zijn.
Kwalitatieve variabelen = geen numerieke waarden
Nominale schaal = variabele heeft geen logische volgorde kleur, merknaam. Er
kunne geen rekenkundige bewerkingen uitgevoerd worden.
Ordinale schaal = wel een logische volgorde classificatie van restaurant in de
Michelingids het # toegekende sterren kan beschouwd worden als een ordinale
schaal. Er kunnen ook hier geen rekenkundige bewerkingen uitgevoerd worden.
Intervalschaal = het verschil tussen twee uitkomsten heeft een éénduidige betekenis. Het
heeft echter geen natuurlijk nulpunt. Voorbeeld: tijd. 0 uur is zelf gekozen. Je kan zeggen dat
van 3 tot 5 even lang duurt als van 19 tot 21 uur. Maar je kan niet zeggen dat het om 4 uur
twee keer zo laat is als om 2 uur. Rekenkundige bewerkingen zijn zinvol.
Ratioschaal = heeft wel een natuurlijk nulpunt maandloon, wachttijd in een wachtzaal,
temperatuur. Rekenkundige bewerkingen zijn zinvol.
Gegevens verwerken
Frequentieverdeling
Frequentietabel beschrijft waarnemingen over 1 variabele
Contingentietabel/kruistabel beschrijft waarnemingen van meerdere variabelen.
Grafische voorstelling
Geschikte keuze is afhankelijk vh # variabelen en vh meetniveau vd variabelen:
- Pictogram: tekeningetjes gebruiken om grootte vd waargenomen
uitkomsten weer te geven.
1
, - Cirkeldiagram: variabelen waarbij totaal onderverdeeld wordt in disjuncte
deelverzamelingen. Opp. van elke sector komt overeen met het
voorkomen van deze waarneming.
- Staafdiagram, kolomdiagram: vereenvoudigde manier om gegevens te presenteren
lengte staaf of kolom komt met gemeten getal overeen.
- Naalddiagram: verwant aan het staafdiagram lengte lijnstuk = gemeten
aantallen. Sluit aan bij begrip kansfunctie voor discrete variabelen
- Stapeldiagram: weergave vd uitkomsten ve contingentietabel totale
hoeveelheid waarnemingen = in # groepen onderverdeeld.
- Pareto-diagram: staafdiagram vd frequentie met balken gesorteerd op
afnemende hoogte van L naar R op de horizontale as. Gegevens zijn niet
numeriek geen inherente numerieke rangorde.
- Spreidingsgrafiek: om het verband tussen 2 variabelen te zoeken
gegevens worden als x-waarde geregistreerd en krijgen een bijhorende y-
waarde.
- Grafiek met tijd-as: geeft een evolutie in de tijd vd
waarnemingen weer.
Stamdiagram
Tussenvorm van tabellen en grafische voorstellingen een middel om tegelijk rangorde en
vorm te laten zien en er is geen verlies aan specifieke info. Stappenplan:
1) Stam wordt gemaakt belangrijkste cijfers van elk gegeven
worden in de goede volgorde links ve verticale lijn geplaatst.
2) Rechts vd verticale lijn en op de tegel die klopt met de eerste
cijfers vh gegeven (=bladeren) wordt nu laatste cijfer van elk
gegeven genoteerd.
3) De scores worden doorlopen in de volgorde dat ze staan
4) De stam mag uit meer dan 1 cijfer bestaan, het blad slechts uit 1
5) Gegevens zijn nu geordend cijfers op elke regel in volgorde plaatsen.
Het verwerken van gegevens gemeten op kwalitatief meetniveau
Frequentietabel
Eerste kolom: de verschillende waarnemingen
Tweede kolom: absolute frequentie # keer dat een bepaalde waarneming voorkomt.
Derde kolom: relatieve frequentie procentuele frequentie, # keer dat bepaalde
waarneming voor komt gedeeld door het totaal # waarnemingen
2
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Rubyrups. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,49. Je zit daarna nergens aan vast.