1.1 Wat zijn data?
• Om data te begrijpen moeten we de context begrijpen à uitmaken of de data alfabetisch,
numeriek of alfanumeriek is.
• Gegevens zijn meetwaarden samen met hun context.
• Context van gegevens bepalen? 5W’s: à geeft betekenis
Wie wat (essentieel) à als we deze niet weten dan hebben we GEEN data
Wanneer, waar, waarom & hoe (meta-data: voor wat elke casus staat en de betekenis van alle
variabelen), meta data zijn belangrijk als je data niet zelf hebt verzameld
• Gegevenstabel: elke rij is een casus (wie) en elke kolom een variabele (wat). De variabele geeft
informatie over de casus
• Rijen worden records genoemd in een database
Namen van casussen
Enquête Respondenten
Experiment Subjecten/participant (dieren/zaken:
experimentele eenheid)
Casus Individu waarover we gegevens hebben
Gelijke term voor gegevenstabel is rekenblad/spreadsheet à goed voor kleine data sets maar niet voor
grote à relationele gegevensbank nodig (meerdere gegevenstabellen aan elkaar gelinkt, elke
gegevenstabel is een relatie bv. Klant en demografische gegevens, product met prijs en inventaris)
1.2 Soorten variabelen
• Kwalitatief/categorisch: de waarden zijn namen van categorieën bv. Naam & postnummer
(meestal 2 antwoorden: ja of nee “investeer je?”)
o Nominaal: geen orde, gewoon naam, enkel om categorieën te benoemen
o Ordinaal: er zit orde in (s-m-l)
o Indentificatievariabele: valt onder nominaal (studentnummer, gsm-nummer, social
security nummer), is cruciaal om gegevenstabellen in een relationele gegevensbank met
elkaar te linken
• Kwantitatief: waarden met numerieke hoeveelheid met eenheden bv. Prijs (vertellen schaal van
meeteenheid, dus we weten hoe ver 2 waarden van elkaar liggen)
• Opletten: leeftijd kan categorisch en kwantitatief zijn (leeftijdscategorie)
Dwarsdoorsnede: meerdere variabelen meten op hetzelfde tijdstip, op één punt in de tijd bv klanten
aandeel
Tijdreeks: een kwantitatieve variabele meten over verschillende tijdsintervallen op even grote afstand van
elkaar (maand, kwartaal, jaar) bv. winst
1.3 DATABRONNEN: WAAR, HOE EN WANNEER
• Hoe de data wordt verzameld is belangrijk
o data van een enquête op het internet is meestal waardeloos à niet representatief voor
grote groep
o experiment à variabelen manipuleren om te zien wat er gebeurt
o data die al verzameld is door iemand anders à opletten of dit representatief is
à bronnen vermelden
1
, 2. KWALITATIEVE GEGEVENS BESCHRIJVEN EN WEERGEVEN
Frequentietabel somt de categorieën op van een kwalitatieve variabele samen met het aantal
waarnemingen in elke categorie
2.2 Kwalitatieve/categorische variabele samenvatten
3 regels van data analysists: maak een “foto” van de data à alles wordt weergegeven in tabel (er kunnen
dingen worden waargenomen die je niet zonder frequentietabel zou zien) en is makkelijker om te plannen
en analyseren en rapporteren een goede tabel doet veel van het werk al. Om data te rapporteren moet je
een goede tabel hebben
Relatieve frequentie: fracties uitgedrukt t.o.v. totale aantal ( x100% voor percentage)
Oppervlakte principe respecteren! De oppervlakte van de staafjes moet proportioneel zijn aan de cijfers die
we willen weergeven à grafieken kunnen misleidend zijn wnr dit niet gerespecteerd is
• Staafdiagram: maken vergelijking duidelijker, staafjes moeten even breed zijn. Elke categorie is een
staafje. Er moet plaats zijn tussen de staafjes bij kwalitatieve gegevens om aan te tonen dat ze vrij
zijn en gerangschikt kunnen worden in elke volgorde. (naam van de variabele is vaak gebruikt als
tittel voor horizontale as)
• Relatieve frequentie staafdiagram: idem, aandacht gaat naar relatieve proportie
• Taartdiagram: toont aan hoe geheel verdeeld is in categorieën door sectoren van cirkel weer te
geven, goed om RF te vergelijken, anders verwarrend (categorieën mogen elkaar niet overlappen)
2.3 Twee kwalitatieve variabelen: kruistabel
Kruistabel geeft de frequenties weer voor elke combinatie van 2 of meer variabelen
Ö Marginale verdeling = verdeling van elke variabele afzonderlijk, in de marges van de tabel (geeft
totaal van elke rij/kolom), marginale verdeling is hetzelfde als frequentieverdeling
Ö Elke cel van kruistabel geeft waarden van 2 kwalitatieve variabelen weer
Ö Totaalpercentage rijppercentage, kolompercentage à voorwaardelijke verdeling
Voorwaardelijke verdeling: verdeling van variabele waarbij we “wie” beperken tot een kleinere groep (een
variabele) Wanneer de verdeling van één variabele hetzelfde is voor alle categorieën van een andere
variabele, noemen we deze twee variabelen onafhankelijk (er is geen associatie)
à Volledig onafhankelijk komt zelden voor
2.4 Gesegmenteerd staafdiagram en mozaïekdiagram
• Gesegmenteerd staafdiagram: geeft voorwaardelijke verdeling weer van kwalitatieve variabele
binnen elke categorie van andere variabele, elke staaf als het geheel gezien en wordt verdeeld in
segmenten
• Mozaïekdiagram: grafische weergave van kruistabel, idem als hierboven maar respecteert opp.
principe meer. Diagram is verdeeld in rechthoeken oppervlakte is proportioneel verdeeld met
aantal casussen.
2.5 Simpson’s paradox
= verschijnsel wnr gemiddelden/percentages worden berekend over verschillende groepen en de
groepsgemiddelden in tegenspraak zijn met globale gemiddelden. Men moet voorzichtig zijn en enkel
vergelijken tussen vergelijkbare metingen/variabelen (lees p61)
2
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper AV222. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €8,39. Je zit daarna nergens aan vast.