Statistiek I voor de bedrijfseconomische wetenschappen
All documents for this subject (6)
Seller
Follow
AV222
Reviews received
Content preview
1. GEGEVENS EN BESLISSINGEN
1.1 Wat zijn data?
• Om data te begrijpen moeten we de context begrijpen à uitmaken of de data alfabetisch,
numeriek of alfanumeriek is.
• Gegevens zijn meetwaarden samen met hun context.
• Context van gegevens bepalen? 5W’s: à geeft betekenis
Wie wat (essentieel) à als we deze niet weten dan hebben we GEEN data
Wanneer, waar, waarom & hoe (meta-data: voor wat elke casus staat en de betekenis van alle
variabelen), meta data zijn belangrijk als je data niet zelf hebt verzameld
• Gegevenstabel: elke rij is een casus (wie) en elke kolom een variabele (wat). De variabele geeft
informatie over de casus
• Rijen worden records genoemd in een database
Namen van casussen
Enquête Respondenten
Experiment Subjecten/participant (dieren/zaken:
experimentele eenheid)
Casus Individu waarover we gegevens hebben
Gelijke term voor gegevenstabel is rekenblad/spreadsheet à goed voor kleine data sets maar niet voor
grote à relationele gegevensbank nodig (meerdere gegevenstabellen aan elkaar gelinkt, elke
gegevenstabel is een relatie bv. Klant en demografische gegevens, product met prijs en inventaris)
1.2 Soorten variabelen
• Kwalitatief/categorisch: de waarden zijn namen van categorieën bv. Naam & postnummer
(meestal 2 antwoorden: ja of nee “investeer je?”)
o Nominaal: geen orde, gewoon naam, enkel om categorieën te benoemen
o Ordinaal: er zit orde in (s-m-l)
o Indentificatievariabele: valt onder nominaal (studentnummer, gsm-nummer, social
security nummer), is cruciaal om gegevenstabellen in een relationele gegevensbank met
elkaar te linken
• Kwantitatief: waarden met numerieke hoeveelheid met eenheden bv. Prijs (vertellen schaal van
meeteenheid, dus we weten hoe ver 2 waarden van elkaar liggen)
• Opletten: leeftijd kan categorisch en kwantitatief zijn (leeftijdscategorie)
Dwarsdoorsnede: meerdere variabelen meten op hetzelfde tijdstip, op één punt in de tijd bv klanten
aandeel
Tijdreeks: een kwantitatieve variabele meten over verschillende tijdsintervallen op even grote afstand van
elkaar (maand, kwartaal, jaar) bv. winst
1.3 DATABRONNEN: WAAR, HOE EN WANNEER
• Hoe de data wordt verzameld is belangrijk
o data van een enquête op het internet is meestal waardeloos à niet representatief voor
grote groep
o experiment à variabelen manipuleren om te zien wat er gebeurt
o data die al verzameld is door iemand anders à opletten of dit representatief is
à bronnen vermelden
1
, 2. KWALITATIEVE GEGEVENS BESCHRIJVEN EN WEERGEVEN
Frequentietabel somt de categorieën op van een kwalitatieve variabele samen met het aantal
waarnemingen in elke categorie
2.2 Kwalitatieve/categorische variabele samenvatten
3 regels van data analysists: maak een “foto” van de data à alles wordt weergegeven in tabel (er kunnen
dingen worden waargenomen die je niet zonder frequentietabel zou zien) en is makkelijker om te plannen
en analyseren en rapporteren een goede tabel doet veel van het werk al. Om data te rapporteren moet je
een goede tabel hebben
Relatieve frequentie: fracties uitgedrukt t.o.v. totale aantal ( x100% voor percentage)
Oppervlakte principe respecteren! De oppervlakte van de staafjes moet proportioneel zijn aan de cijfers die
we willen weergeven à grafieken kunnen misleidend zijn wnr dit niet gerespecteerd is
• Staafdiagram: maken vergelijking duidelijker, staafjes moeten even breed zijn. Elke categorie is een
staafje. Er moet plaats zijn tussen de staafjes bij kwalitatieve gegevens om aan te tonen dat ze vrij
zijn en gerangschikt kunnen worden in elke volgorde. (naam van de variabele is vaak gebruikt als
tittel voor horizontale as)
• Relatieve frequentie staafdiagram: idem, aandacht gaat naar relatieve proportie
• Taartdiagram: toont aan hoe geheel verdeeld is in categorieën door sectoren van cirkel weer te
geven, goed om RF te vergelijken, anders verwarrend (categorieën mogen elkaar niet overlappen)
2.3 Twee kwalitatieve variabelen: kruistabel
Kruistabel geeft de frequenties weer voor elke combinatie van 2 of meer variabelen
Ö Marginale verdeling = verdeling van elke variabele afzonderlijk, in de marges van de tabel (geeft
totaal van elke rij/kolom), marginale verdeling is hetzelfde als frequentieverdeling
Ö Elke cel van kruistabel geeft waarden van 2 kwalitatieve variabelen weer
Ö Totaalpercentage rijppercentage, kolompercentage à voorwaardelijke verdeling
Voorwaardelijke verdeling: verdeling van variabele waarbij we “wie” beperken tot een kleinere groep (een
variabele) Wanneer de verdeling van één variabele hetzelfde is voor alle categorieën van een andere
variabele, noemen we deze twee variabelen onafhankelijk (er is geen associatie)
à Volledig onafhankelijk komt zelden voor
2.4 Gesegmenteerd staafdiagram en mozaïekdiagram
• Gesegmenteerd staafdiagram: geeft voorwaardelijke verdeling weer van kwalitatieve variabele
binnen elke categorie van andere variabele, elke staaf als het geheel gezien en wordt verdeeld in
segmenten
• Mozaïekdiagram: grafische weergave van kruistabel, idem als hierboven maar respecteert opp.
principe meer. Diagram is verdeeld in rechthoeken oppervlakte is proportioneel verdeeld met
aantal casussen.
2.5 Simpson’s paradox
= verschijnsel wnr gemiddelden/percentages worden berekend over verschillende groepen en de
groepsgemiddelden in tegenspraak zijn met globale gemiddelden. Men moet voorzichtig zijn en enkel
vergelijken tussen vergelijkbare metingen/variabelen (lees p61)
2
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller AV222. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $9.00. You're not tied to anything after your purchase.