Met deze samenvatting haalde ik een 12 in tweede zit.
Aangeraden!!!: neem deze samenvatting mee naar de lessen! Zonder de bijhorende uitleg kan het nog steeds Chinees lijken, maar met de bijhorende uitleg van de prof, zou je alvast de theorie veel beter beet moeten hebben waardoor de oefeningen o...
De cursus vertrekt vanuit univariate, bivariate en multivariate statistiek. Het verschil tussen deze is vrij eenvoudig!
1. Univariate: we doen een analyse aan de hand van 1 kenmerk dat varieert. Belangrijk hierbij is om de verdeling
accuraat te beschrijven (centrum en spreidingsmaten) -> dit komt dus overeen met beschrijvende statistiek = gaat op
in haar datareductietechniek en kijkt hoe we data overzichtelijk kunnen presenteren. Gegevens wprden dus tot
categorieën terug gebracht.
2. Bivariate: hierbij bespreken we een verband tussen x en y. Het gaat hier om de samenhang tussen 2 kenmerken
3. Multivariate: we doen een analyse over meer dan twee kenmerken
1..1 basisconcepten
..
1) onderzoekspopulatie: dit is de verzameling van individuen waarover we een uitspraak
willen doen of de verzameling van onderzoekselementen
-een eenduidige definitie is van belang alsook het feit dat deze onderzoekspopulatie vaak
gebonden is aantijd en ruimte-> zo zal het onderzoek dat je kan uitvoeren afhangen van je
populatie. Dit is bv. Belangrijk voor je veralgemening
2)onderzoekselementen/ statische eenheden/ cases (deze termen slaan dus allemaal
op hetzelfde!) : dit zijn de eenheden aar we uitspraken over willen doen. Dit zijn
onderdelen van de realiteit waarop ons onderzoek betrekking heeft (inwoners van een
bepaald gebied, studenten/leerlingen van een school)
3) analyse-eenheid: de eenheid waarop de analyse gebeurt-> hierbij hebben we het dus
over bv. Een onderzoek dat gebeurt via kranten
4) kenmerk: een eigenschap van een element
5) variabele: dit zijn de kenmerken van de eenheden die varieren en die verschillende
scores kunnen hebben op een bepaald kenmerk.
6) de uitkomstenverzameling: alle mogelijke uitkomsten van een variabele
7) meten: volgens een bepaalde procedure vaststellen van de waarde van een kenmerk bij
een element. Hier ga je waarde toekennen aan de variabele
-> de eenheden waar je uitspreken over doet dienen bij voorkeur spreiding te vertonen ->
je wil immers de verschillen en de tendensen onderzoeken
-> iets wat niet varieert is een constante en kan je dus niet gebruiken voor statistisch
onderzoek —> belangrijk bij het meten!
1. Nauwkeurigheid/exactheid
2. Betrouwbaarheid
3. Validiteit= mate waarin de indicator/metingen en het theoretische
concept/fenomeen dat je wil onderzioeken, overeenkomen —> het gaat hier
dus om de mate van afwezigheid van systematische fouten
-> we moeten dus meten wat er gemeten moet worden voor ons onderzoek
, Hier deel ik al even het verschil mee tussen beschrijvende Hypothesen zijn specifieke stellingen betreffende de (causale)
en inductieve statistiek:
relatie tussen twee of meer concepten die afgeleid zijn uit
1. Beschrijvende: logischerwijs gaan we het hier hebben
over het categoriseren en het beschrijven van
een theorie -> je hebt 3 soorten hypothesen
gegevens. De wereld beschrijven en verklaren. We 1) een onderzoekshypothese: formuleert de stellingen in een
kunnen causaliteit niet vaststellen, wel kan je positieve zin en dus in de richting van de verwachtingen van de
samenhang vaststellen. Beschrijvende statistiek onderzoeker
wordt gezien als reductie van gegevens en is dus niet
2)een nulphypothese: dit is het omgekeerde van wat je
door iedereen geliefd.
verwacht. Dit is dus een hypothese met de verwachting dat er
2. Bij inductieve statistiek willen we gegevens
veralgemenen naar de onderzoekspopulatie. We helemaal geen verband bestaat. Wanneer we onze nulhypothese
vormen stellingen waaruit hypothesen voortvloeien. mogen verwerpen en er zo dus van uit mogen gaan dat er wel
we willen dus adhv gegevens uit de steekproef uitspraken degelijk een verband bestaat, dan gaat de alternatieve
doen over de gehele onderzoekspopulatie hypothese op.
Steekproefbasisconcepten
1. Steekproef= omvat een selectie van de eenheden uit onze steekproef
-> een steekproef is dus een deelverzameling van n uit de populatie
2. Steekproefgrootheid: dit zijn cijfers die we afleiden uit de steekproef (gemiddeldes, modus,…)
->dit cijfer op zich is minder belangrijk-> het gaat om wat we hieruit kunnen veralgemenen naar
de bevolking
3. Populatieparameter: een waarde die heel de populatie beschrijft
-> deze populatieparameter kunnen we beschrijven adhv van de steekproefgrootheden
2 soorten steekproeven (toeval/aselect en niet-toeval/select)
• toeval: zijn enkelvoudige aselecte steekproeftrekkingen (in de praktijk gebeurt dit niet vaak in
1 stap wegens praktische redenen bv. Afstand).
• Niet-toeval: zelfselectie of selecte steekproeven-> deze gegevens kan je niet veralgemenen
naar de bevolking!!! Je kan dus enkel iets zeggen over de mensen die geselecteerd zijn
binnen deze steekproef
Datamatrix als input voor statische analyse
-de gegevens die we verzameld hebben, gaan we omzetten in een datamatrix
-> deze gegevensset bevat info over elke eenheid die bestudeerd werd en heeft
betrekking op de kenmerken die varieren. Ze nemen dus verschillende waarden aan
-> simpelweg bevat deze gegevensset de gegevens die we verzameld hebben en
deze verschillen in waarden en werden bestudeerd op kenmerken die varieren ten
opzichte van elkaar
-> krijgt meermaals een r x k vorm (rijen maal kolommen)
-> daarnaast worden er ook vaak numerieke codes toegekend zoals in het
voorbeeld hiernaast. Hier krijgt elke man een 0 en elke vrouw een 1
, De verschillende meetniveaus
Hoe je iets meet, bepaalt het meetniveau! -> hoe hoger een niveau, hoe
meer analysetechnieken er mogelijk zijn. Er zijn dus meer opties voor het
meten van zaken op een hoger niveau dan op een lager niveau. We
proberen altijd alle kenmerken op een zo hoog mogelijk niveau te krijgen in
de mate dat dit inhoudelijk zinvol is.
• er zijn 4 meetniveaus
1. Nominaal: elkaar uitsluitende categorieën. Hier is de waarde enkel de
naam van de categorie (daarom spreekt men dus van categorische
1) nominaal Categorische variabelen gegevens). er is geen rangorde tussen de categorieën. Categoriseren
2) ordinaal Kwalitatieve variabelen doen we hier door zoveel mogelijk homogene karakteristieken bij
elkaar te brengen die zich differentiëren van de andere. We maken
3) interval Metrische variabelen hier geen veronderstelling over de relatie tussen de categorieën. Bv.
4)ratio Kwantitatieve variabelen Geslacht
-> soms is het moeilijk-> bv. Nationaliteit-> wat met mensen die meerdere
nationaliteiten bevatten? -> definitie van de categorie beter afbakenen!
-> Zorg voor exclusiviteit: de categorieën mogen elkaar niet overlappen
-er mag dus eigenlijk maar 1 criterium aan de basis van de categorie
liggen.
-> Zorg voor exhaustiviteit: elk geval moet in een categorie kunnen
worden onder gebracht!
2. Ordinaal: ordinaal staat voor de ordenbaarheid van de categorieën. Er
zijn dus steeds uitspraken mogelijk over meer of minder. Maar -> we
kunnen niet zeggen hoeveel meer of hoeveel minder! We spreken hier van
geordend categoriserend meten
3. Interval: niet alleen rangorde, maar ordening tussen de variabelen heef
een betekenis. Meest bekende voorbeeld is temperatuur-> de hoeveelheid
die zich bevindt tussen 5 en 10 graden, is dezelfde hoeveelheid die zich
bevindt tussen 10 en 15 graden. We kennen een betekenis toe aan de
Bij de volgende klassen:
21-25, 26-31 en 31-35
- afstanden tussen deze variabelen. Maar: er is geen nulpunt! Je kan dus nie
zeggen dat 20 graden dubbel zo warm is als 10 graden! Bij farhenheit is
Kan je zeggen dat het verschil tussen de klassen even groot is, er een ander nulpunt dan bij celcius. Ook leeftijdsgroepen en inkomens zij
maar je kan niet zeggen dat iemand uit de vierde klasse dubbel zo interval!-> enkel wanneer er voor zorgt dat de afstanden tussen de
oud is als uit de tweede klassen waarden altijd even groot zijn
4. Ratio: er is een absoluut nulpunt
aanwezig
Bv. Cm (iets dat 0 cm is, heeft geen lengte)
Niet laten verwarren door milimeter! -> het
gaat er om dat iets gemeten op een bepaald
kenmerk geen negatieve waarde kan
aannemen
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller ranibuyse. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $9.07. You're not tied to anything after your purchase.