Samenvatting Statistiek I voor de sociale wetenschappen (lessen + notities)
2 views 0 purchase
Course
Statistiek I voor de sociale wetenschappen
Institution
Vrije Universiteit Brussel (VUB)
Deze samenvatting van Statistiek I is een volledige en goede samenvatting. Ik heb mijn samenvatting 2x gestudeerd en ik was er ruimschoots door! De theorie staat volledig en overzichtelijk uitgetypt met een inhoudstafel erbij. Hierdoor kan je je makkelijk navigeren doorheen de samenvatting. SUCCES!
1.1 WAT IS STATISTIEK:.......................................................................................................................3
1.2 WAAROM STATISTIEK:....................................................................................................................3
1.3 SOORTEN STATISTIEK:.....................................................................................................................3
1.3 BORING:.....................................................................................................................................4
1.4 MISLEIDENDE STATISTIEK:................................................................................................................4
1.5 OORSPRONG:...............................................................................................................................5
1.6 SAMENLEVING ZONDER CIJFERS:........................................................................................................5
1.7 CIJFERSYMBOLEN: HOE ONTSTAAN:....................................................................................................5
1.8 HUIDIG CIJFERSYSTEEM: HINDU-ARABISCHE SYSTEEM:...........................................................................6
1.9 BELANG NIEUWE CIJFERSYMBOLEN:....................................................................................................6
2. METEN EN MEETSCHALEN:............................................................................................................6
2.1 TERMINOLOGIE EN KERNBEGRIPPEN:..................................................................................................6
2.2 WAAROM METEN:.........................................................................................................................7
2.3 WAT IS METEN:............................................................................................................................7
2.4 EIGENSCHAPPEN VAN VARIABELEN:....................................................................................................9
3. FREQUENTIEVERDELINGEN EN GRAFISCHE VOORSTELLINGEN:.....................................................9
3.1 INLEIDING:...................................................................................................................................9
3.2 FREQUENTIEVERDELINGEN/-TABELLEN EN GRAFIEKEN: WAAROM:............................................................10
3.3 DEFINITIES EN NOTATIE:................................................................................................................10
3.4 WAAROM GRAFIEKEN:..................................................................................................................10
3.5 FREQUENTIEVERDELING EN GRAFISCHE VOORSTELLING: NOMINALE SCHALEN:.............................................11
3.6 FREQUENTIEVERDELING EN GRAFISCHE VOORSTELLING: ORDINALE SCHALEN:..............................................11
3.7 FREQUENTIEVERDELING EN GRAFISCHE VOORSTELLING: INTERVAL- EN RATIOSCHALEN:..................................12
3.8 FREQUENTIEVERDELING EN GRAFISCHE VOORSTELLING: SYNTHESE:...........................................................14
4.1 WAAROM STATISTISCHE MATEN:.....................................................................................................14
4.2.1 STATISTISCHE MATEN VAN LIGGING (VAN POSITIE):.................................................................................14
4.2.1.1 statistische maten van centrale tendens of centrummaten:...................................................15
4.2.1.2 Soorten:...................................................................................................................................15
4.2.2 STATISTISCHE MATEN VAN SPREIDING:.................................................................................................18
4.2.2.1 Variatiebreedte of range:.........................................................................................................19
4.2.2.2 Interkwartielafstand:...............................................................................................................19
4.2.2.3 Interdecielafstand:...................................................................................................................19
4.2.2.4 Boxplot:....................................................................................................................................19
4.2.2.5 Spreiding:.................................................................................................................................20
4.2.2.6 Centraal moment van rang 1:..................................................................................................20
4.2.2.7 Gemiddelde absolute afwijking:..............................................................................................20
4.2.2.8 Variatie: sum of squares:.........................................................................................................20
1
,4.2.2.9 Variantie:.................................................................................................................................21
4.2.2.10 Standaardafwijking:...............................................................................................................21
4.2.2.11 Variatiecoëfficiënt:.................................................................................................................21
4.2.3 STATISTISCHE MATEN VAN VORM:.......................................................................................................23
4.2.3.1 Maten voor symmetrie v/e verdeling:.....................................................................................23
4.2.3.2 Maten voor afplatting v/e verdeling:.......................................................................................25
5. TWEEDIMENSIONALE WAARGENOMEN REEKSEN: (TIP: STUDEER UIT WEC)...............................26
5.1 INLEIDING: SAMENHANG:..............................................................................................................26
5.2 SAMENHANG TUSSEN 2 CATEGORISCHE VARIABELEN:...........................................................................27
5.2.1 TWEEDIMENSIONALE KRUISTABEL AARD EN RICHTING V/E RELATIE:............................................................28
5.2.2 SIGNIFICANTIETOETSING BIJ KRUISTABELLEN: CHI-KWADRAAT:..................................................................28
5.2.3 STERKTE V/D SAMENHANG: ASSOCIATIEMATEN:.....................................................................................29
5.3 SAMENHANG TUSSEN TWEE KWANTITATIEVE VARIABELEN:....................................................................31
2
,1. Inleiding statistiek:
Statistiek in het dagelijkse leven:
Sport
Streaming platformen
Gezondheidszorg
Onderwijs
Meteorologie
Reizen en navigatie
1.1 Wat is statistiek:
Statistiek= kunst v/h leren omgaan met data/gegevens (gegevens vertalen in kennis en inzicht)
Gegevens synthetiseren, analyseren, interpreteren en presenteren à empirisch onderzoek
Statistiek als wetenschappelijke discipline
Kennismethode om wereld beter te kennen/begrijpen
Verschillende databronnen:
Administratieve data/ registerdata (=data die gekoppeld zijn aan je rijksregisternr)
Surveygegevens (= onderzoeek waarbij aantal mensen vragen wordt gesteld)
Big data (=alles wat geregistreerd wordt zonder dat we het goed beseffen en via
commerciële bureaus worden doorverkocht)
Empirisch onderzoek:
Statistiek als werktuig, instrument, methode
Kijken naar gegevens en verdelingen:
- Weergeven op manier om beter te begrijpen: grafisch, kerngetallen
- Onderzoeken/vergelijken van verdelingen
1.2 Waarom statistiek:
Om beweringen te staven (check):
Nood aan empirie (data/gegevens)
Data verzamelen volgens regels van kunst à onderzoeksmethoden
Data analyseren volgens regels van kunst à statistiek
Als we empirisch onderzoek willen doen om antwoord te bieden op een vraagstelling dan
dienen we data te verzamelen/analyseren
Fasen in Sociaal wetenschappelijk onderzoek:
Probleemstelling: vergt substantiële kennis van vakgebied
Onderzoeksontwerp/dataverzameling: welke onderzoeksmethoden in functie van
probleem- en vraagstelling
Data-analyse: beschrijvende statistiek, inductieve stat,..
Rapportering: interpreteren, refereren, opzoeken,..
1.3 Soorten statistiek:
Soorten:
1. Beschrijvende statistiek:
= Wereld in cijfers beschrijven:
3
, Basis: frequentievragen
Samenvatten in “kerngetallen”
Gebruik van grafische technieken
Ordenen/synthetiseren van (een grote hoeveelheid) gegevens
Herleiden tot:
Samenvattende maten (VB: percentages, mediaan, kwantielen, gemiddelde,
standaardafwijking, correlatiecoëfficiënt)
Grafieken
2. Inferentiële statistiek:
= Middel om met bep aantal gegevens uitspraken te doen over breder geheel (generaliseren
of extrapoleren), over een volledige populatie
Extrapolatie= uitspraken over de volledige bevolking o.b.v. een steekproef uit die
bevolking (VB: veiligheidsmonitor)
Veralgemeenbaarheid steekproefresulktaten
Voorspellingen obv steekproef à kansen op fouten
3. Statistische analyse:
= Gericht op verklaring van verschillen/samenhang (obv bivariate regressie, multivariate
regressie,.. (zie VB dia 38)
1.3 Boring:
NEEN
Hans Rosling= zweedse dokter, ‘statisticus’, professor,.. die bezig is met
gezondheidststatistieken adhv high tech toestanden (vurige pleiter voor stat) (ontwikkelaar
van gapminder)
Gapminder= organisatie die misvattingen over mondiale ontwikkelingen wil tegengaan obv data
1.4 Misleidende statistiek:
“There are 3 kinds of lies: Lies, damn lies and statistics
Kernidee:
Cijfers zijn misleidend
Vaak gebruikt/misbruikt om zwakke/foute argumenten te ondersteunen
Uitkomsten v/e onderzoek kunnen gemanipuleerd worden bij:
Verzamelen van gegevens
Presentatie van uitkomsten
Omschrijven van conclusies
Misleiding bij verzamelen gegevens:
Slechte selectie van onderzoekspersonen, niet representatief voor bevolking die je wil
onderzoeken (probleem bij online surveys verspreid via sm)
Te klein aantal onderzochte personen
Slechte vraagstelling
Slechte operationalisatie/vergelijking van twee ≠ operationalisaties
Misleiding bij presentatie van gegevens:
Deel van grafiek verwijderen
Schaal manipuleren
Grafische aanpassing (zoals bij pistools)
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller liowillems. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $10.37. You're not tied to anything after your purchase.