100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting statistiek II (cursus + lessen) €9,49   In winkelwagen

Samenvatting

Samenvatting statistiek II (cursus + lessen)

 18 keer bekeken  1 keer verkocht

Het document omvat alle leerstof samen gestoken in één document, inclusief de leerstof in de lessen als in de cursus. Ik behaalde 17/20 a.d.h.v. deze samenvatting.

Voorbeeld 4 van de 183  pagina's

  • 4 juli 2024
  • 183
  • 2023/2024
  • Samenvatting
Alle documenten voor dit vak (1)
avatar-seller
miekegovaert
STATISTIEK II

INTRODUCTIE R EN RSTUDIO


GEBRUIKSAANWIJZINGEN
R-code: de instructies in het lichtblauwe kader

- Met een # - symbool kun je de R-code wat commentaar voorzien: alle code die na het # - symbool
staat wordt genegeerd door R




R-output: het resultaat in het console (roos) van RStudio




WAT IS R?
- R is een hulpmiddel bij onderzoek, het dient om grote berekeningen bij onderzoeken makkelijker te
maken
- R is een programmeertaal: je zult in R instructies moeten typen die je computer opdragen iets met
de data te doen, dit zal in programmeertaal moeten
o We gebruiken stukjes ‘code’: een zinnetje in de programmeertaal R om berekeningen te
laten uitvoeren

R-studio: het is een computerprogramma dat het werken met R een stuk makkelijker en aangenamer maakt


INSTRUCTIES GEVEN IN R
Aan de linkerkant heb je de console: het hart van R, de plaats waar je commando’s worden geïnterpreteerd
en waar je het antwoord van R of de output zal zien

- Script open je op het wit-groene plusje links boven: de code die je in het script plaatst, kan je nu
makkelijk laten uitvoeren door de console
o Een script is een tekstbestand met R commando’s


DATA IN R
- <- : toekenningsoperator
- Nominale variabelen: tussen aanhalingstekens
- C (…,…,..): om opsomming te maken
- Vector = variabele
- Het dataframe (data.frame()) is een grotere structuur die meerdere vectoren bevat. Met het
symbool $ kan je de afzonderlijke vectoren in het dataframe oproepen
o mijn_df [2,3] : met die code selecteer je het element op de tweede rij, uit de derde kolom
- Punten gebruiken voor komma’s

,JE WERK OPSLAAN
- Een script opslaan: blauw icoontje of ctrl + s
- Een data frame opslaan: write.csv()
o Waar is dat opgeslagen? Dat kan je achterhalen met de functie getwd()
o De working directory is een locatie op je computer die in verbinding staat met R Studio
o Wanneer je de working directory wil veranderen moet je klikken op Session, dan Set
Working Directory en choose direction
o Als je later opnieuw het script opent in R, dan zal de working directory opnieuw veranderd
zijn naar de oude, automatisch gekozen map => je kan dit aanpassen met de functie
setwd()


DATA IMPORTEREN
In R bestaat een handige functie om zo’n csv-bestand in te laden: read.csv()

- Om de data te inspecteren kan je de functies head() en str() gebruiken


PACKAGES
Eén van de mooie aspecten van R is dat iedereen nieuwe functies kan maken en die beschikbaar kan stellen
voor alle gebruikers wereldwijd. Die extra functies worden gebundeld in zogenaamde packages.

- Om nieuwe packages te kunnen gebruiken moet je maar twee functies onthouden:
o install.packages() moet je éénmalig uitvoeren
o library() moet je uitvoeren elke keer wanneer je de functies uit een package wil gebruiken

HOOFDSTUK 0: PROLEGMENA


STATISTIEK, PSYCHOMETRIE EN METHODOLOGIE
Een onderzoeker wenst een of meerdere onderzoeksvragen m.b.t. een bepaalde populatie te
beantwoorden:

- Methodologie: het is de taak van de methodologie om te bepalen hoe de steekproef samengesteld
wordt en welk soort van onderzoeksdesign het meest geschikt is om een antwoord te bieden op de
onderzoeksvragen
o Onderzoeksdesign: bv.
▪ observationeel onderzoek (inclusief vragenlijsten)
▪ experimenteel onderzoek.
o Steekproeftrekking
- Psychometrie: het is de taak van de psychometrie om te bepalen hoe de variabelen het best
worden gemeten
- Statistiek (beschrijvend of inductief): eenmaal data verzameld is het de taak van de statistiek de
data te analyseren om de onderzoeksvraag te beantwoorden.
o Beschrijvende statistiek: verzameling van technieken om de gegevens in een steekproef
te beschrijven, te ordenen, te visualiseren en samen te vatten.
o Inductieve statistiek: verzameling van technieken om observaties (op het niveau van de
steekproef) te veralgemenen naar de populatie.

,VARIABELEN
Variabele : een eigenschap die bij de elementen van de populatie of van de steekproef varieert.

- Kan numeriek zijn of niet => keuze van de onderzoeker: bijv. hij kan….
o Het geslacht coderen als man/vrouw of als 0/1.
o Sociabiliteit coderen als asociaal/sociaal/zeer sociaal of gebruik maken van een
vragenlijst met numerieke scores.
o Gezinsgrootte coderen als 1, 2, 3, ...of klein/groot
- Kan continu of discreet zijn:
o Continu: tussen elke twee willekeurige waarden ligt een derde waarde.
o Discreet: niet continu.
o Er bestaan verschillende technieken voor continue en discrete variabelen.
▪ Discrete variabelen met veel mogelijke waarden worden op dezelfde manier
geanalyseerd als continue
- Notatie variabele: aangeduid met hoofdletter. Bv. X of Y .
- Waarnemingen/scores/waarden: aangeduid met overeenkomende kleine letter. Bv. 𝑥 of 𝑦
- Successieve waarnemingen van X in een steekproef aangeduid door 𝑥1 , 𝑥2, . ., 𝑥𝑛 waar n de
steekproefgrootte is


MEETNIVEAUS (5)


Absolute schaal - De variabele wordt gemeten door gewoon objecten (of mensen) te tellen.
- Bv. gezinsgrootte, klasgrootte, aantal inwoners, enz.
- De meeteenheid is vast. Het nulpunt is vast.
- De variabele is discreet.

Ratioschaal - Eerst meeteenheid kiezen.
- Dan aantal meeteenheden tellen tussen het te meten object en het vaste
nulpunt.
- Bv. leeftijd, reactietijd, lengte, gewicht, oppervlakte, polsslag,
concentratie aan cortisol, enz.
- De variabele is continu.

Intervalschaal - Eerst meeteenheid en referentiepunt kiezen.
- Dan aantal meeteenheden tellen tussen het te meten object en het
referentiepunt.
- Bv. temperatuur of datum.
- De variabele is continu.

Ordinale schaal - Je kan de te meten objecten ordenen, maar je kan geen meeteenheid
definiëren.
- De waarde van de variabele bij een object is gewoon zijn plaats of
rangnummer in de ordening.
- Bv. uitslag van een wielwedstrijd, mate van instemming met een bepaalde
uitspraak (Likert schaal).
- De variabele kan continu of discreet zijn

Nominale schaal - De te meten objecten kunnen niet geordend worden.
- bv. postcode, haarkleur, geslacht, enz.
- De variabele is noch discreet noch continu: we kunnen dit namelijk niet
bepalen aangezien je om vast te stellen of een variabele discreet of
continu is je twee willekeurige waarden moet kunnen kiezen en nagaan of

, er waarden tussen liggen, dit is onmogelijk omdat we de objecten niet
kunnen ordenen
- Dichotome variabele: twee mogelijke waarden
o 0-1 variabele: de twee mogelijke waarden zijn 0 en 1.

Meetniveaus in de praktijk:

- Interval- en ratiomeetniveau hebben identieke statistische technieken.
o Veel onderzoekers groeperen die twee meetniveaus onder de noemer continue
variabelen.
o Niet 100% correct omdat ordinale variabelen ook continu kunnen zijn, maar in de praktijk
is dit OK
- Er zijn specifieke statistische analyses voor variabelen van nominaal, ordinaal en absoluut
meetniveau.
- Nominale en ordinale variabelen worden soms gegroepeerd onder de noemer categorische
variabelen


ZINVOLHEID (VAN EEN BEWERING):
Een bewering of uitspraak is zinvol indien haar waarheidswaarde onafhankelijk is van de meetschaal die je
gebruikt (dus indien een bewering correct is met een bepaalde schaal blijft ze correct met een andere
schaal)

- Vb. Gemiddelde leeftijd in groep A is groter dan in groep B.
o Stel dat deze bewering juist is wanneer we de leeftijd in jaar uitdrukken, dan is ze ook
correct als we de leeftijd in maanden, eeuwen of seconden uitdrukken: zinvol
- Vb. Gemiddelde temperatuur in Gent in Februari (6◦C) is dubbel zo groot als in Kopenhagen (3◦C).
o Juist in Celsius graden => fout in Fahrenheit graden (42.8◦F= 2 ×37.4◦F): zinloos
- Vb. Gemiddelde score op de Likert schaal “intrinsieke motivatie” (een schaal met 5 niveaus) is
groter in groep 1 dan in groep 2.
o Juist met codering 1, 2, 3, 4 en 5 => fout met codering 0, 2, 3, 4 en 6: zinloos

Om zinloze beweringen te vermijden moet je voorzichtig zijn bij het manipuleren van scores:

- Bij nominale en ordinale variabelen mag je de scores niet +, −, ×, / doen van elkaar
o Dus geen gemiddelde, variantie, covariantie, correlatie, enz.
- Bij variabelen van het intervalmeetniveau: + en − zijn OK. Andere operaties niet.
o Logaritmes van scores zijn verboden: vermenigvuldigen, delen, machten,…
o Afwijkingen (bv. 𝑥1 − 𝑥2 of 𝑥1 − 𝑥̅ ): mag je wel met elkaar vermenigvuldigen of door elkaar
delen, daarnaast mag je ook logaritme van een afwijking berekenen
- Ratiomeetniveau: bijna geen restricties.
- Absoluut meetniveau: geen restrictie.

HOOFDSTUK 1: DATA MANIPULATIE

Drie softwarepakketten: R (RStudio is een implementatie van de R programmeertaal), SPSS en Excel


DE DATA IN R
- Een vector aanmaken met de functie c:

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

√  	Verzekerd van kwaliteit door reviews

√ Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper miekegovaert. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €9,49. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 81311 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€9,49  1x  verkocht
  • (0)
  Kopen