100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting statistiek II (cursus + lessen) $10.63   Add to cart

Summary

Samenvatting statistiek II (cursus + lessen)

 18 views  1 purchase
  • Course
  • Institution

Het document omvat alle leerstof samen gestoken in één document, inclusief de leerstof in de lessen als in de cursus. Ik behaalde 17/20 a.d.h.v. deze samenvatting.

Preview 4 out of 183  pages

  • July 4, 2024
  • 183
  • 2023/2024
  • Summary
avatar-seller
STATISTIEK II

INTRODUCTIE R EN RSTUDIO


GEBRUIKSAANWIJZINGEN
R-code: de instructies in het lichtblauwe kader

- Met een # - symbool kun je de R-code wat commentaar voorzien: alle code die na het # - symbool
staat wordt genegeerd door R




R-output: het resultaat in het console (roos) van RStudio




WAT IS R?
- R is een hulpmiddel bij onderzoek, het dient om grote berekeningen bij onderzoeken makkelijker te
maken
- R is een programmeertaal: je zult in R instructies moeten typen die je computer opdragen iets met
de data te doen, dit zal in programmeertaal moeten
o We gebruiken stukjes ‘code’: een zinnetje in de programmeertaal R om berekeningen te
laten uitvoeren

R-studio: het is een computerprogramma dat het werken met R een stuk makkelijker en aangenamer maakt


INSTRUCTIES GEVEN IN R
Aan de linkerkant heb je de console: het hart van R, de plaats waar je commando’s worden geïnterpreteerd
en waar je het antwoord van R of de output zal zien

- Script open je op het wit-groene plusje links boven: de code die je in het script plaatst, kan je nu
makkelijk laten uitvoeren door de console
o Een script is een tekstbestand met R commando’s


DATA IN R
- <- : toekenningsoperator
- Nominale variabelen: tussen aanhalingstekens
- C (…,…,..): om opsomming te maken
- Vector = variabele
- Het dataframe (data.frame()) is een grotere structuur die meerdere vectoren bevat. Met het
symbool $ kan je de afzonderlijke vectoren in het dataframe oproepen
o mijn_df [2,3] : met die code selecteer je het element op de tweede rij, uit de derde kolom
- Punten gebruiken voor komma’s

,JE WERK OPSLAAN
- Een script opslaan: blauw icoontje of ctrl + s
- Een data frame opslaan: write.csv()
o Waar is dat opgeslagen? Dat kan je achterhalen met de functie getwd()
o De working directory is een locatie op je computer die in verbinding staat met R Studio
o Wanneer je de working directory wil veranderen moet je klikken op Session, dan Set
Working Directory en choose direction
o Als je later opnieuw het script opent in R, dan zal de working directory opnieuw veranderd
zijn naar de oude, automatisch gekozen map => je kan dit aanpassen met de functie
setwd()


DATA IMPORTEREN
In R bestaat een handige functie om zo’n csv-bestand in te laden: read.csv()

- Om de data te inspecteren kan je de functies head() en str() gebruiken


PACKAGES
Eén van de mooie aspecten van R is dat iedereen nieuwe functies kan maken en die beschikbaar kan stellen
voor alle gebruikers wereldwijd. Die extra functies worden gebundeld in zogenaamde packages.

- Om nieuwe packages te kunnen gebruiken moet je maar twee functies onthouden:
o install.packages() moet je éénmalig uitvoeren
o library() moet je uitvoeren elke keer wanneer je de functies uit een package wil gebruiken

HOOFDSTUK 0: PROLEGMENA


STATISTIEK, PSYCHOMETRIE EN METHODOLOGIE
Een onderzoeker wenst een of meerdere onderzoeksvragen m.b.t. een bepaalde populatie te
beantwoorden:

- Methodologie: het is de taak van de methodologie om te bepalen hoe de steekproef samengesteld
wordt en welk soort van onderzoeksdesign het meest geschikt is om een antwoord te bieden op de
onderzoeksvragen
o Onderzoeksdesign: bv.
▪ observationeel onderzoek (inclusief vragenlijsten)
▪ experimenteel onderzoek.
o Steekproeftrekking
- Psychometrie: het is de taak van de psychometrie om te bepalen hoe de variabelen het best
worden gemeten
- Statistiek (beschrijvend of inductief): eenmaal data verzameld is het de taak van de statistiek de
data te analyseren om de onderzoeksvraag te beantwoorden.
o Beschrijvende statistiek: verzameling van technieken om de gegevens in een steekproef
te beschrijven, te ordenen, te visualiseren en samen te vatten.
o Inductieve statistiek: verzameling van technieken om observaties (op het niveau van de
steekproef) te veralgemenen naar de populatie.

,VARIABELEN
Variabele : een eigenschap die bij de elementen van de populatie of van de steekproef varieert.

- Kan numeriek zijn of niet => keuze van de onderzoeker: bijv. hij kan….
o Het geslacht coderen als man/vrouw of als 0/1.
o Sociabiliteit coderen als asociaal/sociaal/zeer sociaal of gebruik maken van een
vragenlijst met numerieke scores.
o Gezinsgrootte coderen als 1, 2, 3, ...of klein/groot
- Kan continu of discreet zijn:
o Continu: tussen elke twee willekeurige waarden ligt een derde waarde.
o Discreet: niet continu.
o Er bestaan verschillende technieken voor continue en discrete variabelen.
▪ Discrete variabelen met veel mogelijke waarden worden op dezelfde manier
geanalyseerd als continue
- Notatie variabele: aangeduid met hoofdletter. Bv. X of Y .
- Waarnemingen/scores/waarden: aangeduid met overeenkomende kleine letter. Bv. 𝑥 of 𝑦
- Successieve waarnemingen van X in een steekproef aangeduid door 𝑥1 , 𝑥2, . ., 𝑥𝑛 waar n de
steekproefgrootte is


MEETNIVEAUS (5)


Absolute schaal - De variabele wordt gemeten door gewoon objecten (of mensen) te tellen.
- Bv. gezinsgrootte, klasgrootte, aantal inwoners, enz.
- De meeteenheid is vast. Het nulpunt is vast.
- De variabele is discreet.

Ratioschaal - Eerst meeteenheid kiezen.
- Dan aantal meeteenheden tellen tussen het te meten object en het vaste
nulpunt.
- Bv. leeftijd, reactietijd, lengte, gewicht, oppervlakte, polsslag,
concentratie aan cortisol, enz.
- De variabele is continu.

Intervalschaal - Eerst meeteenheid en referentiepunt kiezen.
- Dan aantal meeteenheden tellen tussen het te meten object en het
referentiepunt.
- Bv. temperatuur of datum.
- De variabele is continu.

Ordinale schaal - Je kan de te meten objecten ordenen, maar je kan geen meeteenheid
definiëren.
- De waarde van de variabele bij een object is gewoon zijn plaats of
rangnummer in de ordening.
- Bv. uitslag van een wielwedstrijd, mate van instemming met een bepaalde
uitspraak (Likert schaal).
- De variabele kan continu of discreet zijn

Nominale schaal - De te meten objecten kunnen niet geordend worden.
- bv. postcode, haarkleur, geslacht, enz.
- De variabele is noch discreet noch continu: we kunnen dit namelijk niet
bepalen aangezien je om vast te stellen of een variabele discreet of
continu is je twee willekeurige waarden moet kunnen kiezen en nagaan of

, er waarden tussen liggen, dit is onmogelijk omdat we de objecten niet
kunnen ordenen
- Dichotome variabele: twee mogelijke waarden
o 0-1 variabele: de twee mogelijke waarden zijn 0 en 1.

Meetniveaus in de praktijk:

- Interval- en ratiomeetniveau hebben identieke statistische technieken.
o Veel onderzoekers groeperen die twee meetniveaus onder de noemer continue
variabelen.
o Niet 100% correct omdat ordinale variabelen ook continu kunnen zijn, maar in de praktijk
is dit OK
- Er zijn specifieke statistische analyses voor variabelen van nominaal, ordinaal en absoluut
meetniveau.
- Nominale en ordinale variabelen worden soms gegroepeerd onder de noemer categorische
variabelen


ZINVOLHEID (VAN EEN BEWERING):
Een bewering of uitspraak is zinvol indien haar waarheidswaarde onafhankelijk is van de meetschaal die je
gebruikt (dus indien een bewering correct is met een bepaalde schaal blijft ze correct met een andere
schaal)

- Vb. Gemiddelde leeftijd in groep A is groter dan in groep B.
o Stel dat deze bewering juist is wanneer we de leeftijd in jaar uitdrukken, dan is ze ook
correct als we de leeftijd in maanden, eeuwen of seconden uitdrukken: zinvol
- Vb. Gemiddelde temperatuur in Gent in Februari (6◦C) is dubbel zo groot als in Kopenhagen (3◦C).
o Juist in Celsius graden => fout in Fahrenheit graden (42.8◦F= 2 ×37.4◦F): zinloos
- Vb. Gemiddelde score op de Likert schaal “intrinsieke motivatie” (een schaal met 5 niveaus) is
groter in groep 1 dan in groep 2.
o Juist met codering 1, 2, 3, 4 en 5 => fout met codering 0, 2, 3, 4 en 6: zinloos

Om zinloze beweringen te vermijden moet je voorzichtig zijn bij het manipuleren van scores:

- Bij nominale en ordinale variabelen mag je de scores niet +, −, ×, / doen van elkaar
o Dus geen gemiddelde, variantie, covariantie, correlatie, enz.
- Bij variabelen van het intervalmeetniveau: + en − zijn OK. Andere operaties niet.
o Logaritmes van scores zijn verboden: vermenigvuldigen, delen, machten,…
o Afwijkingen (bv. 𝑥1 − 𝑥2 of 𝑥1 − 𝑥̅ ): mag je wel met elkaar vermenigvuldigen of door elkaar
delen, daarnaast mag je ook logaritme van een afwijking berekenen
- Ratiomeetniveau: bijna geen restricties.
- Absoluut meetniveau: geen restrictie.

HOOFDSTUK 1: DATA MANIPULATIE

Drie softwarepakketten: R (RStudio is een implementatie van de R programmeertaal), SPSS en Excel


DE DATA IN R
- Een vector aanmaken met de functie c:

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller miekegovaert. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $10.63. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

81311 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$10.63  1x  sold
  • (0)
  Add to cart