Garantie de satisfaction à 100% Disponible immédiatement après paiement En ligne et en PDF Tu n'es attaché à rien
logo-home
Samenvatting statistiek II (cursus + lessen) €9,49   Ajouter au panier

Resume

Samenvatting statistiek II (cursus + lessen)

 19 vues  1 fois vendu

Het document omvat alle leerstof samen gestoken in één document, inclusief de leerstof in de lessen als in de cursus. Ik behaalde 17/20 a.d.h.v. deze samenvatting.

Aperçu 4 sur 183  pages

  • 4 juillet 2024
  • 183
  • 2023/2024
  • Resume
Tous les documents sur ce sujet (1)
avatar-seller
Studentjepedagogie
STATISTIEK II

INTRODUCTIE R EN RSTUDIO


GEBRUIKSAANWIJZINGEN
R-code: de instructies in het lichtblauwe kader

- Met een # - symbool kun je de R-code wat commentaar voorzien: alle code die na het # - symbool
staat wordt genegeerd door R




R-output: het resultaat in het console (roos) van RStudio




WAT IS R?
- R is een hulpmiddel bij onderzoek, het dient om grote berekeningen bij onderzoeken makkelijker te
maken
- R is een programmeertaal: je zult in R instructies moeten typen die je computer opdragen iets met
de data te doen, dit zal in programmeertaal moeten
o We gebruiken stukjes ‘code’: een zinnetje in de programmeertaal R om berekeningen te
laten uitvoeren

R-studio: het is een computerprogramma dat het werken met R een stuk makkelijker en aangenamer maakt


INSTRUCTIES GEVEN IN R
Aan de linkerkant heb je de console: het hart van R, de plaats waar je commando’s worden geïnterpreteerd
en waar je het antwoord van R of de output zal zien

- Script open je op het wit-groene plusje links boven: de code die je in het script plaatst, kan je nu
makkelijk laten uitvoeren door de console
o Een script is een tekstbestand met R commando’s


DATA IN R
- <- : toekenningsoperator
- Nominale variabelen: tussen aanhalingstekens
- C (…,…,..): om opsomming te maken
- Vector = variabele
- Het dataframe (data.frame()) is een grotere structuur die meerdere vectoren bevat. Met het
symbool $ kan je de afzonderlijke vectoren in het dataframe oproepen
o mijn_df [2,3] : met die code selecteer je het element op de tweede rij, uit de derde kolom
- Punten gebruiken voor komma’s

,JE WERK OPSLAAN
- Een script opslaan: blauw icoontje of ctrl + s
- Een data frame opslaan: write.csv()
o Waar is dat opgeslagen? Dat kan je achterhalen met de functie getwd()
o De working directory is een locatie op je computer die in verbinding staat met R Studio
o Wanneer je de working directory wil veranderen moet je klikken op Session, dan Set
Working Directory en choose direction
o Als je later opnieuw het script opent in R, dan zal de working directory opnieuw veranderd
zijn naar de oude, automatisch gekozen map => je kan dit aanpassen met de functie
setwd()


DATA IMPORTEREN
In R bestaat een handige functie om zo’n csv-bestand in te laden: read.csv()

- Om de data te inspecteren kan je de functies head() en str() gebruiken


PACKAGES
Eén van de mooie aspecten van R is dat iedereen nieuwe functies kan maken en die beschikbaar kan stellen
voor alle gebruikers wereldwijd. Die extra functies worden gebundeld in zogenaamde packages.

- Om nieuwe packages te kunnen gebruiken moet je maar twee functies onthouden:
o install.packages() moet je éénmalig uitvoeren
o library() moet je uitvoeren elke keer wanneer je de functies uit een package wil gebruiken

HOOFDSTUK 0: PROLEGMENA


STATISTIEK, PSYCHOMETRIE EN METHODOLOGIE
Een onderzoeker wenst een of meerdere onderzoeksvragen m.b.t. een bepaalde populatie te
beantwoorden:

- Methodologie: het is de taak van de methodologie om te bepalen hoe de steekproef samengesteld
wordt en welk soort van onderzoeksdesign het meest geschikt is om een antwoord te bieden op de
onderzoeksvragen
o Onderzoeksdesign: bv.
▪ observationeel onderzoek (inclusief vragenlijsten)
▪ experimenteel onderzoek.
o Steekproeftrekking
- Psychometrie: het is de taak van de psychometrie om te bepalen hoe de variabelen het best
worden gemeten
- Statistiek (beschrijvend of inductief): eenmaal data verzameld is het de taak van de statistiek de
data te analyseren om de onderzoeksvraag te beantwoorden.
o Beschrijvende statistiek: verzameling van technieken om de gegevens in een steekproef
te beschrijven, te ordenen, te visualiseren en samen te vatten.
o Inductieve statistiek: verzameling van technieken om observaties (op het niveau van de
steekproef) te veralgemenen naar de populatie.

,VARIABELEN
Variabele : een eigenschap die bij de elementen van de populatie of van de steekproef varieert.

- Kan numeriek zijn of niet => keuze van de onderzoeker: bijv. hij kan….
o Het geslacht coderen als man/vrouw of als 0/1.
o Sociabiliteit coderen als asociaal/sociaal/zeer sociaal of gebruik maken van een
vragenlijst met numerieke scores.
o Gezinsgrootte coderen als 1, 2, 3, ...of klein/groot
- Kan continu of discreet zijn:
o Continu: tussen elke twee willekeurige waarden ligt een derde waarde.
o Discreet: niet continu.
o Er bestaan verschillende technieken voor continue en discrete variabelen.
▪ Discrete variabelen met veel mogelijke waarden worden op dezelfde manier
geanalyseerd als continue
- Notatie variabele: aangeduid met hoofdletter. Bv. X of Y .
- Waarnemingen/scores/waarden: aangeduid met overeenkomende kleine letter. Bv. 𝑥 of 𝑦
- Successieve waarnemingen van X in een steekproef aangeduid door 𝑥1 , 𝑥2, . ., 𝑥𝑛 waar n de
steekproefgrootte is


MEETNIVEAUS (5)


Absolute schaal - De variabele wordt gemeten door gewoon objecten (of mensen) te tellen.
- Bv. gezinsgrootte, klasgrootte, aantal inwoners, enz.
- De meeteenheid is vast. Het nulpunt is vast.
- De variabele is discreet.

Ratioschaal - Eerst meeteenheid kiezen.
- Dan aantal meeteenheden tellen tussen het te meten object en het vaste
nulpunt.
- Bv. leeftijd, reactietijd, lengte, gewicht, oppervlakte, polsslag,
concentratie aan cortisol, enz.
- De variabele is continu.

Intervalschaal - Eerst meeteenheid en referentiepunt kiezen.
- Dan aantal meeteenheden tellen tussen het te meten object en het
referentiepunt.
- Bv. temperatuur of datum.
- De variabele is continu.

Ordinale schaal - Je kan de te meten objecten ordenen, maar je kan geen meeteenheid
definiëren.
- De waarde van de variabele bij een object is gewoon zijn plaats of
rangnummer in de ordening.
- Bv. uitslag van een wielwedstrijd, mate van instemming met een bepaalde
uitspraak (Likert schaal).
- De variabele kan continu of discreet zijn

Nominale schaal - De te meten objecten kunnen niet geordend worden.
- bv. postcode, haarkleur, geslacht, enz.
- De variabele is noch discreet noch continu: we kunnen dit namelijk niet
bepalen aangezien je om vast te stellen of een variabele discreet of
continu is je twee willekeurige waarden moet kunnen kiezen en nagaan of

, er waarden tussen liggen, dit is onmogelijk omdat we de objecten niet
kunnen ordenen
- Dichotome variabele: twee mogelijke waarden
o 0-1 variabele: de twee mogelijke waarden zijn 0 en 1.

Meetniveaus in de praktijk:

- Interval- en ratiomeetniveau hebben identieke statistische technieken.
o Veel onderzoekers groeperen die twee meetniveaus onder de noemer continue
variabelen.
o Niet 100% correct omdat ordinale variabelen ook continu kunnen zijn, maar in de praktijk
is dit OK
- Er zijn specifieke statistische analyses voor variabelen van nominaal, ordinaal en absoluut
meetniveau.
- Nominale en ordinale variabelen worden soms gegroepeerd onder de noemer categorische
variabelen


ZINVOLHEID (VAN EEN BEWERING):
Een bewering of uitspraak is zinvol indien haar waarheidswaarde onafhankelijk is van de meetschaal die je
gebruikt (dus indien een bewering correct is met een bepaalde schaal blijft ze correct met een andere
schaal)

- Vb. Gemiddelde leeftijd in groep A is groter dan in groep B.
o Stel dat deze bewering juist is wanneer we de leeftijd in jaar uitdrukken, dan is ze ook
correct als we de leeftijd in maanden, eeuwen of seconden uitdrukken: zinvol
- Vb. Gemiddelde temperatuur in Gent in Februari (6◦C) is dubbel zo groot als in Kopenhagen (3◦C).
o Juist in Celsius graden => fout in Fahrenheit graden (42.8◦F= 2 ×37.4◦F): zinloos
- Vb. Gemiddelde score op de Likert schaal “intrinsieke motivatie” (een schaal met 5 niveaus) is
groter in groep 1 dan in groep 2.
o Juist met codering 1, 2, 3, 4 en 5 => fout met codering 0, 2, 3, 4 en 6: zinloos

Om zinloze beweringen te vermijden moet je voorzichtig zijn bij het manipuleren van scores:

- Bij nominale en ordinale variabelen mag je de scores niet +, −, ×, / doen van elkaar
o Dus geen gemiddelde, variantie, covariantie, correlatie, enz.
- Bij variabelen van het intervalmeetniveau: + en − zijn OK. Andere operaties niet.
o Logaritmes van scores zijn verboden: vermenigvuldigen, delen, machten,…
o Afwijkingen (bv. 𝑥1 − 𝑥2 of 𝑥1 − 𝑥̅ ): mag je wel met elkaar vermenigvuldigen of door elkaar
delen, daarnaast mag je ook logaritme van een afwijking berekenen
- Ratiomeetniveau: bijna geen restricties.
- Absoluut meetniveau: geen restrictie.

HOOFDSTUK 1: DATA MANIPULATIE

Drie softwarepakketten: R (RStudio is een implementatie van de R programmeertaal), SPSS en Excel


DE DATA IN R
- Een vector aanmaken met de functie c:

Les avantages d'acheter des résumés chez Stuvia:

Qualité garantie par les avis des clients

Qualité garantie par les avis des clients

Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.

L’achat facile et rapide

L’achat facile et rapide

Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.

Focus sur l’essentiel

Focus sur l’essentiel

Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.

Foire aux questions

Qu'est-ce que j'obtiens en achetant ce document ?

Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.

Garantie de remboursement : comment ça marche ?

Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.

Auprès de qui est-ce que j'achète ce résumé ?

Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur Studentjepedagogie. Stuvia facilite les paiements au vendeur.

Est-ce que j'aurai un abonnement?

Non, vous n'achetez ce résumé que pour €9,49. Vous n'êtes lié à rien après votre achat.

Peut-on faire confiance à Stuvia ?

4.6 étoiles sur Google & Trustpilot (+1000 avis)

72042 résumés ont été vendus ces 30 derniers jours

Fondée en 2010, la référence pour acheter des résumés depuis déjà 14 ans

Commencez à vendre!
€9,49  1x  vendu
  • (0)
  Ajouter