100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting 4.4C. Applied Multivariate data analysis lectures + hoofdstukken Field $12.19
Add to cart

Summary

Samenvatting 4.4C. Applied Multivariate data analysis lectures + hoofdstukken Field

1 review
 111 views  7 purchases
  • Course
  • Institution
  • Book

Samenvatting van de lectures van 4.4C. Applied Multivariate data analysis met daarin ook de hoofdstukken van Field verwerkt.

Preview 4 out of 61  pages

  • No
  • Chapter 2,3,6,9 (niet 9.13), 11, 12 (niet 12,9), 13, 14 (niet 14,9), 15 & 16
  • January 31, 2022
  • 61
  • 2021/2022
  • Summary

1  review

review-writer-avatar

By: rozemarijnnoelle • 1 year ago

Translated by Google

I clearly miss the distinction between what the book's summary is. Lots of lecture notes or slides from the lectures.

avatar-seller
Samenvatting 4.4C. Applied Multivariate Data Analysis – Field (boek) & Lectures
Algemeen

- Kwalitatieve variabele= eigenschappen die verschillen in ‘types’, zoals religie, oogkleur,
geslacht en burgerlijke staat.
- Kwantitatieve variabele= eigenschappen die verschillen in ‘hoeveelheid’, zoals lengte,
gewicht, verlegenheid, tijd gespendeerd in leren.
- Discrete variabele= twee tussen aangrenzende waarde (bv. 1 of 2 of 3 kinderen), er zijn geen
tussen liggende waarden mogelijk.
- Continuous variabele= in principe tussen twee aangrenzende schaalwaarden, verdere tussen
waarden zijn nog steeds mogelijk

- Nominale schaal= de schaal waarden vertegenwoordigen alleen kwalitatieve verschillen (bv.
Verschillen van type in plaats van hoeveelheid) van het betreffende attribuut (Bv. Geslacht,
onderwijsniveau etc.)
- Ordinale schaal= de verschillende schaalwaarden vertegenwoordigen relatieve verschillen n
de hoeveelheid van een bepaald attribuut (bv. Verschillende ranken).
- Interval scale= wanneer gelijke afstanden tussen waarden op de schaal gelijk zijn aan de
verschillen in de hoeveelheid van het attribuut dat wordt gemeten.
- Ratio scale= wanneer gelijke afstanden tussen waarden op de schaal gelijk zijn aan verschillen
in de hoeveelheid van het attribuut dat wordt gemeten. De schaal heeft ook geen echt
nulpunt! (Bv. Temperatuur, tijd, lengte)

Lecture 1 Introduction. X

Q&A Lecture 1. Field chapter 2

Statistical models

In statistic we fit models to our data: we gebruiken statistische modellen om de representeren wat er
in de wereld gebeurd → De mate waarin een statistisch model de verzamelde data representeert
wordt ook wel de fit van een model genoemd. Deze fit is ook wel de accuraatheid van een model.

- Good fit: als een model de data heel goed representeert is het een good fit → je
voorspellingen zullen accuraat zijn.
- Moderate fit: er zijn bepaalde overeenkomsten met de werkelijkheid, maar ook belangrijke
verschillen →voorspellen kunnen niet accuraat zijn, je kan een beetje vertrouwen hebben
maar niet volledig in de voorspellingen van zo’n model.
- Poor fit: dit model is totaal verschillend van de werkelijke situatie→ voorspellingen op basis
van dit model zijn waarschijnlijk compleet inaccuraat.
Modellen bestaan uit parameters en variabelen:

Variabelen zijn gemeten constructen (bv moe) en verschillen onder mensen in de sample

Parameters zijn geschat van de data en representeren constante relatie tussen variabelen in het
model. Voorbeelden van parameters zijn het gemiddelde, de mediaan, de correlatie en regressie
coëfficiënten. De letter b staat voor parameters. Wanneer je een uitkomst wilt samenvatten,
bijvoorbeeld bij het uitrekenen van een gemiddelde, zijn er geen variabelen in het model, maar
alleen een parameter. →Bij een lineair model zijn de slope en intercept de parameters en wat je
meet de variabelen.

,We berekenen de model parameters in de sample om de waarde in de populatie te schatten.

Deviantie/residual/deviatie zijn andere woorden voor error. Error is de voorspelde score door het
model voor iemand min de geobserveerde score voor die persoon. Een negatieve error geeft aan dat
het model iets overschat.




➔ SS is afhankelijk van je sample size, vandaar dat je het deelt door df (N-1). De Mean Squared
error is de error die je hebt in het beschrijven van je data gemiddeld voor iedere persoon.
➔ Mean squared error is hetzelfde als variantie. Het is een variantie die model afhankelijk is.
➔ Hoe groter, hoe slechter je fit is.

,The sampling distribution: hoe de parameter
verschilt tegenover het herhaalde proces van
sampling van de distributie.

➔ Het hangt allemaal rond het gemiddelde van 10
maar als je er samples uit gaat halen zal de ene 9
gemiddeld zijn, de ander 11.

Standaard error
Sampling variatie: steekproeven variëren omdat ze
verschillende leden van de populatie bevatten. Een
symmetrische verdeling is een sampling distributie. Dit is een frequentie verdeling van gemiddelde
van steekproeven (of andere parameters). Als je het gemiddelde neemt van alle steekproef
gemiddelden, krijg je de waarde van het populatie gemiddelde. De SD van steekproef gemiddelde
zou ons vertellen hoe breed steekproef gemiddelden verspreid zijn over het populatie
gemiddelde→het vertelt ons of de steekproefgemiddelden representatief zijn voor het populatie
gemiddelde.

De SD van steekproefgemiddelden is ook wel bekend als de standaard error van het gemiddelde (SE)
of de standaard error. Een grote SE betekent dat er veel variabiliteit is tussen de gemiddelden van de
verschillende steekproeven en dus is de steekproef mogelijk niet representatief voor de populatie.
Een kleine SE betekent dat de meeste steekproefgemiddelden hetzelfde zijn als het populatie
gemiddelde en dat de sample een accurate reflectie is van de populatie.
➔ Central limit theorem→wanneer steekproeven groot zijn (groter dan 30), heeft de sampling
verdeling een normale verdeling met een gemiddelde die gelijk is aan het populatie gemiddelde
en een SD van:



Als een sample kleiner is dan 30, is de verdeling niet normaal→het heeft een andere vorm en wordt
de t-verdeling genoemd.

, ➔ SEx Hoeveel onze sample mean verschilt van onze populatie mean. Hoe groter je sample, hoe
lager je error.
➔ We kunnen SE gebruiken om de grenzen te berekenen waarin wij denken dat het populatie
gemiddelde zal liggen.

Betrouwbaarheidsintervallen

Een CI zijn grenzen waartussen de populatie valt. CI vertellen ons de waarschijnlijkheid dat ze een
echte (true) waarde bevatten van de parameter die men probeert te schatten. Er zijn grenzen zodat
van een bepaald percentage van steekproeven (bijv. 95%) de echte waarde van de populatie
parameter valt tussen deze grenzen.




Het meest gebruikelijke percentage is 95%, wat inhoudt dat wanneer er 100 steekproeven verzameld
worden het betrouwbaarheidsinterval bij 95 steekproeven de daadwerkelijke populatieparameter
(het populatiegemiddelde in dit geval) bevat. Bij een (grote) sample zal de data normaal verdeeld
zijn, waardoor er een gemiddelde van 0 en een standaarddeviatie van 1 is. In dat geval kan de 99.7-
95-68 regel worden toegepast. Dit houdt in dat 95% van de z-scores binnen -1.96 en +1.96
standaardafwijking valt.
➔ Een smal betrouwbaarheidsinterval wijst
erop dat het gemiddelde van de sample dus
dichtbij het populatiegemiddelde ligt.
➔ Een breed betrouwbaarheidsinterval wijst
erop dat het gemiddelde van de sample een
slechte representatie is van het
populatiegemiddelde.

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller eliseabal. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $12.19. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

53068 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$12.19  7x  sold
  • (1)
Add to cart
Added