samenvatting van het boek Statistiek voor de beroepspraktijk.
Behandeld de meeste hoofdstukken, vooral de gene die relevant zijn voor de basis van statistiek
§1.1
Statistiek geeft de mogelijkheid informatie over een grote hoeveelheid gegevens
samen te vatten met behulp van enkele begrippen.
§1.1.1
In een aantal stappen komt men via het verzamelen van ruwe data tot
informatie:
Stap 1: Ruwe data (meetgegevens): Het resultaat van de meting of waarneming
Stap 2: Gegevens: Er is semantiek (betekenis) toegekend aan de data,
bijvoorbeeld de één betekent vrouw en de nul betekent man.
Stap 3: Informatie: De (gecombineerde) gegevens geven inzicht in datgene
waarover de gegevens verzameld zijn. Bijvoorbeeld dat er 12% van de klanten
herhalingsaankopen doen.
§.1.1.2
De ruwe data, gegevens en informatie staan opgeslagen in een bestand of
database.
Bestand: een elektronische verzameling gegevens, bijvoorbeeld een
Word-document
- Het is een bestand wanneer de gegevens een willekeurige volgorde
hebben en er geen structuur in zit
Database: een elektronische verzameling geordende gegevens (data-
elementen). Bijvoorbeeld een SPSS- of SQL-database.
- Heeft wel structuur en is wel geordend.
- Een sleutel van een database identificeert op een eenduidige manier een
rij uit die database
§1.1.3
Interne gegevens: de verzameling data binnen de bedrijfshuishouding van een
bedrijf. (Denk hierbij aan data over betalingsgegevens van debiteuren en
crediteuren)
Externe gegevens: dat zijn gegevens die door andere organisaties verzameld
zijn. (Denk hierbij aan branchegegevens door een bank of data die het CBS
verzamelt)
- Die externe organisaties voegen betekenis (en soms informatie) toe aan
de verzamelde data, opdat andere partijen er informatie uit kunnen halen
Het verschil tussen interne en externe data komt voort vanuit de
dataverzamelaar
§1.1.4
Organisaties verzamelen gegevens op twee niveaus:
Individueel niveau:
Zijn bijvoorbeeld de gegevens van een individuele klant van een webshop
Vb. Zoals Amazon die individuele gegevens van het koopgedrag van andere
klanten koppelt aan een andere individuele klant (andere die product X kochten,
kochten ook dit product Y)
Geaggregeerde niveau:
,Zijn bijvoorbeeld de gegevens van alle klanten van de webshop samen.
Geaggregeerde gegevens verkrijgt men door individuele gegevens bij elkaar te
nemen.
(Gegevens krijgen pas betekenis wanneer ze worden vergeleken met anderen)
Door het vergelijken van maandomzetten, krijgt men inzicht in de bedrijfsvoering.
(Stijgende lijn? Dalende lijn?)
Door aggregatie en onderlinge vergelijkingen ontstaat inzicht: Van data naar
informatie!
§1.1.5
Statistiek: Betekent enerzijds het vakgebied statistiek en anderzijds is het een
verzameling van in getallen uitgedrukte waarnemingsuitkomsten.
Toeval: is de kans op een bepaalde gebeurtenis, iets dat een bepaalde
waarschijnlijkheid heeft.
§1.5 Leren lezen van statistiek
De wiskunde maakt gebruik van een apart symbool voor de optelling: het
sommatiekteken .
Dit is de Griekse hoofdletter ‘S’, spreekt uit als sigma.
Bedenk dat sommeren een ander woord is voor optellen.
Variabele x. Wat betekend x in formules? Wat x is moet blijken uit de context, het
is een variabele.
Index i. Wat betekend de i zoals bij xi in formules? De betekenis van de suffix i is
dat het een index betreft. Net zoals da t een index van een bok verwijst naar een
hoofdstuk, zo verwijst de index i naar een bijbehorend nummer.
i is ook een variabele
Gemiddelde.
De gemiddelde mu is de optelling van i is 1 tot n van x i gedeeld door n
De suffix van het sommatiekteken leest men van onder naar boven, daarna
leest men de rest van links naar rechts.
§1.6 Starten met SPSS
SPSS= Statistical Package Standard Solutions.
De nadruk wordt hierbij gelegd op het kunnen doen van voorspellingen met
framing ‘predictive analytics software’
§.1.6.2
File: Hiermee opent en sluit men bestanden en slaat men bestanden op
Edit: het belangrijkste is misschien wel de ‘undo’ optie om vergissingen
ongedaan te maken
Data: hiermee voert men bewerkingen uit op de rijen van een bestand
Transform: Hiermee voert men bewerkingen uit op de kolommen van een
bestand. Dus om bewerkingen op variabele te kunnen uitvoeren
Analyze: Hieronder zijn alle statististische analyses te vinden.
Graphs: met behulp van deze menuptie zijn grafische visualisaties te maken van
de variabelen, zoals staafdiagrammen en boxplots.
Window: SPSS maakt gebruik van meerdere schermen, hiermee wisselt de
gebruiker tussen de diverse schermen
, HOOFDSTUK 2: BESCHRIJVENDE STATISTIEK
§2.1: populatie en steekproef
Een steekproef trekken is makkelijker en goedkoper dan een populatie.
§2.1.1
Populatie: is de volledige, de gehele verzameling van alle onderzoekseenheden.
U – universum: is de verzameling van alle verzamelingen
P – populatie: deelverzameling van het universum
S – Steekproef: deelverzameling van de populatie
R – Respondent: deelverzameling van de steekproef
B- Bruikbare respons: deelverzameling van de respons
Respons: alle gegevens uit een enquête
Onderzoekseenheid: is de eenheid wat de onderzoeker onderzoekt en is een
element van de onderzoekspopulatie.
- Onderzoekseenheid is een element xi van de verzameling uit de populatie
P
§2.1.2
Steekproefkader: is de (formele) administratie van alle elementen van de
populatie waaruit de steekproef getrokken is.
Pas als duidelijk is wat het kader is waaruit men de steekproef trekt, start men
met het daadwerkelijk trekken van de steekproef
§2.1.3
Een aselecte steekproef: is een steekproeftrekking waarbij elk element uit de
populatie (steekproefkader) evenveel kans heeft om in de steekproef terecht te
komen
§.2.1.4
Er zijn twee soorten steekproeffouten:
1. Trekkingsfout: is de fout die de onderzoeker maakt met het trekken van
de steekproef.
a. Onderzoeker maakt een trekkingsfout door een verkeerde
trekkingsprocedure of door een verkeerde opbouw van het
steekproefkader (bv een element dat vaker dan 1 keer voorkomt.
2. Schattingsfout: is de fout die ontstaat doordat “toevallig andere
elementen in de steekproef worden getrokken”
Het aantal graden van vrijheid houdt verband met het aantal onafhankelijke
waarnemingen waarop een steekproef is gebaseerd.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Skerkvliet. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $13.22. You're not tied to anything after your purchase.