Hulpsamenvatting Statistiek in 20 stappen, ISBN: 9789001575373 statistiek
Tout pour ce livre (3)
École, étude et sujet
Fontys Hogeschool (Fontys)
Bedrijfskunde MER
Statistiek
Tous les documents sur ce sujet (4)
1
vérifier
Par: youpvisscher • 1 année de cela
Vendeur
S'abonner
IsV
Avis reçus
Aperçu du contenu
Hoofdstuk 1: Een eerste stap
Wat is statistiek?
Statistiek:
- Kennis over meten
- Betekenis uitkomsten
- Informatie beoordelen en analyseren
- Anders leren denken
Doel van onderzoek:
1. Goede beslissingen nemen
2. Ideeën/ oplossingen opdoen
3. Ontwikkelingen volgen
4. Een organisatie profileren
Soorten statistiek
Voor verschillende doeleinden: patronen in een collectie verzamelde gegevens vinden (analyseren
van databestand), gegevens beschrijven met tabellen, grafieken en maatstaven. Beschrijvend
statistiek= hier beschrijf je een grote verzameling gegevens op een doelgerichte manier om een kort
en krachtig beeld te schetsen.
Voorbeeld van toepassen statistiek in economie en management: onderneming wil beeld over
ziekteverzuim, overheid wil schatting maken over hoogte van pensioenpremies, minister
Economische Zaken wil hoogte van inflatie weten.
Basisbegrippen:
Populatie= totale verzameling elementen waarop het onderzoek betrekking heeft en waarover je
een uitspraak wil doen. Bijv. bij onderzoek naar tevredenheid over studiefinanciering, bestaat
populatie uit alle Nederlandse studenten die dit ontvangen. (=inductie: op basis van enkele
waarnemingen een uitspraak doen).
Deductieve logica: argumentatie- of bewijstechniek. Het bewijs uit een redenering waarvoor geldt
dat de conclusie logisch onontkoombaar volgt uit aannames. Bijv. de deductie is de toepassing van
een algemene regel op een specifieke situatie, bijv. als het regent wordt alles nat zoals de auto.
Steekproef= een kwantitatief onderzoek bij een deel van de populatie. Dit gebruik je als het te veel
werk is om iedereen te ondervragen of niet alle informatie beschikbaar is. Bijv. een beeld van de
populatie van 2e handsauto’s op de NLse markt, er wordt dan onderzoek gedaan naar 8 modellen van
garage Beun.
Steekproefonderzoek kent 2 voorwaarden: het moet valide zijn en het moet betrouwbaar zijn.
Validiteit: meten wat je wil weten
- De steekproef: onderdekking: mensen zitten niet in het steekproefkader die er wel in hadden
moeten zitten. Bijv. je steekproefkader bevat niet 100% van de populatie maar 85%.
Overdekking: mensen die al zijn overleden, maar waarvan je dat nog niet weet. Bijv. je
steekproefkader bevat ook elementen die niet in de populatie thuishoren 115%.
- Non respons (wat zegt dat, wie zijn het?)
- Het gedrag van de respondent (eerlijk?)
- De enquête zelf (verkeerde vragen)
- De techniek (juiste wijze bewerken data?)
,Betrouwbaarheid: als je het onderzoek herhaalt, krijg je dan dezelfde uitkomsten?
Steekproefkader: lijst of bestand met een weergave van alle elementen van de onderzoekspopulatie.
Kaderfouten: fouten in het steekproefkader; niet actueel, niet compleet, overcompleet.
Representatief:
- indien steekproef een goede dwarsdoorsnede is van de hele populatie, dit wil zeggen dat iedereen
(ieder element) van de populatie evenveel kans hebben in de steekproef terecht te komen. –
toevalfout kan optreden, naarmate de steekproef groter is wordt deze afwijking steeds geringer. –
een systematische fout (bijv. non response) is een groter probleem.
Steekproefbeoordeling:
- Vergelijk of de verdeling van de steekproef overeenkomt met de steekproefverdeling van de
groep zoals deze bekend is van deze populatie.
- Ter beoordeling van de steekproef bestaat er een ‘gouden standaard’ welke tevens voor de
aanpassing van de weging gebruikt kan worden. Bijv. van 17 miljoen mensen weten ze wat hun
inkomenscategorie, leeftijd, geslacht is.
- Indien significante afwijking, dan kun je de weging van de gemeten data aanpassen,
overeenkomstig de juiste samenstelling van de populatie.
Voorbeeld: Maurice doet onderzoek naar de mening van Nederlanders. Hij heeft een vast bestand
met 10.000 emailadressen van mensen die zich hebben aangemeld. Bij elk onderzoek benaderd hij
circa 1200 van deze populatie. Tot slot vergelijkt hij de steekproef met de gouden standaard en
corrigeert daar de uitkomsten op.
Vragen: Is de populatie juist? Hij heeft 10.000 emailadressen, maar mensen zonder computer of die
geen zin hebben antwoord te geven zitten niet in de populatie. Alleen de mensen die zich aangemeld
hebben. Is de steekproef juist? Als de populatie niet juist is kan de steekproef sowieso niet goed zijn.
De steekproefbeoordeling kan dan ook niet goed zijn.
Paradox van Simpsons: Mogelijke afwijkende trend bij onevenredige vergelijkingen. Methode om te
beoordelen of bijv. het ziekenhuis het goed doet dan kijk je naar aantal sterfgevallen. AZ scoort lager
dan PZ maar AZ heeft meer zware operaties. Als je opsplitst in zware en lichte operaties en apart
berekend dan scoort het AZ bij beide beter. De verklaring moet gezocht worden in de verhouding van
zware en lichte operaties. Dat is het probleem van het vergelijken van appels met peren.
Causaal verband: er is sprake van een aantoonbare oorzaak gevolg relatie. ‘Fout‘ causaal verband:
Bijv. iemand met een lage opleiding heeft een lage inkomen en daardoor slecht eten.
Correlatie: er is sprake van een oorzaak gevolg relatie, echter deze is niet aan te tonen. Vaak is er
wel een samenhang. Samenhang voorbeeld: mensen met lage opleiding hebben een laag inkomen en
daardoor in goedkope wijk woont, er zijn vaak meer friettenten dan groenteboeren daar en die
hebben allemaal invloed op en daardoor slechter eten.
Verschil correlatie en causaal verband? Correlatie; er is mogelijk een verband.
Causaal verband; er is een oorzaak -> gevolg.
Variabelen= de kenmerken van een element van de populatie. Bijv. merk, prijs, kilometerstand,
kleur, bouwjaar.
Kwalificaties= aanduidingen van de variabelen. Bijv. bij variabele ‘merk’ Volkswagen, Audi. Bij
variabele ‘kilometerstand’ tussen 1000 en 40000.
Onderscheid tussen 2 variabelen:
,- Kwalitatieve variabelen= als de uitkomsten die verschijnen aanduidingen zijn, maar geen getallen.
Hiermee kan niet gerekend worden.
- Kwantitatieve variabelen= als de uitkomst van de variabele wordt bepaald door een getal. Hiermee
kan je rekenen.
Als je een databestand in moet voeren is het soms handig om kwalitatieve variabele om te zetten in
codenummers, bijv. voor Volkswagen code 1 en voor Audi code 2. Je kan dan alleen niet met
gemiddeldes gaan werken.
Kwantitatieve variabele omzetten in kwalitatieve variabele, bijv. kilometerstand van 0 tot 60000
aanduiden als ‘heel weinig’ en 100000 tot 200000 als ‘veel’. Het kan dan wel grovere informatie zijn.
Typen variabelen
Binnen de categorie kwantitatieve variabelen maken we onderscheid tussen:
- Directe variabelen= er zijn een beperkt aantal mogelijke uitkomsten. Bijv. hoeveel passagier zitten
in een autobus? Dan zal dat getal tussen 0 en max. 80 mensen zijn. Wat zijn de prijzen per fles van 4
soorten cola? Dat zal 0,95 euro, 1,28 euro en 1,45 euro zijn.
- Continue variabelen= er zijn oneindig veel mogelijke uitkomsten. Bijv. het gewicht van een
pompoen, afstand tussen twee bomen langs een weg. Als er maar goed meetapparatuur is.
Handige hulpregel: bij continue variabele tussen 2 mogelijke uitkomsten is er altijd wel nog een extra
uitkomst die daar tussenin ligt.
Afgelegde afstand is een voorbeeld van continue variabele, maar de kilometerteller gaat meestal niet
verder dan 1 getal achter de komma. Hierdoor worden continue variabelen eigenlijk omgezet in
discrete variabelen.
Vier meetniveaus
Een ander onderscheid tussen variabelen betreft de schaalindeling oftewel meetniveau. Er zijn 4
bekende meetniveaus:
1. Nominaal meetniveau: kunnen denkbare uitkomsten niet op een logische manier op een vaste
volgorde gezet worden. Kenmerk variabele kun je weergeven door codenummer, maar daarmee
hebben cijfers nog niet een logische volgorde. Bijv. kleur en merk zijn kenmerken gemeten met een
nominale schaal.
2. Ordinaal meetniveau: hier heb je te maken met een vaste volgorde. Er is ook een logische
volgorde vast te stellen. Bijv. de staat van onderhoud is een voorbeeld van een kenmerk gemeten
met ordinaal meetniveau, want ‘uitstekend’ is het beste, ‘goed’ komt erna, dan ‘redelijk’ ‘matig’
‘slecht’. Andere voorbeelden zijn rangen bij landmacht en antwoordmogelijkheden bij enquête (van
slecht tot zeer goed).
3. Interval meetniveau: hebben verschillen tussen twee uitkomsten een eenduidige betekenis.
Intervalschaal heeft geen natuurlijk nulpunt. Bijv. temperatuur en tijdsaanduiding. Voorbeeld bij
gegevens is bouwjaar een typisch kenmerk van gemeten met een intervalschaal, het tijdsverschil
tussen bouwjaar 1995 en 1998 is even groot tussen 2009 en 2012, de intervallen zijn gelijk.
4. Ratio meetniveau: hier heb je wel een natuurlijk nulpunt. Bijv. als we van auto’s de leeftijd
berekenen dan bestaat een auto van 10 jaar oud 2x zo lang als een auto van 5 jaar, gewicht en
verstreken tijd. Voorbeeld bij gegevens kilometerstand en prijs zijn kenmerken gemeten met
ratioschaal. Nul is hier een logisch begin van de schaal.
Tabellen maken
, Gegevens in groepen indelen. Die groepen heten klassen, bij elke klasse wordt vastgesteld hoeveel
waarnemingen daartoe behoren. Die aantallen heten frequenties.
Voorschriften van de tabellen:
Er moet een opschrift zijn, zodat de lezer weet waarover de tabel informatie geeft.
Er moet een kopregel zijn, zodat je kunt zien wat er in de kolommen staat vermeld.
De klassen moeten zodanig zijn gekozen dat alle waarnemingen een plek kunnen krijgen. Die
klassen moeten zo mogelijk in een logische volgorde staan.
Er moet een totaalregel zijn.
Als het kan moet er een bronvermelding zijn.
Je kan bijvoorbeeld uitvergroten op de staat van onderhoud en in een tabel weergeven het aantal
keer dat uitstekend, goed, redelijk, matig en slecht voorkomt. Ook maak je een balkje met totaal
aantal. Alle 5 de antwoordmogelijkheden vormen een eigen klasse.
Het maken van klassen bij een ratio- of intervalvariabele is een willekeurige keus, we maken klassen
van gelijke breedte, maar als er te weinig waarnemingen in een gebied zijn is het handiger enkele
extra brede klassen te maken. Bijv. tabel voor de kilometerstand, kilometerstand 0-<80.000, 80.000-
<120.000, 120.000-<200.000. De notatie 0-<80.000 geeft aan dat de uitkomsten van minstens 0 tot
hoogstens 79.999 in die klasse zitten, de ondergrens behoort wél tot de klasse en de bovengrens
niet. De waarde 120.000 hoort dan in de klasse 120.000-<200.000.
Met de tabellen kun je allerlei vormen van presentatie kiezen. Een bekende vorm is de kruistabel,
hierin worden de waarnemingen ingedeeld aan de hand van 2 kenmerken tegelijk. Dus je maakt de
samenhang tussen 2 variabelen zichtbaar.
Presenteren van gegevens: Lastig
om (veel) getalsmatige informatie op een effectieve manier duidelijk te maken in woorden. Naar
mate complexiteit van cijfers toenemen en zaken meer met elkaar samenhangen wordt dit alleen
maar lastiger.
- Tabel: Het doel van tabellen en grafieken is om de lezer een duidelijk overzicht te geven van het
onderwerp van de tabel. Op een heldere en eerlijke manier moeten de gevonden uitkomsten
worden gerapporteerd. Stijl en vormgeving richten de lezer op de kern
van de zaak.
Voorbeeld tabel 1: Tabel is nauwkeurig maar schiet al gauw het doel voorbij,
teveel cijfers achter de komma die waarschijnlijk geen betekenis hebben.
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur IsV. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €5,19. Vous n'êtes lié à rien après votre achat.