Samenvatting Onderzoek training 1.
Video 1.1 Voorbeelden van statistisch onderzoek.
• Resultaten statistisch onderzoek te vinden in uiteenlopende soorten van berichtgeving.
• Totstandkoming en gebruik van resultaten allerminst vanzelfsprekend door: statistische theorie,
rol methodologie en de interpretatie van uitkomsten.
• Kritische blik hebben.
• Welke data is er beschikbaar.
• Welke methode & technieken zijn goed om deze gegevens te analyseren:
o Onderzoek ontwerp (tijdsreeks, cross sectie, panel)
o Steekproefontwerp (aselect, gestratificeerd, cluster)
o Informatiebehoud variabel (nominaal, ordinaal, interval, ratio)
o Complexiteit analyse ( univariaat, bivariaat, multivariaat)
o Overige ( communicatie, politiek, middelen ter beschikking, etc…)
Voor dit vak: (twee keuzecriteria worden uitgewerkt)
1. Meetniveau variabele
2. Complexiteit analyse
Video 1.2 Keuze van statistische methode en technieken
Variabelen: grootheden die verschillende uitkomsten kunnen hebben voor verschillende subjecten of
voor dezelfde subjecten op verschillende momenten in de tijd.
1.univariaat: een enkele variabel (lengte)
2. bivariaat: twee variabelen (lengte, gewicht)
3. multivariaat: meer variabelen (lengte, gewicht, geslacht).
Meetniveaus en variabelen:
- Verschillende variabelen hebben verschillende meetniveaus: het meetniveau verwijst naar de
schaal waarop een variabele is gemeten
- Het meetniveau bepaalt de interpretatiemogelijkheden van de uitkomsten
De schaal waarop variabel zijn gemeten definieer je met een meet niveau
1. Kwalitatieve meetniveau ’s ( nominaal & ordinaal)
2. Kwantitatieve meetniveau ‘s ( interval & ratio)
- Nominaal: (geslacht, naam van bedrijf, land, etc..) =, of geen =
- Ordinaal ( functie niveau, preferentie, etc..) =, geen =, <, >
- Interval ( temperatuur, beloningsniveau, etc..) =, (geen =), <, >, +, -
- Ratio (kan niet onder nul) ( temperatuur in Kelvin, lengte, salaris, etc..) =, (geen =), <, >, +, -, *, /
Grafieken:
Cirkeldiagram en staafdiagram zijn voor kwalitatieve informatie
Histogram (box and whisker plot) zijn voor kwantitatieve informatie.
Staafdiagram kan goed bij nominaal.
➢ Degenereren: variabelen behandelen als gemeten op lager meet niveau: vrijwel altijd mogelijk
,➢ Opwaarderen: zit je zelfs dingen erbij te verzinnen. Variabelen behandelen als gemeten op hoger
meetniveau: nooit zomaar toegestaan: uitzondering: dummy variabelen, i.e. variabelen met
uitkomsten 0 of 1.
Kengetal: samenvattende maatstaven die aspecten van verdeling van waarnemingsuitkomsten
getalsmatig weergeven.
- Gemiddelde (locatie maatstaaf)
- Standaard deviatie (spreidingsmaatstaf)
Deze worden beide gebruikt voor het beschrijven van interval en ratio gegevens, maar niet
voor kwalitatieve gegevens vanwege de vereiste afstandsinterpretatie van de
waarnemingsuitkomsten
- Mediaan en interkwartiel afstand : bereik van middelste 50% van je data (spreidingsmaatstaf)
voor beschrijven van ordinale gegevens, maar niet voor nominale gegevens vanwege de
vereiste volgorde interpretatie.
- Modus: wordt gebruikt voor het beschrijven van nominale gegevens, geen eisen ten aanzien
van afstand of volgorde
- Frequentie tabel wordt gebruikt bij kwalitatieve data.
- Histogram bij kwantitatieve gegevens. En niet bij kwal gegevens. Verschil met staafdiagram is
dat de horizontale as een metrische betekenis heeft.
- Staaf en cirkel bij kwalitatieve data: bij staafdiagram ligt het accent op frequenties van
uitkomsten, bij cirkeldiagram op % van een geheel.
- Tabellen met kengetallen worden gebruikt voor kwantitatieve gegevens.
Complexiteit van analyse
- Univariaat: histogram
- Bivariaat: scatter plot
- Multivariaat: 3D scatterplot
Video 1.3 Bedrijfskunde en empirisch onderzoek
➢ Empirische wetenschap: is gericht op het verkrijgen van inzicht in waarneembare
werkelijkheid op basis van empirische (waargenomen) gegevens.
➢ In het geval van Bedrijfskunde dienen de verkregen inzichten als basis voor bedrijfsmatig
handelen.
➢ Probleem: Onderzoeksvragen en empirische observaties zeer gevarieerd: maar ook, de
werkelijkheid is als regel onbekend en niet onmiddellijk kenbaar….
Vooronderstelling van empirisch onderzoek
1. Er bestaat een te kennen werkelijkheid (al is die niet per se onmiddellijk waarneembaar).
2. Deze werkelijkheid is zodanig gestructureerd en stabiel dat er zinvol gekend kan worden (dat
morgen niet totaal anders is dan vandaag).
3. Regelmatigheden in waarnemingsuitkomsten worden verondersteld iets te zeggen over de
achterliggende causale mechanismen (die niet onmiddellijk kenbaar zijn)
Methodologisch probleem: hoe verhouden observaties en onderzoeksresultaten zich tot de
werkelijkheid, die immers onbekend is?
Hoe wordt hiermee in de wetenschap omgegaan?
1. Inzicht in werkelijkheid wordt stellende wijs verkregen (met hypothesen, theorieën en
modellen).
, 2. Theoretische claims worden aannemelijk gemaakt door het meteen van empirische
regelmatigheden.
Hoe wordt hiermee omgegaan in een scriptie bijv.?
1. Voor analyse van de gegevens: eerst verdiepen in onderzoeksvraag, dan veronderstellingen
expliciet maken.
2. Veronderstelde relaties worden getoetst op basis van waargenomen (empirische gegevens
3. Resultaten worden geïnterpreteerd in het licht van onderzoeksvraag en het ontwikkelde
mode.
Video 1.4 Modellen.
Causaal relatieschema.
Er is data in een voorbeeld maar hoe gaan we dit structuren? Mogelijk zijn er hypothesen?
Maken van het schema begint met het vastleggen van de afhankelijke variabelen. Een afhankelijke
variabele is een variabele waarover in statistiek en wetenschappelijk onderzoek een voorspelling
wordt gedaan om hypotheses te toetsen, terwijl een onafhankelijke variabele (of experimentele
variabele of predictor) een variabele is die gebruikt wordt om voorspellingen op te baseren.
, Causaal relatieschema ( + - * of ?)
De * komst voornamelijk bij nominale variabele voor.
Causaliteit: twee grootheden X en Y heten causaal afhankelijk als een verandering in de ene variabele,
zeg X, leidt tot een verandering in de andere variabele, Y, alle overige invloeden constant houdend
(ceteris paribus).
Causaliteit = subjectief verondersteld
Statistische samenhang = objectief vastgesteld
Statistische samenhang: twee variabelen X en Y hangen statistisch samen als de gezamenlijke
waarnemingsuitkomsten een systematische patroon vertonen. Inzicht in de uitkomsten van de ene
variabele, zeg X, helpt dan om nauwkeurigere uitspraken over Y te doen.
Conceptueel relatieschema en Empirische relatieschema: