Master TSP: Onderzoeksmethoden hoorcollege 7 t/m 12
Deze samenvatting bevat dia’s uit de hoorcolleges gegeven door Esther Janse.
Rietveld (2021). Human measurement techniques in speech and language pathology: Methods for research and
clinical practice. London: Routledge.
Kwantitatieve Methoden en Statistiek (KMS) (Quené & van den Bergh, 2021): https://hugoquene.github.io/KMS-
NL/
Hoorcollege 7
Soorten gegevens
- Ruwe data: onbewerkt, zoals je ze verzameld, direct afgelezen
- Afgeleid (derived): Eenvoudige berekeningen, directe transformatie van ruwe data,
bijvoorbeeld leeftijd op basis van geboortedatum
- Bewerkte gegevens
o Keuzes maken: om bepaalde mensen/datapunten te excluderen of Smoothing.
o Om van meetfouten of andere fluctuatie af te komen (interpretatie).
o Getypte responsies (woorden in ruis, woorden door mensen met pathologie)
transcriptie. Typfouten. Responsie correct rekenen is bewerkte gegevens.
Sinmaasappel goedrekenen ondanks typfout.
Smoothing: Bewerking/ post-processing van data
- F0 contour: tussendoor onbetrouwbare octaaffouten hebt bijv.
verdubbelingen van F0.
- Daar vanaf komen? Moving Window smoothing: fictieve metingen op
bepaalde meetpunten. Onder elkaar en ruwe f0 daarnaast zetten.
Bewerkingsstap is nu dat we een venster gaan toepassen en dat we een
datapunt gaan vervangen door een ander datapunt. Venster van dit meet
o Vervang elke waarde door mediaanwaarde binnen een venster
(window) dat de waarde zelf omvat en een aantal vorige en
volgende waarden (‘kill octave jumps’)
- Hier een venster van 3. Waarde 102 vervangen door de mediaan van 3
meetpunten
- Waarom? Op die manier voor kunt zorgen dat uitschieters wegveegt. Curve meer smooth
maken. Dat doe je om een bepaalde vensterbreedte te kiezen (1 naar achteren 1 naar
voren en meetpunt zelf =3)
- Wat is het effect van vensterbreedte?
o Groot venster: Je gaat heel veel wegpoetsen, ook
betekenisvolle f0 bewegingen weghaalt.
o Wat gaan we doen met dit punt gegeven het venster
dat naar achteren en naar voren kijkt.
o Het venster gaat over time.
o Elk data punt bewerk je op wat er voor en na
gebeurt. Dus niet alleen bij uitschieters.
o Je bekijkt wel steeds de oorspronkelijke waarde bij
het vensterbepaling.
o Mediaan = precies de waarde in het midden.
- Om van octaafsprongen af te komen doet praat zon
berekening.
, - Op basis van visuele cues hoef je dus niet te bepalen wat jij afwijkend vind, dat doet het
algoritme voor jou.
- Waarom niet standaard een zo klein mogelijk venster?
o Misschien twee foute metingen achter elkaar met een vensterbreedte van 3 gaat die
fout er nog niet uit. Balans vinden in smoothing die je wil maar niet aal fluctuaties
eruit. De rommel eruit filteren alleen. Communiatief interessant houden
Meetniveau’s
- Nominaal: Categoriseren zonder ordening, zoals nationaliteit proefpersoon, merk van een
auto.
- Ordinaal: Categoriseren met rangorde, maar we weten niets over de afstand. VMBO-
HAVO-VWO, mee eens – neutraal – oneens, kledingmaten etc.
- Interval: Getal op continue schaal, zonder nulpunt. Zoals graden Celcius of jaartal
- Ratio: Getal op continue schaal met een nulpunt. Zoals responsietijd, leeftijd in jaren,
aantal gemaakte fouten in een toets.
Methoden van schaling
- 1. Equal Appearing Interval Scale (EAI):
- 2. Direct Magnitude Estimation (DME)
- 3. Visual Analog Scaling (VAS)
Equal Appearing Interval Scale
-
- Een schaal met verschillende stappen, komt vaak voor in vragenlijsten.
- Voorbeeld van een EAI is de Likert Scale
o Moet je aangeven of je er mee eens bent.
o Deze persoon klinkt schor ben je het er sterk mee eens, eens, neutraal, niet mee
eens of sterk niet mee eens
- Beide stappen neem de aan dat de afstand tussen de stappen gelijk is. Maar in de
praktijk vinden mensen sommige stappen qua gevoel groter of
kleiner.
- Interval scaling
o Aangeeft welk nummer het beste past op schaal niet tot zeer
o Bij Likert: in hoeverre je er mee eens/oneens bent
o Bij EAI: kruis aan welk hokje het best overeenkomt met de
mate van een bepaalde eigenschap (bijv. schorheid)
, - Equal appearing
o Variatie tussen de eerste en de tweede beoordeling
o Bij welke mean rating is men het meest consistent?
X-as oordelen over stem.
Y-as: verschil 1e en 2e beoordeling voor die stem.
Antwoord: Uiteinden: kleine verschillen in wat je de
ene keer en de tweede keer vond. Exterme waarden
worden consistenter beoordelen.
o Meest consistent aan uiteinden van de schaal impliceert dat afstanden
tussen schaaloordelen dus toch niet overal gelijk zijn.
o Afstanden aan het eind van de schaal zijn niet gelijk aan de afstanden meer in het
midden van de schaal.
Vraagtekens bij equal appearing rekening houden dat de stapgroottes
niet even groot zijn bij het invullen ookal lijken de stappen hetzelfde bij 1-7.
Wat equal steps lijken, interpreteren mensen zelf niet als equal
steps.
- Overwegingen van de EAI schaal
o Aantal schaalstappen: Hoeveel stappen ga ik nemen
Moet in verhouding zijn tot wat men kan onderscheiden
Kun je nasaliteit in 7 gradaties onderscheiden?
o Ga ik oneven of even stappen nemen? Ligt eraan of je een middelpunt wil
Oneven aantal zorgt voor neutrale categorie in het midden. Is dat wenselijk?
Hoe geïnterpreteerd?
Hangt af van wat je op de uiteinden hebt staan/.
Visual analog scale (VAS)
- Schaalmethode voor intensiteit of omvang van gewaarwordingen en subjectieve gevoelens
(bv. pijn en stemming), en de relatieve sterkte van attitudes en meningen over specifieke
stimuli
- Schuifbalk zonder categorieën of labels.
- Oneindig aantal gradaties: Geen
voorgekauwde punten op een schaal,
ergens in het schaalbereik te zitten, vrije
keuze
- Geen gradatielabels op de lijn.
o Ankerstimuli gebruiken mag wel. Om betrouwbaarheid van beoordeling omhoog te
krijgen.
Direct Magnitude Estimation (DME)
- Stimulus schaalt tov een standaard stimulus.
o Om de 4 – 10 stimuli krijgt men een standaard stimulus (modulus) te horen. De
modulus krijgt een bepaalde waarde toegewezen. Bijv. 100. De deelnemer gaat nu
elke volgende stimulus schalen t.o.v. de modulus. Als je deze stimulus half zo
schor, dan geef je 50.
- Verhoudingen staan centraal
- Schaalscores getransformeerd (logtransformatie) voor analyse, omdat verband tussen
logaritmes van perceptieve indruk (R) en stimulus (S) vaak lineair is.
o Schaling luidhuid en toonhoogte (en stemkwaliteit) omdat die een niet lineair
verband hebben met de waarneming
- Wordt veel gebruikt bij luidheid en toonhoogte
- Niet erg intuitief voor deelnemers.
, - Om de 4 stimuli weer de standaard te horen. Ze doen niet om de stimuli voor
tijdsbesparing.
Paired comparison scaling
- Geef een voorkeur voor A of B, of welk fragment
‘meer’ heeft van een bepaalde eigenschap.
- -3 tot -1 heeft voorkeur voor A, 1-3 heeft voorkeur voor B. 0 is geen voorkeur
- Kan ook met 2AF: Two alternive forced choice (A of B)
- Deelnemer weet niet wat voor en na is.
- Controleer voor volgorde effecten.
Betrouwbaarheid van subjectieve oordelen
- Mate van co-variatie/correlatie
o Om correlaties uit te rekenen hebben we intervaldata of ratiodata nodig
- Bij hoge correlatie tussen A en B
o Als ik waarde A weet, kan ik een goede betrouwbare voorspelling doen over B
- Let op: Hoge correlatie Is NIET overeenstemming tussen A en B.
- Als ik van de stunt 1 de resultaten hebt, kan ik voorspellen wat student 2 doet. ordening in
oordeling hangt samen
- 10 fragmenten 4 beoordelaars. Een uitspraak willen doen hoe betrouwbaar zijn de
beoordelingen en hoe consistent zijn die beoordelingen. Bij elk onderdeel een werkelijke
onderliggen de score.
Hoe betrouwbaar zijn de oordelen precies? Intra Class
Correlation Coefficient
- Intraclass Correlation Coefficient voor
ordinale/interval/ratio data
- Twee manieren
o Test-retest reliability: Correlatie tussen
waarde bij eerste en tweede meting
o Op basis van varianties: true variance / (true variance + error variance)
Wordt besproken in H4 van HMT boek
Tabel 4.1 HMT
o 10 spraakfragmenten op de rijen, beoordelaars op de
kolommen.
Scores verstaanbaarheid van 1-10.
Observed score = true score + error
- Voor ieder spraakfragment is er een onderliggende true score, die vervuild wordt door
een error.
o Error component komt door:
Criterium verschuiving tijdens test (ankers), bijvoorbeeld door gewenning,
leren of irritatie
Dezelfde criteria maar individuele verschillen in waar referentiepunt ligt.
Alles omhoog/omlaag, maar gelijke rangorde over de beoordelaars heen
Verschillende criteria.
o Error component horend bij item en beoordelaar
Voor 1 observatie is er altijd een echte waarde + error
- Als we veel oordelen hebben op dit specifieke fragment, zou het totaal van de error 0
moeten zijn. Het idee is, de ene keer zitten we erboven andere keer de onder maar we
proberen het target te hitten. Som van de afwijkingen moet 0 zijn.