Zusammenfassung - Reflexionsaufgaben + Lösungen - Notation.
Das Dokument fasst die Inhalte aus den Fernlehrbriefen "Statistik 2 -Testverfahren 1 + 2 " komprimiert und detailiert zusammen und dient der optimalen Klausurvorbereitung.
Die kompletten mathematischen Herleitung und ausführlicheren B...
Testverfahren Ⅰ – Einführung in die inferenzstatistische Hypothesenprüfung
1. Einführung in die inferenzstatistische Hypothesentestung
- Aufgabe der inferenzstatistischen Hypothesenprüfung: anhand von Stichprobenkennwerten Hypothesen über die
Population zu testen; Dient zur Validierung der Übertragbarkeit eines Stichprobenergebnisses auf die Population;
Mögliche Prüfungen:
• Ob zwei Zufallsstichproben aus einer identischen oder aus zwei verschiedenen Population gezogen wurden
• Prüfung statistischer Kennwerte auf deren statistische Bedeutsamkeit (Signifikanz)
• Ob eine theoriegeleitete Annahme (= Hypothese) aufrechterhalten oder verworfen wird
o Ermittlung bestimmter Irrtumswahrscheinlichkeit
- Einführendes Beispiel:
• Evaluierung des Erfolgs eines Fitnessprogramms;
o Erfolgsparameter: Durchschnittliche Zeit für den Waldlauf über eine Stecke von 3 Kilometern
o Messzeitpunkt: Vor dem Fitnessprogramm/Nach dem Fitnessprogramm (zehn Wochen)
• Evaluierung des Erfolgs über die Differenz beider Laufzeiten:
o Ergebnis 1: Laufzeit hat sich überhaupt nicht verändert. Die Differenz beider Zeiten liegt exakt bei null
o Ergebnis 2: Die Differenz der mittleren Lauzeiten liegt zwischen den beiden Messzeitpunkten bei z.B. zehn
Minuten → Durchschnittliche Fitness der Gruppe hat sich verbessert
• Weiterführende Frage:
o Ab welcher Verbesserung kann der Unterschied der beiden Zeiten noch als Zufall betrachtet werden und ab
welcher Verbesserung kann von einem Einfluss des Trainings ausgegangen werden
o Mit Hilfe der Inferenzstatistik kann exakt ermittelt werden, ab welcher Differenz der beiden Mittelwerte der
Zufall unter einen akzeptablen Grenzwert reduziert ist
1.1. Hypothesen
- Wissenschaftliche Behauptungen in Form einer Hypothese bilden den Beginn einer Studie; Diese werden anhand
wissenschaftlichen Hintergrunds mit Fachbegriffen präzisiert, um daran die Menge der relevanten Variablen zu
definieren
- Für die Einführung in statistische Hypothesen werden einfache Mittelwertsvergleiche zwischen zwei Stichproben
herangezogen
- Es werden immer grundsätzlich, einander ausschließende Hypothesen definiert:
• 1. Nullhypothese
o „Negativhypothese“ die immer behauptet, dass es keine Mittelwertsunterschiede bzw. Zusammenhänge in der
Population gibt
o Auftretende Mittelwertsunterschiede bzw. Zusammenhänge werden als Zufall bei der Stichprobenziehung an-
genommen
o Abgekürzte Schreibform der Nullhypothese: 𝐻0
o Die Nullhypothese steht komplementär zur Alternativhypothese
• 2. Alternativhypothese
o „Positivhypothese“ die besagt, dass ein Unterschied/Zusammenhang in der Population existiert
o Die Alternativhypothese sollte aus einem Theoriegebäude, Vorstudien und der Literatur abgeleitet sein
o Abgekürzte Schreibform der Alternativhypothese: 𝐻1
- Die grundlegende Idee der Inferenzstatistik:
• Es gibt für ein untersuchtes Merkmal einen bestimmten Populationsmittelwert 𝜇𝑥
• Die Mittelwerte zufällig aus der Population gezogener Stichproben 𝑥̅𝑖 streuen um diesen Populationsmittelwert
o Begründet mit den zentralen Grenzwertsatz
o Hierdurch kann eine theoretische Verteilung der Kennwerte definiert werden
o Inferenzstatistische Aussagen sind unter der Voraussetzung der Gültigkeit der 𝐻0 möglich
• Sind zwei Stichprobenmittelwerte sehr ähnlich, ist es sehr wahrscheinlich, dass diese aus einer identischen Popu-
lation stammen
o Diese beiden Stichprobenmittelwerte sind gute Schätzer für den Populationsparameter 𝜇𝑥
1
, • Sind die Stichprobenmittelwerte sehr unterschiedlich, stammen diese möglicherweise nicht aus einer identischen
Population
o Je größer die Differenz zwischen den Stichprobenmittelwerten (𝑥̅1 und 𝑥̅2 ), desto unwahrscheinlicher, dass die
beiden Stichproben aus einer identischen Population stammen
• Mit Hilfe einer Wahrscheinlichkeitsverteilung kann die bedingte Wahrscheinlichkeit für die Differenz der Stich-
probenmittelwerte bei Gültigkeit der 𝐻0 (𝑝(Differenz|𝐻0)) berechnet werden
o Der Erwartungswert für diese Wahrscheinlichkeit liegt bei null
• Liegt diese berechnete Wahrscheinlichkeit 𝑝(Differenz|𝐻0 ) unter einem gewissen Grenzwert (𝛼-Niveau), so ist
die beobachtete Differenz nicht mit der Nullhypothese zu vereinbaren
o → Stichproben stammen nicht aus einer identischen Population, sondern wahrscheinlich aus zwei unterschied-
lichen Populationen, die sich statistisch bedeutsam (= signifikant) unterscheiden
- Unterscheidung zwischen ungerichteter und gerichteter Alternativhypothese
• Bei ungerichteten Alternativhypothesen
o Angabe, dass es lediglich einen Unterschied zwischen zwei Stichprobenennwerten gibt, wobei nicht festgelegt
wird, in welcher Stichprobe ein größerer Mittelwert erwartet wird
o Exploratives Vorgehen
• Bei gerichteten Alternativhypothesen
o Angabe der „Richtung“ eines Unterschieds zwischen Stichprobenkennwerten; Vor der Datenerhebung wird
bestimmt in welcher Stichprobe der höhere Mittelwert erwartet wird
o Theoriegeleitetes Vorgehen
- Formulierung von statistischen Hypothesen
• Definition der Standardformulierung
o Es sei 𝜇1 die mittlere (…) in der Population der (…) und es sei 𝜇2 die mittlere (…) in der Population der (…);
Dann gilt:
o 𝐻0 : 𝜇1 = 𝜇2 (Nullhypothese); und
o 𝐻1 : 𝜇1 ≠ 𝜇2 (ungerichtete Alternativhypothese) oder
o 𝐻1 : 𝜇1 < 𝜇2 (gerichtete Alternativhypothese) oder
o 𝐻1 : 𝜇1 > 𝜇2 (entgegengesetzte Alternativhypothese)
❖ bei einem α-Niveau von 5%
- Beispiel
• Es sei 𝜇1 die mittlere Reaktionszeit auf akustische Reize in der Population der Frauen und es sei 𝜇2 die mittlere
Reaktionszeit auf akustische Reize in der Population der Männer; Dann gilt:
o 𝐻0 : 𝜇1 = 𝜇2
o 𝐻1 : 𝜇1 ≠ 𝜇2 , bei einem α-Niveau von 5%.
• Bestimmung der Wahrscheinlichkeit für die Gültigkeit der Nullhypothese über die Differenz beider Stichproben-
mittelwerte (Reaktionszeiten der Frauen/Männer) → Ungerichtete Alternativhypothese (keine Definition welcher
der beiden Geschlechter im Mittel bessere Leistung erbringt)
• Bei einer gerichteten Alternativhypothese muss die statistische Hypothese folgendermaßen definiert werden:
o 𝐻0 : 𝜇1 ≥ 𝜇2
o 𝐻1 : 𝜇1 < 𝜇2
• Hier wird davon ausgegangen, dass Frauen im Mittel eine niedrigere (bessere) Reaktionszeit erreichen als Männer
2
,1.2. α-Niveau
- Definition
• Das α-Niveau legt in Abhängigkeit von Stichprobengröße und zu Grunde liegender theoretischer Verteilung eine
Fläche unter der Verteilungskurve → somit einen Grenzwert für ein Konfidenzintervall fest
• Liegt der empirisch ermittelte Kennwert einer erhobenen Stichprobe außerhalb dieses Intervalls, so wird die Null-
hypothese verworfen und die Alternativhypothese angenommen
o Es wird eine obere Grenze für den vom Untersucher tolerierten Fehler angegeben, bei dem eine Nullhypothese
fälschlicherweise abgelehnt wird
o Bei jeder inferenzstatistischen Auswertung besteht immer ein Restrisiko für eine Fehlentscheidung gegen eine
gültige Nullhypothese (α-Fehler) → Irrtumswahrscheinlichkeit bleibt erhalten und wird meist auf 5% festgelegt
• Liegt die Wahrscheinlichkeit für das Auftreten eines gefundenen oder eines größeren Mittelwertsunterschieds un-
ter der Bedingung der Nullhypothese unterhalb des α-Niveaus → = statistisch bedeutsamer (signifikanter) Unter-
schied
- Das α-Niveau muss immer vor der Untersuchung statistischer Auswertung festgelegt und bei den statistischen Hy-
pothesen erwähnt werden → nachträgliches Verändern der Höhe dieses Niveaus/Richtung der Hypothese ist nicht
zulässig
• Abbildung 1:
o Theoretische Verteilungskurve möglicher Stichprobenmittelwerte
o Verteilungskurve wird durch den Standardfehler definiert und nicht durch die Streuung, die Standardabwei-
chung des Merkmals
❖ Bei größer werdender Stichprobe und konstanter Merkmalsstreuung wird die Verteilungskurve immer schma-
ler
❖ Die Grenzen des Konfidenzintervalls rücken immer näher zusammen
• Abbildung 2:
o Grafische Darstellung des α-Niveaus; Untersuchung ob zwei Stichprobenmittelwerte 𝑥̅1 und 𝑥̅2 aus einer Po-
pulation mit den Mittelwert 𝜇 stammen
o Annahme 𝜇1 = 0: Die Differenz der beiden Stichprobenmittelwerte 𝑥̅1 und 𝑥̅2 müsste gleich null sein
❖ Wenn die Differenz der beiden Stichprobenmittelwerte (𝑥̅1 - 𝑥̅2 ) so gering ist, dass sie innerhalb des Annah-
mebereichs liegt, so unterscheiden sich die beiden Stichproben nicht signifikant und stammen aus einer iden-
tischen Population mit den Mittelwert 𝜇 → die 𝐻0 ist beizubehalten
❖ Liegt die Differenz der beiden Stichprobenparameter außerhalb des Beibehaltungsbereichs der Nullhypo-
these, so wird die 𝐻0 verworfen und die 𝐻1 angenommen
❖ Verteilung + α-Niveau bestimmt jene Grenze, die die maximale Mittelwertsdifferenz für die Aufrechterhal-
tung der Nullhypothese erlauben
• Abbildung 3:
o Die Form dieser Kurve der theoretischen Stichprobenkennwertverteilung ändert sich mit zunehmenden Stich-
probenumfang
❖ Mit zunehmenden Stichprobenumfang ändert sich die Streuung der Stichprobe nur geringfügig;
𝜎
❖ Der Standardfehler des Mittelwerts (𝜎𝑥̅ = 𝑁𝑥 ) wird durch die Vergrößerung der Stichprobe immer kleiner →
√
reduziert jenes Konfidenzintervall, das den Beibehaltungsbereich für die Nullhypothese definiert
o Bei großen Stichproben kann schon eine kleine Mittelwertsdifferenz signifikant (statistisch bedeutsam) werden
3
, 4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller ArminL. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $16.11. You're not tied to anything after your purchase.