7 Tests und Vertrauensintervalle
Test:
Ein Test ist ein methodischer Versuch, mit dem festgestellt werden soll, ob Eigenschaften oder Leistung einer
Sache, eine Person oder einer Hypothese den Erwartungen entsprechen. Der Test unterscheidet sich vom
Experiment dadurch, dass es beim Test eine Erwartung gibt, die belegt oder widerlegt werden soll, während
das Ergebnis beim Experiment offen ist oder nur vermutet werden kann.
Mit Testung wird das Testen, das Getestetwerden bezeichnet, die Untersuchung eines Gegenstandes oder
Sachverhaltes, zum Beispiel auf Richtigkeit oder Funktionsfähigkeit.
Statistischer Test:
Ein statistischer Test dient in der Testtheorie, einem Teilgebiet der mathematischen Statistik, dazu, anhand
vorliegender Beobachtungen eine begründete Entscheidung über die Gültigkeit oder Ungültigkeit einer
Hypothese zu treffen. Formal ist ein Test also eine mathematische Funktion, die einem Beobachtungsergebnis
eine Entscheidung zuordnet. Da die vorhandenen Daten Realisierungen von Zufallsvariablen sind, lässt sich in
den meisten Fällen nicht mit Sicherheit sagen, ob eine Hypothese stimmt oder nicht. Man versucht daher, die
Wahrscheinlichkeit für Fehlerentscheidungen zu kontrollieren, was einem Test zu einem vorgegebenen
Signifikanzniveau entspricht. Aus diesem Grund spricht man auch von einem Hypothesentest oder einem
Signifikanztest.
Vertrauensintervall:
Ein Konfidenzintervall, kurz KI, (auch Vertrauensintervall, Vertrauensbereich oder Erwartungsbereich
genannt) ist in der Statistik ein Intervall, dass die Präzision (z. B. eines Mittelwerts) angeben soll. Das
Konfidenzintervall gibt den Bereich an, der mit einer gewissen Wahrscheinlichkeit (dem Konfidenzniveau) den
Parameter einer Verteilung einer Zufallsvariablen einschließt.
Wenn man ein Zufallsexperiment auf identische Art und Weise vielfach wiederholt, enthält das häufig
gewählte 95 %-Konfidenzintervall in 95 % aller Fälle den festen, unbekannten „wahren“ Parameter.
Die häufig anzutreffende Formulierung, dass der wahre Wert mit 95 % Wahrscheinlichkeit im aktuell
vorliegenden Konfidenzintervall liegt, ist streng genommen nicht korrekt, da der wahre Wert fix ist und sich
nicht stochastisch verhält. Korrekt wäre: der wahre Wert liegt für 95 % aller Stichproben in dem jeweils
berechneten Konfidenzintervall, denn die obere und untere Grenze des Konfidenzintervalls sind von der
vorliegenden Stichprobe abhängig und somit Zufallsvariablen, d. h. stochastisch. Eine alternative korrekte
Formulierung lautet: Bei der Berechnung eines Konfidenzintervalls umschließen dessen Intervallgrenzen in 95
% der Fälle den wahren Parameter und in 5 % der Fälle nicht. Das Konfidenzintervall ist so konstruiert, dass
der wahre Parameter 𝛽𝑗 mit der Wahrscheinlichkeit 1 − 𝛼 überdeckt wird, wenn das Schätzverfahren für viele
Stichproben wiederholt wird, wobei 𝛼 das sogenannte Irrtumsniveau ist.
Das Schätzen von Parametern mit Hilfe von Konfidenzintervallen wird Intervallschätzung genannt, die
entsprechende Schätzfunktion ein Bereichs- oder Intervallschätzer. Ein Vorteil gegenüber Punktschätzern ist,
dass man an einem Konfidenzintervall direkt die Signifikanz ablesen kann: ein für ein vorgegebenes
Konfidenzniveau breites Intervall weist auf einen geringen Stichprobenumfang oder auf eine starke Variabilität
in der Grundgesamtheit hin.
Abzugrenzen von Konfidenzintervallen sind Prognoseintervalle sowie Konfidenz- und Vorhersagebänder.
Autor: Student 7 Tests und Vertrauensintervalle Seite 1 von 37
,Verteilungsfunktion der Standardnormalverteilung wird im Folgenden mit 𝛷 bezeichnet; mit 𝜑
werden in diesem Kapitel Tests bezeichnet.
1. Definition 7.1 | Die Gamma-Funktion
∞
Die Gamma-Funktion ist für 𝑝 > 0 definiert als Γ(𝑝) ∶= ∫0 𝑒 −𝑥 𝑥 𝑝−1 𝑑𝑥.
Bemerkung 7.2 | Eigenschaften der Gamma-Funktion
Eigenschaften der Gamma-Funktion sind:
(i) Γ(𝑛 + 1) = 𝑛!, 𝑛 ∈ ℕ0 ,
(ii) Eigenschaft bzw. Fortsetzung der Gamma-Funktion für 𝒑 < 𝟎:
Diese Funktionalgleichung hier, Γ(𝑝 + 1) = 𝑝Γ(𝑝), −𝑝 ∉ ℕ0 , die können Sie für
negative Zahlen fortsetzen, solange es nicht eine negative ganze Zahl ist.
1
(iii) Γ (2) = √𝜋.
Weiterhin wissen wir aus Stochastik I, dass die Summe unabhängiger
Exponentialverteilungen gammaverteilt ist, und dass die Summe unabhängiger
Gammaverteilungen wieder gammaverteilt ist.
2. Definition 7.3 | Gammaverteilung – Γ(𝑝, 𝜆) | Absolutstetige
Zufallsvariable
Eine Zufallsvariable 𝑋 heißt Gamma-verteilt mit Parametern 𝜆 > 0 und 𝑝 > 0, wenn sie die folgende
Dichte besitzt:
𝜆𝑝
𝑓𝜆,𝑝 (𝑥) = 𝑒 −𝜆𝑥 𝑥 𝑝−1 𝟏𝑥>0 .
Γ(𝑝)
Wir schreiben 𝑋~Γ(𝑝, 𝜆).
Vorteile der Gammaverteilung:
Sehr flexibel durch zwei Parameter, erlaubt Modellierung sehr unterschiedlicher
Masseverteilungen mit einem Modell. Ein Parameter beschreibt Verhalten bei 0,
einer bei +∞.
Exponentialverteilung ist Spezialfall:
𝐸𝑥𝑝 (𝜆) = Γ(1, 𝜆).
Alle Momente existieren und können berechnet werden, Momenterzeugende
Funktion kann problemlos abgeleitet werden.
Viel kann berechnet werden.
Nachteil der Gammaverteilung:
Verteilungsfunktion nicht explizit.
Autor: Student 7 Tests und Vertrauensintervalle Seite 2 von 37
, Wichtige Charakteristiken der Gammaverteilung auf einen Blick:
Für 𝑝 > 0, (Masse bei 0).
Parameter
Für 𝜆 > 0, (Masse bei +∞).
Wertebereich (0, ∞)
Verteilungsfunktion nicht explizit
𝜆𝑝 𝑝−1 −𝜆𝑥
Dichte 𝑓𝑝,𝜆 (𝑥) = 𝟏0,∞ (𝑥) 𝑥 𝑒
Γ(𝑝)
Wenig Masse bei +∞ (Dichte fällt exponentiell).
Grobe Verteilung der Masse
Viel Masse bei 0 für 𝑝 < 1, wenig Masse bei 0 für 𝑝 > 0.
𝑝
Erwartungswert 𝔼[𝑋] =
𝜆
𝑝
Varianz 𝕍[𝑋] = 2
𝜆 𝑝
Momenterzeugende Funktion definiert für 𝑡 < 𝜆, 𝑀𝑋 (𝑡) = ( 𝜆 )
𝜆−𝑡
Autor: Student 7 Tests und Vertrauensintervalle Seite 3 von 37
, 7.1 Test
3. Beispiel 7.4 | Einführungsbeispiel
Wir wissen, dass
999+990+995+1003+1001+991
𝑋̅ = 6
= 996.50 < 1000.
Wir wählen wie folgt:
𝑯𝟎 : „Die durchschnittliche Füllmenge ist in Ordnung.“ D. h. 𝜇 + Kulanz ≥ 1 Liter.
𝑯𝟏 : „Die durchschnittliche Füllmenge ist nicht in Ordnung.“ D. h. 𝜇 < 1 Liter.
Die Nullhypothese 𝑯𝟎 ist immer so, dass wenn die Nullhypothese fälschlicherweise angenommen
wird, trotzdem „Business as usual“ weiter geht, und im Wesentlichen es keiner merkt. „Business as
usual“ steht für eine gewisse Konstanz und es steht für Alltag. „Business as usual“ ist auch Ausdruck
von Fokus und Widerstandsfähigkeit. Es steht dafür, dass ein Unternehmen oder eine Regierung stabil
ist, ihre Kernaufgaben kennt und sich nicht von einer Krise aus der Bahn werfen lässt. 𝑯𝟏 ist die
Gegenhypothese. Falsch wäre, wenn Sie 𝐻0 : 𝜇 < 1 Liter wählen! Vorsicht: Sie müssen immer
überprüfen, dass nichts Schlimmes passieren darf, wenn die Nullhypothese 𝐻0 nicht stimmt. Also Sie
sagen, mit 𝐻0 : 𝜇 < 1 Liter, weniger als ein Liter. D. h. Sie ziehen den vor Gericht und liegen dann
falsch. Da zu sagen, dass da nicht viel passieren wird, ist falsch. Passt nicht! Gerichtsverfahren sind
nicht gut. Das gibt Ärger. Also 𝐻0 : 𝜇 < 1 Liter dürfen Sie nicht nehmen! 𝐻0 : 𝜇 ≥ 1 Liter ist die richtige
Nullhypothese. Denn, wenn Sie 𝐻0 : 𝜇 ≥ 1 Liter fälschlicherweise annehmen, also „Die
durchschnittliche Füllmenge ist nicht in Ordnung.“, und Sie tun so als wäre die Füllmenge in Ordnung,
merkt es im Wesentlichen keiner. Die Firma ist zufrieden, Ihr Chef merkt es nicht. Der Einzige, der
vielleicht mal draufkommen könnte, sind irgendwelche Verbrauchervereine. Aber das ist hin, und
dass Sie da erwischt werden, dass Sie da ein Auge zugedrückt haben, das merkt keiner. Also 𝐻0 : 𝜇 ≥
1 Liter, das ist die richtige Nullhypothese!
Autor: Student 7 Tests und Vertrauensintervalle Seite 4 von 37