Zusammenfassung Statistik
Lektion 1: Einführung
1.1 Statistik in der Praxis und Grundbegriffe
Nutzen: - Faktendarstellung
- Datennutzung, um unternehmerischer Entscheidungen abzusichern
- Untersuchung von Zusammenhängen (Beobachtungen nachprüfbar bewerten)
-> Aus Informationsflut relevanten Datenanteil herausfiltern, zusammenfassen,
kondensieren, analysieren und mit vorhandenen Modellvorstellungen vergleichen
-> Statistik: - Beschäftigt sich mit mehreren Objekten, sodass zu verschiedenen Zeitpunkten
am selben Objekt unterschiedliche Beobachtungen auftreten können
-> Statistik: - Beschäftigt sich mit mehreren Objekten, sodass zu verschiedenen Zeitpunkten
am selben Objekt unterschiedliche Beobachtungen auftreten können
- spezialisierte Methoden und breite Anwendbarkeit
➔ Grundbegriffe
- Statistik: Statistik ist die Wissenschaft vom Sammeln, Darstellen, Aufbereiten
(beschreibende Statistik), Analysieren und Interpretieren (schließende/beurteilende)
von Fakten und Zahlen
Größe, die aus Grunddaten berechnet wurde:
— Grunddaten decken Grundgesamtheit ab (population statistic)
— Stichprobendaten (sample statistic) – zufällig -> Zufallsgröße (kann Anlass zu
Schlussfolgerungen geben)
— Zufallsgrößenberechnung lässt Wahrscheinlichkeitsverteilungsaussagen zu, womit
Hypothesen getestet werden können (test statistic/Prüfgröße)
Nach gemeinen- und Notlüge oft als dritte Lüge bezeichnet, da die nicht mögliche
Überprüfbarkeit angeblich ermittelter Zahlen, sowie die tendenziöse Darstellung
zutreffender Werte zur Täuschung missbraucht werden können ->Aussagekraft
hinterfragen
- Untersuchungseinheit: Das Objekt der Fragestellung
Auch. Untersuchungs-, Beobachtungseinheit, Merkmalsträger, (statistische) Einheit
bzw. Element
- Grundgesamtheit (Population): Menge der insgesamt interessierenden, gleichartigen
Untersuchungseinheiten. Sie sind genau definiert, müssen aber physisch (noch nicht)
existieren.
, - Stichprobe: Untermenge der Grundgesamtheit, bei deren Auswahl (ziehen der SP) der
Zufall die wesentliche Rolle spielt. Ist meist im Verhältnis zur GG klein
- Merkmal: Eine an der Untersuchungseinheit beobachtbare und für die Statistik
festzuhaltende Eigenschaft
- Merkmalsausprägung: bestimmter Wert eines Merkmals
- Beobachtung: Gesamtheit, der von uns in einer statistischen Untersuchung
ermittelten Merkmalsausprägungen einer Untersuchungseinheit (zB bei
Untersuchung von Personen die Ausprägung des Merkmals Größe)
1.2 Messniveau (Skalenniveau)
Merkmale können verschiedene Arten von Ausprägungen haben, wobei die
unterschiedlichen Eigenschaften der Merkmale in der Statistik mit dem Begriff Skalenniveau
oder Messniveau zusammengefasst werden.
Messniveau: Qualität der Messbarkeit selbst (nicht das Niveau der gem.
Merkmalsausprägung)
Beobachtungen von Merkmalen erfordert Skalenfestlegung, wobei man durch das Merkmal
nicht in der Ausführung gebunden ist (Bsp. Benennung des Merkmals – jedoch Ausrichtung
auf Verständlichkeit und Natürlichkeit - teilweise Konvention, teilweise natürlich gegeben).
→ Wichtige Klassifizierung von Skalen
- Numerisch/nicht numerisch: für weitergehende Analysemethoden mithilfe
arithmetischer Rechenoperationen
- Orientierung an Mächtigkeit der Skalentypen:
◼ Nominalskalen: Diese Merkmale lassen sich nicht in eine Reihenfolge bringen –
Einordnung in Klassen (zB Geschlecht)
◼ Ordinalskalen: Klasseneinteilung, aber die Merkmale lassen sich in eine
Reihenfolge bringen – nur Vergleiche keine Rechnungen möglich – zB Noten)
◼ Intervallskalen: Diese arbeitet mit reellen Zahlen. Rechenoperationen sind
möglich, aber kein natürlicher Nullpunkt (nur Add./Sub.) Bsp. Celsiusskala.
◼ Verhältnisskalen: Rechenoperationen sind ohne Einschränkung möglich, es
existiert ein natürlicher Nullpunkt. zB Gewicht
→ Metrische Skalen: Überbegriff für Intervallskalen und Verhältnisskalen
,→ Klassifizierung von Merkmalen(Daten):
Quantitativ (Beschreibung: wie viel?) / qualitativ (Beschreibung: wie?)
Skalentypen
1.3 Datenquellen und Datenanalyse mit dem Computer
Neben den bereits zuhauf verfügbaren Datenmengen gibt es einen noch größeren Hunger
nach Daten, sodass neben den verfügbaren Datensammlungen zusätzliches Datenmaterial
erhoben wird.
Grenzen der Datenerhebung:
- wirtschaftliche Überlegungen (Kosten/Nutzen)
- abnehmende Bereitschaft, Daten preiszugeben
- rechtliche Einschränkungen (weshalb das stat. BA ein Gesetz zur Durchführung
braucht)
Datenquellen:
, - Datensammlung von Unternehmen (wenn Daten technisch/geschäftlich) nützlich. Die
normalen Datenbanken eignen sich weniger, da nicht das Ziel der
Informationsverarbeitung zur Betriebsunterstützung besteht (welche Schnelligkeit,
Aktualität und Parallelbenutzbarkeit bedarf)
- Statistische Datensammlung (Data Warehouse): historische Daten und vielfältige
Auswertungsmöglichkeiten
➔ Datenanalyse mit dem Computer
Taschenrechner, Excel, Statistikprogramme (komm. zB SAS, SPSS;, priv. zB R und OpenData)