Personalwesen - Einführung – Zusammenfassung
Lektion 1 – Einführung
1.1 Gegenstand der Statistik
Statistik = Zsmstellung von Daten, Ziel: bestimmte Phänomene und Entwicklungen beschreiben
Wissenschaftl. Statistik: Erfassung, Aufbereitung u. Analyse von Daten
3 Bereiche:
beschreibende (deskriptive) Statistik: Beschreibung von Daten ohne Verallgemeinerung,
Auswertungsmethoden z. B. Häufigkeitsverteilung, nur für zugrundeliegende Daten gültig
schließende (inferentielle, induktive) Statistik (Inferenzstatistik): Herleitung von allg. gültigen Aussagen
z. B. Intervallschätzung, dadurch Allgemeingültigkeit durch Stichprobe
Wahrscheinlichkeitsrechnung: Verallgemeinerung = Wahrscheinlichkeitsaussage, keine absolute Bestimmtheit
1.2 Grundbegriffe der Statistik
Merkmalsträger (statistische Einheit): „xj (j=Zahl, Laufindez)“, Informationsträger
Grundgesamtheit (Population, statistische Masse): gesamte Menge aller Merkmalsträger
Merkmal: Informationen/Eigenschaften, die erhoben werden sollen, bezeichnet mit lat. Großbuchstaben
Beobachtungswerte „n“: Ergebnisse, die für Merkmal tatsächlich beobachtet werden können
Merkmalsausprägungen „m“: theoretische Werte/Kategorien die Merkmal annehmen kann
3 Merkmalsarten:
Qualitative Merkmale: keine natürliche Reihenfolge z. B. Geschlecht, Beruf, Nominaskala, darf keine Zahl sein
Komparative Merkmale: natürliche Reihenfolge z. B. Noten, Ordinalskala, Abstände nicht interpretierbar
Quantitative Merkmale: natürliche Reihenfolge, Abstände interpretierbar, Zahlen/Größenwerte
Skalen:
Intervallskala: kein natürlicher Nullpunkt, Verhältnis zw. Merkmalsausprägungen nicht interpretierbar
z. B. Kundenbewertung 1 – 5 Sterne, Temperatur da Nullpunkt 0°C willkürlich festgelegt, aber nicht bei Kelvin!
Verhältnisskala (Proportionalskala): natürlich Nullpunkt, Verhältnisse interpretierbar
z. B. Umsatz 0 € (natürlicher Nullpunkt), dann 20 €
weitere Merkmale:
diskret: abzählbare Merkmalsausprägungen, endlich, alles menschengemachte z. B. Würfel
stetig: überabzählbare Merkmalsausprägungen, unendlich, nicht zählbar z. B. Gewicht 7,5, 7,51, 7,511
1.3 Ablauf statistischer Untersuchungen
5 Phasen:
1. Planung – benötigte Info´s?
2. Datenerhebung – Unterscheidung Primärerhebung (Erstdaten) z. B. Befragungen, Beobachtungen
-> Sonderform Panel: selben Merkmalsträger, regelmäßige Befragung
Sekundärerhebung (vorhandene Daten), Datenquellen: Eurostat, BfA
3. Datenaufbereitung – Ordnung u. Zsmführung, Prüfung auf Vollständigkeit u. Plausibilität, Digitalisierung
4. Datenanalyse – Auswertung durch Anwendung des statistischen Instrumentariums
5. Interpretation u. Dokumentation – der statistischen Analyse
1
, Lektion 2 – Auswertungsmethoden eindimensionaler Daten
durch
1. Erstellung einer Häufigkeitsverteilung
2. Beschreibung der Daten anhand von Lagemaßen
3. Beschreibung der Daten anhand von Streuungsmaßnahmen
= Auswertung von eindimensionalen Daten, weil nur 1 Merkmal analysiert wird
2.1 Häufigkeitsverteilungen
= grafische/tabellarische Darstellung der absoluten bzw. relativen Häufigkeiten
Absolute Häufigkeit „h(xj)“: wie häufig eine bestimmte Merkmalsausprägung vorkommt z. B. Mitarbeiter in Abt.
Relative Häufigkeit: Anteil aller Beobachtungswerte z. B. 12 % der Mitarbeiter in Verwaltung
Kumuliert: Summe
Berechnungen von kumulierte absolute Häufigkeit „H (xj)“ und kumulierte relative Häufigkeit „F (xj)“:
z. B. 9 von 25 Mitarbeiter haben entweder %-Anteil der kumulierte absolute Häufigkeit
Mittlere Reife oder Abitur = MR(3) + Abi(6) = 9 (MR+Abi) / 25 Mitarbeiter
Klassenmitte: Wert, der in Mitte der Klasse liegt z. B. [300-500[ = 400
Klassenbreite: Differenz zw. oberer u. unterer Klassengrenze z. B. [300-500[ = 200
Einpunkt-Verteilung: aus Beobachtungswerten wird nur Klassenmitte für Darstellung ausgewählt z. B. [3-5[ = 4,
-> Säulendiagramm Histogramm
Rechteck-Verteilung: Beobachtungswerte verteilen sich gleichmäßig über
gesamte Klassenbreite, Darstellung als Rechteck (Histogramm),
Höhe des Rechtecks = relative Häufigkeit / Klassenbreite
2.2 Lagemaße = (zentrale) Lage einer Verteilung
Mittelwert ⌀: einzelne Beobachtungswerte summieren z. B. 2+3+1 = 6 = 2
Gesamtanzahl der Beobachtungswerte 3 3
Alternativ: gewichteter Mittelwert:
Alternativ: gewichtete relative Häufigkeit:
Ausreißer: Beobachtungswerte, die „aus der Reihe tanzen“, Wert der Durchschnittswert verzerrt
Mittelwert bei klassischen Daten: ursprüngliche Beobachtungswerte nicht mehr vorhanden/erkennbar, zur
Berechnung wird Annahme der Rechteck-Verteilung verwendet,
anstelle Merkmalsausprägungen xj die Klassenmitte xj*
Modus „xmod“ (Modalwert, dichtester Wert): am häufigsten beobachtet Wert, Unempfindliche gg. Ausreißer
Median (Zentralwert) „xmed“: Beobachtungswert, der genau in der Mitte liegt
zwingend notwendig Beobachtungswert zu ordnen
Statistische Maßzahlen (Kennzahlen): Beschreibung mit nur einem bestimmten Wert
2.3 Streuungsmaße = Beschreibung der Streuung der Daten, Unterschiedlichkeit der Daten
Varianz „s2“: Streuung der Daten um Mittelwert, quadrierte Zahl, vor Interpretation muss √ gezogen werden
Berechnung: Beobachtungswerten xi - Mittelwert x̅ = Ergebnis²
anschließend alle Ergebnisse aufsummiert / Anzahl der Beobachtungen
Standardabweichung „s“: durchschnittliche Abweichung der Beobachtungswerte vom Mittelwert
Je höher die Standardabweichung, desto höher die Streuung bei identischen Mittelwert
Berechnung: Wurzel der Varianz
oder Berechnung der Varianz auf Basis der absoluten (u. relativen) Häufigkeiten:
Merkmalsausprägung xj – Mittelwert x̅ = Ergebnis² x absolute Häufigkeit = Ergebnis h(xJ)(xj- x̅)²
Summe aller Ergebnisse / Summe aller „absoluten Häufigkeiten“ = Varianz √ = Standardabweichung
mittlere absolute Abweichung (MAD): summierte absolute Differenz der Beobachtungswerte zum Mittelwert
Berechnung: Beobachtungswerten xi - Mittelwert x̅ = Ergebnis (Neg. Werte werden durch Absolutbetrag zu
positiven Werten), Ergebnis / Anzahl der Beobachtungswerte = MAD
Spannweite “R“ (range): Differenz zw. maximalen u. minimalen Beobachtungswert
2