,Grundbegriffe und Skalenniveaus
1 Untersuchungseinheiten und Grundgesamtheit
Untersuchungseinheiten:
• Objekte, über die Daten erhoben werden
(Bsp.: Individuen, Organisationen, Formen, Städte, etc.)
Grundgesamtheit:
• Menge aller Untersuchungseinheiten, über die eine Aussage getroffen werden soll. Die Grundgesamtheit (GG) ist vor
einer Untersuchung festzulegen — muss definiert sein
( Beispiel: Student*innen an der Goethe Universität; alle Personen mit deutscher Staatsbürgerschaft; alle Europäischen
Länder; alle erwachsenen Personen, die in Deutschland in einem Privathaushalt wohnen.
Teilgesamtheit/ Teilpopulation:
• Teilmenge der Grundgesamtheit
2 Stichprobe
Stichprobe (oder Auswahl/Sample) :
• Teilmenge der Grundgesamtheit, über die Daten gesammelt werden
• Stichprobe ist Immer kleiner als die Grundgesamtheit
• Übliches Vorgehen in den Sozialwissenschaften — typischerweise aus pragmatischen Gründen
(Beispiel: Wahlprognose auf Basis einer Stichprobe von 1000 Wähler)
• Außerhalb diese (Sozialwissenscahftlichen-) Anwendungsbereichs ist die Teilerhebung zwingen notwenig
(Beispiel: Crawltest bei PKWs)
ername
Stichprobe
1. definition der grundgesamtheit
2. ziehen der Grundgesamtheit
↓
-
3. Schlussfolgerung aus der Stichprobe auf die Grundgesamtheit
• sollen möglichst getreue Abbildungen der Grundgesamtheit darrstellen
• unverzerrte oder repräsentative Stichprobe: eine getreue Abbildung der GG
• eine unverzerrte Stichprobe am besten durch eine Zufallsstichprobe möglich
• verzerrte Stichprobe: wenn bestimmte Merkmale in der Stichprobe über- oder unterproportional vertraten sind
"Bewusste Auswahl-Verzerrte Stichprobe Bewusste Auswahl
möglich wenn die
nur
genaue
Anzahl der
Grundgesamtheit bekannt ist
3 Variablen / Merkmale
Merkmale/ Eigenschaften:
• werden von Untersuchungseinheiten aufgewiesen
Beispiel:
Individuen: Geschlecht, Alter, Körpergröße, Einkommen, höchster Bildungsabschluss
7
Nation: BIP, Sozialausgaben, Staatsform
7
Variable:
• eine statische Variable ist die nummerische Repräsentation eines Merkmals
Symbole: X,Y,, oder …
>
… bei sehr vielen Variablen X = X , X , X ,…, X ,
7
j 123m
wobei m die Zahl der (vorliegenden/ verwendeten) Variablen ist.
,4 Merkmalsausprägung und empirische Werte
• Variablen können mehrere Werte oder Ausprägungen annehmen
Merkmalsraum:
• Die Summe aller möglichen Ausprägungen einer Variablen
Symbole: a , b , mit j = 1, …, k
k : Zahl der jj
2
Ausprägung
2
• von den möglichen Merkmalsausprägungen werden die tatsächlich gemessenen Werte unterschieden
Beispiel: Die Variable Temperatur in °C kann Theoretisch Werte zwischen -273, 15 °C und ∞ °C annehmen, in einer
Temperaturmessung in drei Städten Deutschlands wurden die Werte 21,4°C, 22,5 °C und 22,8°C gemessen.
Symbole: x , y , z , oder …
2
i i
x ,x ,… i , x , mit i = 1, …, n
2i
n:19 Zahl der beobachteten
mi
2
Untersuchungseinheiten
>
m: Zahl der beobachteten/ verwendeten Variablen
2
5 Die Datenmatrix
Zeilen: Variable 1 Variable 2 ...
Variable m
• Untersuchungseinheiten (eine Zeile pro Untersuchungseinheit) Untersuchungs-
Spalten: einheit 1
• Variabeln (typischerweise eine Spalte pro Variable) Untersuchungs-
Zellen: einheit 2
• die beobachteten Werte Untersuchungs-
einheit N
5.1 Die Datenmatrix: Ein Beispiel
Sex
Name
Age Instrument . . .
Mick 88 vocals male
Keith 80 male
guitar
Charlie 82 drums male
Ron 76 male
guitar
5.2 Die Datenmatrix: Nummerische Kodierung
• Qualitative/ kategoriale Variablen werden Nummerisch kodiert
Codebook:
• gibt die Zuordnung von Merkmalen und nummerischen Werten an
Beispiel:
Instrument: 1= vocals, 2 = guitar, 3 = drums
Gender: 1 = female, 2 = male
Sex
Name
Age Instrument . . .
Mick 88 vocals male
Keith 80 male
guitar
Charlie 82 drums male
Ron 76 male
guitar
, i X
i ... mi
5.3 Datenmatrix - Abstrakte Darstellung - i
Zeilen: 1
411x21 . . .
Xm1
• Untersuchungseinheiten (eine Zeile pro Untersuchungseinheit) 2 *
12
* 22 . . .
Xmz
: :
Spalten:
• Variabeln (typischerweise eine Spalte pro Variable) M X1n X2n ...
Xmn
Zellen:
• die beobachteten Werte
Kurzübung 1
ID Geschlecht
gewählte Alter
Partei
1 weiblich Grüne 24 ~
Wörtern
String mit
ausgeschriebenen
2 männlich CDU 48
3 männlich SPD 51
-
b Codebook : Geschlecht : 1=männlich ;
2 =
weiblich
X1 *
ID z X3 Partei : 1 =
CDU : 2 =
SPD ; 3 = Linke 4 =
Grüne 5 = FDP
; ;
1 2 4 24
2 1 1 48
3 1 2 51
6 Diskrete und stetige Variablen
Diskrete Variable:
• können nur eine albzählbare Zahl von Ausprägungen annehmen (albzählbar unendlich oder endlich viele)
Beispiel:
Individuen: Schulnoten, Wohnort, Zahl der Kinder, Parteipräferenz
Nation, Zahl der Handelsverträge, Staatsform, Einwohnerzahl
Stetige Variable:
• können unendlich viele Werte innerhalb eines Intervalls annehmen, d.h. es gibt unendlich viele feine Abstufungen
Beispiele:
Individuen: Körpergröße, Körpertemperatur. Gewicht, Blutmenge
Nation. Fläsche, Durcchschnittstemperatur
7 Quantitative und Qualitative Variablen
Quantitative Variablen:
• erfassen Quantität (Ausmaß/Intensitäten).
• lassen sich immer der große nach ordnen
Beispiele:
Individuen: Einkommen, Zahl der Kinder, Schulnoten
Nationen: Bruttoinlandsprodukt (BIP), Sozialausgaben in % des BIP, Zahl der Olympiamedaillen
Qualitative Variablen:
• erfassen Qualität und keine Ausmaße
• haben keine inhärente Ordnung
Beispiele:
Individuen: Parteipräferenz, Augenfarbe, Lieblingsband
Nationen: Nachbarländer, Staatsform, Name des Staatsoberhauptes