Was sind Daten ?
83 Mio Deutsche
.
Merkel
Angela
Alter in
Jahren
65 30
;
Skalen niveaus
nominal : Gleichheit o .
Ungleichheit Geschlecht
Ordinul :
Reihenfolge Polit Interesse
.
intervall : Abstände definiert /interpretierbar ,
kein natürlicher Nullpunkt Temperatur c. A- Hering .
Sy
ratio : Verhältnis zw . Messwerten interpretierbar, natürlicher Nullpunkt Stimmenanteil Kand Lebensalt
.
>
.
in Jahren
, Maßzahlen für Verteilungen: Lagemaße / Maße zentr . Tendenz
"
beziehen sich auf die zentrale Tendenz ( Mitte) der
Verteilung
>
„
arithmetische Mittel (E) metrisch
⑦ maximale Daten
nutzung
In {
E- arilh Mittel
E- ×;
.
)
✗i Wert (
Merkmalsausprägung
-
-
①
reagiert empfindlich ggü
i "
Epi Summe von i -1 über alle beobachteten Werte .
-
-
Ausreißern
Mittelwert / Durchschnitt Durchschnitt d. Menschen
•
=
Grundprinzip alle Werte aufsummieren durch Zahl der Fälle teilen
•
: +
geht ab Intervall Skalen niveau
•
-
durchschnitte beste
1 Variable kennen ist E
Prognose
◦
nur .
Median (E)
I. Werte erst ordnen
⑦
berücksichtigt alle Mess -
Werte
ungerade Fallzahlln ) : ☒ =
✗
NÄ {59,1-0117,18} ⑦ robust
gegen Ausreißern
F
+7++22+1-21,122,213,033,374,5 }
Fallzahlln )
gerade
-
:
£
Durchschnitts mensch
Mitte der
Verteilung teilt die
Beobachtungen genau große Hälften
-15040150%
• =
,
in 2
↳ z.B das Einkommen Durchschnittsperson nicht Durchschnittseinkommen
. ist er der
50% Quartil 0,25 Quartil unter dem Wert d. Person , % drüber
25% aller
Beobachtungen 7
•
-
:
-
:
Kia
0,75 Quartil 75% "
125% drüber
-
:
abordinal Skalen niveau
geht
• -
Modus ( ✗ no )
* no
{5,18^7,510,1818}
- -
-
⑤ direkt ablesbar
✗ -18 ①
berücksichtigt keine
-
no
die
Ausprägung häufigsten Ausreißer
=
vorkommt
•
,
am
für alle Skalen niveaus ( bei Intervall / Ratio wenig sinnvoll )
⊖ Information
geht wenig
•
nominal Modus
ordinal Modus a. Median
ab intervall ( Modus ) ,
Median arith Mittel .
,
wenig
sinnvoll
, Streuungsmaße metrisch
Bsp .
gibt 2 Variablen mit gl
: es .
arilh Mittel
.
→
verteilen sich
Wofür ?
weichen die
wie stark
Beobachtungen vom E ab ?
-
gibt es eine starke
Schwankung d
Beobachtungen ?
-
.
repräsentieren die Daten / ?
wie
gut unsere
Lagemaße Befragten
-
!
Streuung smaße basieren auf Abständen ab metrisches Skalenniveau !
→
Range / Spannweite
wie stark weicht der höchste Wert einer
Abstand zw Minimum Maximum der
Verteilung vom
geringsten ab ?
betrachteten Daten reihe
=
.
u .
✓= ✗ -
✗
max min ⊖
reagiert stark auf Ausreißer
↓
deshalb berechnet man dies mit dem Quarks abstand !
x n . a z # ; n . a s + - =z . r s .* + ; - )
Quartier
→
Ausreißer umgehen
% -
aua , µ :
„„
=
→ bestimmt nur den Index
qzj-xn.Q751-zxn.ci/-5+1lnlerquartilsabstand75o-
0,75%
-
Quart il : ✗
25% -
Quartil
Robuster Extremwerte
ggü .
betrachtet nur mittlere 50% der Daten
?⃝