100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Zusammenfassung Multivariate Data Analysis Prof. Sousa-Poza WS 2017/2018 $3.23
Add to cart

Summary

Zusammenfassung Multivariate Data Analysis Prof. Sousa-Poza WS 2017/2018

 346 views  0 purchase
  • Course
  • Institution
  • Book

Zusammenfassung der Grundlagenvorlesung Multivariate Data Analysis bei Prof. Sousa-Poza aus dem Wintersemester 2017/2018

Preview 3 out of 23  pages

  • Yes
  • December 2, 2018
  • 23
  • 2017/2018
  • Summary
avatar-seller
Einführung:
Measurement Scales:
Nicht-metrisch
Nominal: Die Größe der Zahl hängt nicht mit der Menge des gemessenen Merkmals
zusammen  Ausprägungen sind Namen oder Kategorien  können nur nach dem
Kriterium „gleich“ oder „ungleich“ geordnet werden  keine natürliche Rangfolge möglich
(z.B. Geschlecht)
Ordinal: größere Zahlen zeigen mehr (oder weniger) der gemessenen Eigenschaf ann aber
nicht wie viel (oder weniger) (z.B. Schulnoten)  es ist eine Rangfolge möglichn aber die
Abstände zwischen den Merkmalsausprägungen sind nicht interpreterbar  Unterschiede
zwischen den Werten haben keine Bedeutung/sind nicht vergleichbar
Metrisch
Interval: enthält ordinale Eigenschafen und die Abstände zwischen den
Merkmalsausprägungen sind interpreterbar/haben eine Bedeutung und sind vergleichbar
(e.g. Fahrenheit und Celsius Skala)  es gibt keinen natürlichen Nullpunkt

Rato: enthält Eigenschaten einer Intervallskala und es gibt einen natürlichen Nullpunkt (z.B.
Gewicht in kg)
Messfehler
 Gradn zu dem die beobachteten Werte nicht repräsentatv für den “wahren” Wert sind
 verzerrt beobachtete Beziehungen und macht multvariate Techniken weniger
aussagekräfig
Gründe:
 Ungenauigkeit der Messung
 Unfähigkeit der Befragten genaue Informatonen zu liefern
 Fehler in der Dateneingabe

Wichtge Merkmale der Messung:
Validity/Gültgkeit = Grad zu dem eine Messung genau das darstelltn was sie darstellen soll
Reliability/Zuverlässigkeit = Gradn zu dem der beobachtete Wert den “wahren” Wert misst
und somit fehlerfrei ist

H0 ist richtg H0 ist falsch
H0 kann nicht abgelehnt 1-α β- Fehler
werden richtge Entscheidung Fehler 2.Art
H0 ablehnen α- Fehler 1-β
Fehler 1.Art Power

,Fehler 1.Art (α Fehler): Wahrscheinlichkeit die Nullhypothese abzulehnenn obwohl sie richtg
ist  die Nullhypothese wird verworfenn d.h. es wird von einem statstsch signifkanten
Unterschied ausgegangenn obwohl in der Realität kein Unterschied besteht
Fehler 2.Art (β Fehler): Wahrscheinlichkeit die Nullhypothese nicht abzulehnenn obwohl sie
falsch ist  die Nullhypothese wird nicht verworfenn d.h. es kann nicht von einem statstsch
signifkanten Unterschied ausgegangen werdenn obwohl in der Realität ein Unterschied
besteht
Power (1-β): die Wahrscheinlichkeitn die Nullhypothese zu verwerfenn wenn sie falsch ist
 Wahrscheinlichkeit der korrekten Ablehnung der Nullhypothese  Wahrscheinlichkeitn
dass statstsche Signifkanz angezeigt wirdn wenn sie vorhanden ist
Fehler 1.Art und Fehler 2.Art sind umgekehrt proportonaln d.h. der Fehler 1.Art wird
restriktvern wenn die Wahrscheinlichkeit für einen Fehler 2.Art zunimmt
Eine Reduzierung des Fehlers 1.Art reduziert die power eines statstschen Tests
Power wird von 3 Faktoren beeinfusst:
1. Effekt Größe: das tatsächliche Ausmaß des interessierenden Effekts (z.B. Unterschied des
Durchschnitseinkommens zwischen Mann und Frau)
2. Alpha (α): Wenn alpha kleiner istn nimmt die power ab (typischerweise α = 0n05)
3. Stchprobengröße: Wenn die Stchprobengröße zunimmtn erhöht sich die power. Bei sehr
großen Stchproben können sogar sehr kleine Effekte statstsch signifkant seinn weshalb es
zu dem Problem der praktschen Signifkanz gegenüber der statstschen Signifkanz kommt
 strengere Signifkanzniveaus (z.B. 0n01 anstelle von 0n05) erfordern größere Stchprobenn
um das gewünschte Niveau an power zu erreichen
 power kann erhöht werdenn indem ein weniger strenges Signifkanzniveau gewählt wird
(z.B. 0n1 anstelle von 0n05)
 kleinere Effektgrößen erfordern immer größere Stchprobenn um die gewünschte power
zu erreichen
Statstcal vs. practcal signifcance:
There is statstcal signifcancen an arbitrary limit whereby an observed difference could
reasonably be assumed to be due to some factor other than pure chance.
Then there is practcal signifcancen an arbitrary limit whereby at observed difference is of
some practcal use in the real world.
 Mit größeren Stchproben nimmt die power eines Tests zun d.h. es ist wahrscheinlicher
das statstsche Signifkanz beobachtet wird. Die praktsche Signifkanz muss sich jedoch nicht
ändern

, Examining your data:
Missing Data: informaton not available for a subject (or case) about whom other
informaton is available. Typically occurs when respondent fails to answer one or more
questons in a survey.
 fehlende Daten reduzieren die für die Analyse verfügbare Stchprobengröße
 fehlende Daten können Ergebnisse verzerren

In general: 10 % random missings and 5 variables  only 40 % of sample remains if you want
to use all variables in a regression!!

 Missing data under 10% for an individual case or observaton can generally be ignoredn
except when the missing data occurs in a specifc nonrandom fashion (e.g. concentraton i a
specifc set of questonsn atriton at the end of the questonnairen etc.)
 the number of cases with no missing data must be sufcient for the selected analysis
technique if replacement values will not be substtuted (imputed) for the missing data
Missing at Random (MAR):
Missing values of Y depend on Xn but not on Y  the observed Y values represent a random
sample of the actual Y values for each value of Xn but the observed data for Y do not
necessarily represent a truly random sample of all Y values
Missing completely at Random (MCAR):
Missing values of Y are completely random  the observed values of Y are a random sample
of all Y values
 only MCAR is truly random!!!

Diagnostc test for randomness:
Partton your variable into 2 groups: missing and no missingsn then compare the averages of
these groups on other variables. Signifcant differences indicate the possibility of a non-
random missing data process.
Select the imputaton method:
Imputaton of a MCAR missing data process:
 using replacement values: Replacing missing values with estmated values based on
further informaton available in the sample (true imputaton)

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller snaimn. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $3.23. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

56326 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$3.23
  • (0)
Add to cart
Added