Basistext 1 - Einführung
Entscheidung für: Tatsächlich gilt:
- Beurteilungsaufgabe à pädagogisch-psychologische & diagnostische Merkmal vorhanden Merkmal nicht
Kompetenzen (geeignet für Gym) vorhanden (nicht
- Lernvoraussetzungen & Lernprozesse diagnostizieren; fördern; beraten geeignet für Gym)
- Leistungen erfassen Merkmal vorhanden Richtige Entscheidung Falsche Entscheidung
- Kenntnisse über: Merkmal nicht vorhanden Falsche Entscheidung Richtige Entscheidung
Die Bedeutung von Unterschiedliche Formen der
Lernvoraussetzungen für das Lernen Leistungsbeurteilung
Formen von Hoch- & Bezugssysteme der Leistungsbeurteilung mit Vor- &
Sonderbegabungen Nachteilen
Grundlagen der Lerndiagnostik Prinzipien & Ansätze der Beratung
Prinzipien der Rückmeldung von Leistungsbeurteilung
Pädagogische Diagnostik (Ingenkamp & Lissmann, 2008)
- Pädagogische Diagnostik umfasst alle diagnostischen Tätigkeiten, durch die
Voraussetzungen und Bedingungen planmäßiger Lehr- und Lernprozesse ermittelt
werden, Lernprozesse analysiert werden und Lernergebnisse festgestellt werden, um
individuelles Lernen zu optimieren.
- Tätigkeiten, die…
à Zuweisung zu Lerngruppen oder zu individuellen Förderungsprogrammen
Basistext 2 – Skalenniveau von Schulnoten
ermöglichen; die mehr gesellschaftlich verankerten Aufgaben der Steuerung des
Bildungsnachwuchses oder der Erteilung von Qualifikationen zum Ziel haben.
Messen - 3 Definitionen:
- 3 Bereiche: Leistungsdiagnose, Lerndiagnose, Aufgabendiagnose
- (Diehl & Kohr): Zuordnen von Zahlen zu Objekten oder Ereignissen nach bestimmten
- Was sind diagnostische Aufgabenstellungen?
Regeln
à Feststellung von Lernvoraussetzungen; Abklärung von Ursachen,
- (Wirtz & Nachtigal): den Ausprägungsgrad bestimmter Merkmale von Objekten
Überwachung & Beurteilung des Lehr-Lern-Prozesses; Ermittlung & Bewertung
(empirisches Relativ) durch die Angabe von Zahlen (numerisches Relativ) so
von Lernergebnissen
repräsentieren, dass bestimmte mathematische Vergleiche oder Operationen im
Zahlensystem Aussagen über die tatsächlichen Verhältnisse im Merkmalsbereich
- Statusdiagnostik = Erfassung & Messung von relativ stabilen Personenmerkmalen ermöglichen
(z.B. Intelligenz) zu einem Zeitpunkt (Ist-Zustand)
- (Fischer): Das Wesen der Messung ist die Abbildung einer Menge vorgegebener
- Prozessdiagnostik = Verläufe & Veränderungen von Personenmerkmalen; erfordert
Objekte und der zwischen ihnen empirisch feststellbaren Relationen auf eine Menge
wiederholte Messung von sich verändernden Zuständen von Zahlen und den Relationen zwischen ihnen
- Modifikationsstrategie = die Person oder die Umwelt anpassen/modifizieren - Das empirische Relativ = eine Menge von Objekten & den Beziehungen zwischen
- Selektionsstrategie = Personen oder Umwelt auswählen diesen untereinander; es wird nur ein bestimmter Teilbereich (spezifische Merkmale)
betrachtet; sollte auch durch eine Messung nicht verändert werden
- Umweltselektion: Person entschiedet sich für einen bestimmten Beruf - Das numerische Relativ = eine Menge reeller Zahlen & den Beziehungen zwischen
- Personenselektion: Person bewirbt sich & wird von der Firma unter mehreren ihnen; die Zahlen repräsentieren die Beziehung zwischen den Objektmerkmalen in
Bewerbern ausgewählt einer angemessenen Weise à die Beziehungen zwischen den Zahlen müssen den
- Personenmodifikation: In der Ausbildung werden Fertigkeiten vermittelt Beziehungen zwischen den Objekten entsprechen
- Umweltmodifikation: Bildungssystem wird wegen Evaluationsergebnissen verändert - Homomorphe Art von Messung = Noten 1-6; 30 Kinder in einer Klasse; jedem Objekt
- Prognose = Vorhersage über zu erwartende Effekte von handlungsalternativen (Kind) entspricht eine Zahl, aber nicht jede Zahl entspricht eindeutig einem Objekt
à können nie 100% korrekt sein; Übergangsempfehlungen = Prognosen (Kind)
1
,- keine Messung wenn Zuordnung des e. Relativs zum n. Relativ zufällig/fehlerhaft ist! - Absoluter Nullpunkt vorhanden (0€, 0 kg)
- Kommen in der Psychologie nicht vor! (Kompetenzen/Persönlichkeit/Interessen
messen geht auf dieser Skala nicht)
Positionen in Bezug auf Noten:
a) Noten – als Ausdruck von Leistung – sind gar nicht vergleichbar.
b) Noten sagen zumindest etwas über die Rangfolge in den Leistungen aus.
c) Abstände zwischen den Noten entsprechen den Abständen zwischen den
Leistungen.
Studie von Ingenkamp (1968): stellen Schulnoten als Ausdruck von Schulleistungen
überhaupt sinnvolle Messungen dar?
Bekannte Skalen: Geschwindigkeit, Länge, Geschlecht, Gewicht - Untersuchte die Vergleichbarkeit von Noten aus verschiedenen 6. Klassen in einem
Bekannte Messinstrumente: Fieberthermometer, Uhr, Lineal Berliner Bezirk
- 1250 SuS untersucht (37 Klassen); standardisierter Mathetest = gleiche Aufgaben;
NOMINALSKALA curricular valide; Lehrer wurden vorab gefragt ob sie die in dem Test enthaltenen
- Erlaubte Operationen: Gleichheit & Verschiedenheit, Kategorienbildung, Aufgabenformate durchgenommen hätten à das bejahten sie
Kategorienhäufigkeit - Y-Achse = die erreichten Punkte der Lernenden; X-Achse= die Klassen 1-37. Jeder
- Beispiele: Automarken, Haarfarbe, Nationalität Strich zeigt die Notengrenzen in der jeweiligen Klasse
- Kategorien kann man nicht ordnen (Geschlecht ist entweder w, m oder d)
- Ein höherer Wert ≠ diese Kategorie ist besser ist als eine andere
RANGSKALA/ORDINALSKALA
- Erlaubte Operationen: Rangreihenfolge, Ordnung anhand der Größe ihrer
Merkmalsausprägung
- Beispiele: Warteliste, militärische Ränge, Tennisweltrangliste
- Rangreihenfolge vom ersten bis zum letzten Platz
- Aussagen über die exakten Abstände nicht möglich
- Bei Wartemarken im Büro kann ich zwar erkennen, dass noch 5 Personen vor mir sind,
aber ich weiß nicht, wie lange sie brauchen werden
INTERVALLSKALA
- Erlaubte Operationen: Rangreihenfolge, Abstände der Merkmalsausprägungen,
Addieren/Subtrahieren; Mittelwert
- Beispiele: Intelligenzskala, Grad Celsius
- Unterschied/Intervall zwischen den 2 Messpunkten ist über die gesamte Skala gleich
- nicht möglich, einen absoluten Nullpunkt festzustellen (vgl. Nullpunkt für
Intelligenz/Wissen à geht nicht!) Deutung:
- es liegt ein Rangskalen-Niveau vor à höhere Matheleistungen = bessere Noten
RATIONALSKALA/VERHÄLTNISSKALA - aber: bei einer Leistung von 30 Pkt. im Test die Noten in den Kl. sehr deutlich
- Erlaubte Operationen: Rangreihenfolgen, Abstände der Merkmalsausprägungen von variieren à Schüler in klasse 1 erhielt bei 30 Punkten die Note 5/6; während SuS in
Objekten & deren Verhältnis (Proportion) zueinander, alle statistischen Operationen Kl. 34 mit 30 Pkt. die Note 2 bekommen hat. SuS der Kl. 21 müssen deutlich mehr
- Beispiele: Längenmessungen, Gewicht, Preis leisten
2
, - bei Kl. 35 sehen wir sogar, dass das Rangskalen-Niveau nicht erfüllt ist. Mindestens b) Auswertungsobjektivität = gleiche Leistung werden mit den gleichen Punkteanzahl
ein Schüler bekommt die Note 3, obwohl sein Testwert höher liegt als bei anderen, die angegeben; keine Unterschiede zwischen verschiedenen Auswertern
von dem Lehrer die Note 2 erhalten haben à ist aber nur bei einer von den 37 Kl. der à Bei Ankreuzaufgaben ist es einfach, schwieriger bei Aufsätzen
Fall, also können wir annehmen, dass das Rangskalen-Niveau da ist à Lösungsschlüssel, klare Kriterien, Kompetenzstufen
- Gute Nachricht: innerhalb der Klasse hohe Korrelation von Testergebnis & Note à c) Interpretationsobjektivität = das Maß, in dem unterschiedliche Beurteiler bei ein und
Lehrer können die Leistungs-Reihenfolge ihrer Sus ziemlich gut einschätzen demselben Testergebnis daraus dieselben Schlüsse ziehen. Ist dieser Wert excellent
- Schlechte Nachricht: über die Klasse hinweg keine korrekte Einordnung (Korrelation oder nur sehr gut?
ist nicht gegeben) à Bezugsnormen (was wird mit dem Ergebnis gemacht?)
- Interpretation: Lehrer orientieren sich bei ihrer Benotung stark am jeweiligen
klasseninternen Bezugssystem à es hängt von der zufälligen Klassenzugehörigkeit ab, RELIABILITÄT = das Ausmaß der Genauigkeit einer Messung; dabei unwichtig, ob wir
welche Note man bekommt und nicht von den objektiv erfassten Leistungen wirklich das messen, was wir messen wollen
- Verschiedene Messungen desselben Objekts mit demselben Messinstrument sollten
stets dasselbe Messergebnis erbringen
Korrelation = Maß für die Beziehung zwischen 2 Variablen. Gibt die Stärke des a) Retest-Reliabilität = denselben Personen wird derselbe Test wenigstens 2 Mal
Zusammenhangs zwischen 2 Merkmalen an à Korrelation = rxy ; Werte zwischen -1 & +1 vorgelegt, dann werden die Test-Werte korreliert. Beide Werte sollten sich dabei
- Positive Korrelation: hoher Wert bei X = hoher Wert bei Y möglichst wenig unterschieden, sodass eine hohe Korrelation angenommen
- Negative Korrelation: hoher Wert bei X = niedriger Wert bei Y werden kann
- Null-Korrelation: Y unabhängig von X à im pädagogischen Kontext Probleme, weil Lerneffekte könnten bei einer
- r=0.1à geringe Korrelation; r = 0.3à mittlere Korrelation; r = 0.5à hohe Korrelation wiederholten Messung auftreten
b) Paralleltest-Reliabilität = ein Test wird in zwei Parallelformen entwickelt, die
ähnliche, aber nicht die gelichen Aufgaben enthalten (Test Version A und B)
à Schwierigkeit der Aufgaben muss äquivalent sein
c) Halbierungs-Reliabilität = Aufgaben eines Tests werden in 2 Hälften geteilt
à Ergebnisse in Teil 1 und 2 sollten bei einer guten Messpräzision ähnliche
Ergebnisse liefern
VALIDITÄT = Misst der Test wirklich, was er messen soll?
- Misst der Lateintest wirklich das Lateinkönnen oder fragt es nach den
Rechenkenntnissen?
a) Inhaltsvalidität = wie repräsentativ sind die Items eines Tests für das zu messende
Merkmal?
à Mathelehrer sucht Aufgaben, die auch wirklich das Wissen der letzten
Unterrichtsreihe Bruchrechnung abprüfen
b) Kriteriums-Validität (Übereinstimmungsvalidität) = Zusammenhang zwischen
einem Testergebnis & konkreten Leistungen außerhalb der Testsituation
à Korrelation zwischen Mathetestnote & Intelligenztestergebnis
c) Vorhersagevalidität = Übereinstimmung zwischen einem Testwert & einem
OJEKTIVITÄT = wenn das Ergebnis der Messung unabhängig von dem Messenden ist à Kriteriumswert, der zu einem deutlich späteren Zeitpunkt gemessen wird
wenn also 2 Lehrer mit der gleichen Aufgabe die Leistung eines Schülers messen, sollte sie d) Konstrukt-Validität = ein bestimmtes theoretischen Konstrukt wird erfasst
bei beiden gleich bewertet werden o Konvergente Validität = verschiedene Tests liefern ähnliche Ergebnisse
a) Durchführungsobjektivität = Ergebnisse sind unabhängig von o Divergente Validität = verschiedene Tests zeigen Unterschiede zu
zufälligen/systematischen Verhaltensvariationen des Untersuchers/der Ergebnissen aus Testverfahren, die andere Konstrukte messen
Untersuchungssituation während der Erhebung; Standardisierung der Instruktion & der
Erarbeitungszeit, Erläuterungen der Aufgaben sowie der zulässigen Hilfsmittel
3