Staatsexamen Psychologie
Pädagogisch-psychologische Diagnostik und Evaluation
Ein paar Worte vorab…
Auf der Suche nach einer geeigneten Zusammenfassung für die Vorbereitung auf das Psycho Staatsexamen
bin ich an meine Grenzen gekommen. Viele Zusammenfassungen hatten grundlegende und dramatische
Fehler, meines Erachtens einen unlogischen Aufbau und haben relevante Bereiche schlicht nicht
abgedeckt. Aus diesem Grund entschied ich mich dazu, meine eigene Zusammenfassung zu schreiben. Sie
basiert auf der offiziellen von der Universität Augsburg publizierten Literaturliste zur Examensvorbereitung
(was bestimmt über 30 Bücher sind), aber darüber hinaus auch Vorlesungsinhalte. An dieser
Zusammenfassung habe ich ein ganzes Jahr gearbeitet, um sie nun hier besten Gewissens auch
veröffentlichen zu können. Sie ist selbstverständlich nicht nur für Studierende der Uni Augsburg hilfreich.
Schließlich bearbeiten wir alle dieselben Aufgaben in Bayern.
Dies ist die einzige Zusammenfassung, mit der ich für mein Examen gelernt habe, und sie war mehr als
ausreichend dafür, dass ich eine 1,0 erzielen konnte. Das schaffst du bestimmt auch!
In dieser Zusammenfassung geht es ausschließlich um den Themenbereich pädagogisch-psychologische
Diagnostik und Evaluation. Falls du Interesse an den anderen beiden Themenbereichen laut LPO hast,
schau dich doch auf meinem Feed um!
Falls du über einzelne Bereiche genaueres nachlesen möchtest, habe ich dir zuletzt die Quellen angegeben.
In dem Sinne, viel Spaß mit meiner Zusammenfassung!
Inhalte
Pädagogisch-Psychologische Diagnostik und Evaluation
1. Methodenfragen pädagogischer Diagnostik
2. Schulleistungsdiagnostik
3. Entwicklungs-, Intelligenz- und Eignungsdiagnostik im Bildungswesen
4. Diagnostik sozialer und kognitiv-emotionaler Merkmale
5. Evaluation und Qualitätssicherung
6. Quellen
, PÄDAGOGISCH-PSYCHOLOGISCHE DIAGNOSTIK UND EVALUATION
1. METHODENFRAGEN PÄDAGOGISCHER DIAGNOSTIK
„Pädagogische Diagnostik umfasst alle diagnostischen Tätigkeiten, durch die bei einzelnen Lernenden und den
in einer Gruppe Lernenden Voraussetzungen und Bedingungen planmäßiger Lehr-Lernprozesse ermittelt,
Lernprozesse analysiert und Lernergebnisse festgestellt werden, um individuelles Lernen zu optimieren“
(Ingenkamp & Lissmann 2005)
Prozessmodell der diagnostischen Urteilsbildung
Aspekte diagnostischen Handelns
• Vergleich
▪ Mit früherem Verhalten des gleichen Menschen (individuelle Bezugsnorm)
▪ Mit dem Verhalten anderer Menschen (soziale Bezugsnorm)
▪ Mit Verhaltensbeschreibungen oder -standards (sachliche Bezugsnorm)
➔ Wenn unangemessene Vergleiche gewählt werden, kommt es zu Maßstabsfehlern
➔ Wenn wir keine eigenen früheren Beobachtungen und nur vage Beschreibungen besitzen, fällt es schwer,
den Ausprägungsgrad eines Verhaltens zu beurteilen (z.B. bei jungem L zu Beginn seiner Praxis)
• Analyse
▪ um Gründe für Abweichungen des Verhaltens erkennen zu können
• Prognose
▪ um auf Verhalten in anderen Situationen od. in der Zukunft schließen zu können
➔ S hat Addition bis 10 gelernt -> L muss prognostizieren, ob S auch im zweistelligen Bereich addieren kann
• Interpretation
▪ damit wir nach Gewichtung und Wertung der vorliegenden Information über Verhalten zu einem Urteil
kommen
➔ gesammelte Infos werden geordnet, kritisch beurteilt, gewichtet und zu einer wertenden Stellungnahme
zsm.gefasst
• Mitteilung und Wirkungskontrolle
▪ Zuletzt müssen wir anderen (S oder Eltern) unsere Verhaltensbeurteilung mitteilen, da wir mit dieser
Rückmeldung auch künftiges Verhalten beeinflussen wollen; die Wirkung dieser Mitteilung sollten wir
kontrollieren, um zu wissen, ob wir auch den gewünschten Erfolg erreichen
▪ Butler & Winne 1995: bedeutender Zsm.hang zw. selbstreguliertem Lernen und Feedback
▪ Lissmann 1987: S braucht Rückmeldung und wird in unters. Weise durch sie beeinglusst
Grundfragen des Messens und Skalierens in den Sozialwissenschaften
Messen ist die Bestimmung der Ausprägung einer Eigenschaft eines (Mess-) Objekts (Gegenstand, Ereignis,
Person. Situation, Beurteilungssachverhalt) und erfolgt durch eine Zuordnung von Zahlen zu Messobjekten
(Orth 1995)
, ➔ Zweck der Messung ist immer, Informationen über Merkmale von Objekten, Organismen, Ereignissen zu
erhalten; wir messen nicht das Objekt, sondern immer nur ein Attribut od. Merkmal des Objekts
➔ Ziel: Objekte mithilfe von Messdaten exakter und vergleichbarer zu beschreiben als ohne solche Daten (L
kann Gedichtvortrag eines L wörtlich beschreiben, aber fraglich, ob derjenige, der Beschreibung liest, mit
den Adverbien die gleiche Bedeutung verbindet
➔ Ziffern der Zensurenskala erleichtern den Vergleich (sofern sie die Realität angemessen abbilden)
➔ 4 Niveauebenen, auf denen Messungen stattfinden können:
keine Verwendung von Zahlen: nur Bestimmung,
ob vers. Objekte hinsichtlich eines Merkmals gleich
od. verschieden sind
Gleiche Skalenabstände; Nullpunkt willkürlich
gesetzt (z.B. Intelligenzquotient); keine
Proportionen
Aussagen über Proportionen mögl. (doppelt, halb
so groß, …), d.h. bei einem Skalenwert O ist auch
das gemessene Merkmal 0 (z.B. 0cm)
➔ Wissen über unters. Skalenniveaus
→ Grenzen, die den Möglichkeiten des Messens in der Päd. Diagnostik gezogen werden
→ Je nach Skalenniveau muss man andere Werte zur Kennzeichnung der zentralen Tendenz berechnen
(Nominalskala: Modalwert; Ordinal- oder Rangskala: Median; Intervall- und Verhältnisskala:
arithmetischer Mittelwert)
Gütekriterien
Qualität eines Messverfahrens (z.B. Test, Fragebogen, Beobachtungssystem etc.) lässt sich an den drei
Hauptgütekriterien festmachen:
• Objektivität: Ausmaß, in dem die Ergebnisse unabhängig vom Untersuchenden (z.B. Beobachter, Beurteiler,
Untersuchungsleiter) ist
▪ Ausschaltung subjektiver Einflüsse auf Seite der Prüfenden: vers. Untersucher kommen bei der Messung
desselben Merkmals zum gleichen Ergebnis
▪ Wenn man subjektive Einflüsse bei der Beurteilung des gleichen Tatbestands verringern will, muss man
möglichst viele übereinstimmende Arbeitsschritte im Beurteilungsvorgang festlegen:
1. Durchführungsobjektivität: Ergebnisse von Lernprozessen sollen von vers. Prüfern unter möglichst
gleichen Bedingungen erfasst werden (Vereinheitlichung der Aufgabenstellung, Bearbeitungszeit,
Erläuterungen der Aufgaben, zulässigen Hilfsmittel etc. -> Abitur)
2. Auswertungsobjektivität: verschiedene Auswerter sollen bei der Feststellung des gleichen Tatbestands
zu gleichen Ergebnissen kommen (Kriterien zur Beobachtung des geforderten Verhaltens!)
3. Interpretationsobjektivität: mehrere Beurteiler interpretieren das gleiche Auswertungsergebnis gleich
➔ Interpretation ist unabhängig davon, wer den Messwert interpretiert.
➔ Interpretation ist unabhängig davon, wessen Messwert interpretiert wird
➔ Interpretation ist unabhängig von der Zeit, dem Kontext und sonstigen äußeren Faktoren.
▪ Je unterschiedl. Die zu verarbeitenden Infos und je zahlreicher sie sind, desto schwieriger ist es, sie objektiv
(= unter Ausschaltung intersubjektiver Einflüsse) zu interpretieren (z.B. Einschulungsentscheidung)
▪ Objektivität ist Voraussetzung für Zuverlässigkeit und Gültigkeit einer Messung
, • Zuverlässigkeit / Reliabilität: Grad der Genauigkeit, mit dem das
geprüfte Merkmal gemessen wird
▪ Merkmal misst exakt das, was es messen soll, d.h. eine
wiederholte Messung des Gleichen erbringt gleiche Ergebnisse
▪ Perfekte Reliabilität: Test misst wahren Wert T ohne jeden
Messfehler E (gibt es in der Praxis nicht)
▪ Nur objektive Verfahren können zuverlässig sein und bei
Wiederholung der Messung gleiche Ergebnisse innerhalb gewisser
Toleranz erbringen, wenn man Übungseffekte ausschalten kann
▪ Bei der Zuverlässigkeit einer Messung im sozialwissenschaftl.
Bereich muss immer bedacht werden, dass die Messung nicht
zuverlässiger sein kann als die Stabilität des Merkmals (wenn ein Merkmal sehr labil ist (Stimmung) dann
kann eine Messung nicht so genau sein wie bei einem stabileren Merkmal (Rechtschreibkenntnisse))
▪ Grad der Zuverlässigkeit einer Messung wird durch den Zuverlässigkeits- oder Reliabilitätskoeffizienten
bestimmt (= gibt an, in welchem Maße unter gleichen Bedingungen gewonnenen Messwerte über ein und
denselben Probanden übereinstimmen, in welchem Maße also das Testergebnis reproduzierbar ist) (Lienert
& Raatz 1998)
▪ In vers. Methoden versucht man die „wahren“ und „verfälschten“ Anteile der Realibilitätsprüfung zu
schätzen:
o Wiederholungsmethode / Retestmethode: die gleichen Personen bearbeiten die gleichen Aufgaben zu
vers. Zeiten (selten bei Leistungsmessung, da Übungseffekt!)
o Halbierungsmethode: die nur einmal durchgeführte Aufgabenzusammenstellung wird halbiert und
getrennt ausgewertet; der Zusammenhang der Ergebnisse beider Testhälften wird wiederum berechnet
und gibt einen Hinweis auf die Halbierungszuverlässigkeit des Verfahrens
o Paralleltestmethode: 2 vers. Aufgabensammlungen, die inhaltlich mögl. so ähnlich wie Zwillinge sind;
beide Parallelformen kann man unmittelbar nacheinander od. zu vers. Gelegenheiten geben -> kein
Behaltenseffekt
• Gültigkeit / Validität: Fähigkeit des Verfahrens, das zu messen, was es zu messen vorgibt (Test misst, was er
messen soll)
▪ Gültigkeit setzt Objektivität und Zuverlässigkeit voraus
▪ Arten der Validität:
o Inhaltsvalidität (bei Schulleistungstests: Curriculare Validität = Lehrplan beschreibt thematisch, was
gelernt werden muss)
o Übereinstimmungsvalidität: wie weit stimmen die mit dem Untersuchungsinstrument gewonnenen
Resultate und die gleichzeitig vorliegenden, aber auf andere Weise gewonnenen Daten überein?
(Berechnung der Übereinstimmung zw. Ergebnissen des Rechentests und den in Form von Zensuren
gelichzeitig vorliegenden Schätzurteilen des L über die Rechenleistung des S)
o Vorhersagevalidität: Berechnung des Zsm.hangs zw. einem zu einem früheren Zeitpunkt ermittelten
Untersuchungsbefund und dem zu einem späteren Zeitpunkt ermittelten Kriteriumsverhalten (z.B.
gymnasialer Schulerfolg: Vorhersage zum Ende der GS-Zeit als Empfehlung; beim Abi wird Erfolg
festgestellt und der Zsm.hang mit den vers. Vorhersagedaten ermittelt)
o Konstruktvalidität: können mit dem Verfahren bereits abgesicherte theoretische Annahmen repliziert
werden?
▪ Kein Messinstrument ist allgemein gültig/valide, sondern immer nur in dem ermittelten Sinn (ein Mathetest
für die 2. Hälfte der 6.Kl. ist für andere Untersuchungszeiträume nicht gültig; eine Mathetest sagt nichts über
die Intelligenz aus; wenn ein Test sich an den Inhalten eines Lehrbuchs orientiert, ist seine Gültigkeit für S,
die mit anderen Büchern gelernt haben, unbewiesen)
• Weitere Gütekriterien / Nebengütekriterien (Lienert & Raatz 1998)
▪ Normierung eines Tests für die Einordnung des individuellen Testergebnisses in eine Bezugssystem
▪ Vergleichbarkeit eines Tests durch Parallelformen od. validitätsähnliche Tests
▪ Ökonomie = Durchführung und Auswertung braucht wenig Zeit und Material, ist unkompliziert und in
Gruppen anwendbar
▪ Nützlichkeit eines Tests = bei hohem praktischem Bedürfnis zur Untersuchung des Verhaltens und noch kein
od. nur wenige Verfahren für diesen Zweck vorliegen
▪ Zumutbarkeit = Ausmaß, in dem der Getestete zeitlich, psychisch, … beansprucht wird (Kubinger 1996)
▪ Unverfälschbarkeit = Eigenschaft von Tests, die den Getesteten bei der Antwort beeinflussen können (z.B.
suggestive Formulierungen, sozial erwünschte Antworten) (Kubinger 1996)