CoboCards App FAQ & Wünsche Feedback
Sprache: Deutsch Sprache
Kostenlos registrieren  Login

Hol' Dir diese Lernkarten, lerne & bestehe Prüfungen. Kostenlos! Auch auf iPhone/Android!

E-Mail eingeben: und Kartensatz kostenlos importieren.  
Und Los!
Alle Oberthemen / Psychologie / Psychologische Diagnostik

VO Rahmenbedingungen Psychologisches Diagnostizieren (119 Karten)

Sag Danke
56
Kartenlink
0
Was ist der einfachste Verrechnungsmodus (Methode der Skalierung)? Welche Bedingung muss gelten, damit dieser Verrechnungsmodus fair ist?
Der einfachste Verrechnungsmodus sieht als Testkennwert die Anzahl gelöster Aufgaben vor. Das heißt, ungeachtet dessen, welche Aufgaben von einer Tp gelöst und welche nicht gelöst werden, zählen nur die "Treffer".

Fischer gibt dazu einen Beweis, wonach das (dichotome) logistische Testmodell von Georg Rasch - Rasch-Modell - notwendigerweise gelten muss, damit dieser Verrechnungsmodus fair ist.

Das Rasch-Modell beschreibt die Wahrscheinlichkeit, dass Tp Item löst (+), in Abhängigkeit des Personenparameters , das ist die (wahre) Fähigkeit von , und des Itemparameters , das ist die (wahre) Schwierigkeit von :


Weil sich dieses Modell als im statistischen Sinn stichprobenunabhängig herausstellt, kann auch ein besonderer Modelltest abgeleitet werden - somit muss es nie ungeprüft vorausgesetzt werden.
Tags: Rasch-Modell, Skalierung, Stichprobenunabhängig
Quelle: S88
58
Kartenlink
0
Inwiefern ist das Rasch-Modell stichprobenunabhängig?
Im Gegensatz zu anderen testtheoretischen Modellen erfüllt das Rasch-Modell" einen besonderen wissenschaftstheoretischen Ansatz, nämlich den sog. "spezifisch objektive" Vergleiche zu ermöglichen:
Den Unterschied in den Fähigkeiten und zwischen je zwei Personen und kann unabhängig davon bestimmt werden, welche Aufgaben des Tests herangezogen werden; bzw. umgekehrt und wichtiger, der Vergleich je zweier Aufgaben und bezüglich und ist unabhängig davon mögliche, welche Stichprobe dafür verwendet wird.
Das heißt, die Schätzung der Parameter sind insofern stichprobenunabhängig, als die Wahl der Stichprobe aus einer bestimmten Population für die statistische Interferenz dieser Parameter keine Rolle spielt.

Diese Tatsache kann für den Spezialfall eines Tests mit nur zwei Aufgaben leicht bewiesen werden, und zwar ausgehend vom zitierten Beweis, wonach bei Geltung des Rasch-Modells die Anzahl gelöster Aufgaben (S) einen fairen Testkennwert darstellt.
Stellt sich dementsprechend einmal empirisch heraus, dass (abgesehen von zufallsbedingten Variationen) die Differenz von Stichprobe zu Stichprobe verschieden ist, so stünde das in Widerspruch zu der abgeleiteten Konsequenz des Rasch-Modells; was heißt: Das Rasch-Modell kann nicht gelten - folglich wäre die zur Diskussion stehende Verrechnung nicht fair.
Tags: Rasch-Modell, stichprobenunabhängig
Quelle: S89
59
Kartenlink
0
Wie kann die Geltung des Rasch-Modells geprüft werden?
Soll nun ein Test tatsächlich auf Geltung des Rasch-Modells geprüft werden, dann können dazu pro Aufgabe die zweifach, an Hand von zwei Personen-Teilstichproben modellgemäß geschätzten Itemparameter miteinander verglichen werden (indem eigentlich nur Parameterdifferenzen zu schätzen sind, muss zuvor ein Maßstab willkürlich festgelegt werden, z.B. ).

Am einfachsten geschieht dies mittels Grafik, in der die Parameterschätzungen pro Item in einem rechtwinkeligen Koordinatensystem gegeneinander aufgetragen werden.

Im theoretischen Idealfall ergibt sich dabei das Bild einer durch den Ursprung gehenden 45°-Geraden:
Weil die Parameter dann pro Aufgaben identisch wären, entstünden nur Punkte, die auf dieser Gerade liegen.
Weichen einzelne oder alle Punkte von der 45°-Geraden deutlich ab, so gilt für diese die Stichprobenunabhängigkeit nicht, also ist die gegebene Verrechnung auch nicht fair.

Interferenzstatistisch erfolgt der Modelltest des Rasch-Modells sinngemäß über einen Likelihood-Quotienten-Test.

Beispiel: Untertest 6 aus dem AID (Gegenüberstellung Population DE+CH zu Population AT)


Obwohl, streng genommen, die Umkehrung nicht gilt, also im Fall, dass ein psychologischer Test den Modelltests standhält, die Geltung des Rasch-Modells nicht (zwingend) bewiesen ist (auf Grund des Falsifikationsprinzip), wird sie überblicherweise dann als gegeben erachtet: Der Grad der Bewährung nach Karl Popper ist für das Modell ausreichend.
Tags: Rasch-Modell
Quelle: S91
60
Kartenlink
0
Wie weit ist die Verbreitung der Rasch-Modell geprüften Tests?
An publizierten Tests, die den zur Diskussion stehenden Verrechnungsmodus beinhalten und dem Modell laut Modelltest entsprechen, existieren nach wie vor nur sehr wenige.

International beachtete Intelligenz-Testbatterien, die gemäß Rasch-Modell konstruiert wurden, sind folgende:
  • BAS II (British Ability Scales II) - nicht mehr vertrieben,
  • DAS bzw. DAS II (Differential Ability Scales - Second Edition, 2007) - amerik. Version des BAS
  • K-ABC (Kaufman Assessment Battery for Children) - deutschspr. Edition von Melchers & Preus, 1991
  • AID 2 (deutsch, türkisch, italienisch, ungarisch) - eine englischsprachige Version ist in Vorbereitung.

Regelmäßig erweisen sich Tests, die (noch) ohne entsprechende Prüfung entwickelt wurden als nicht verrechnungsfair: Das Rasch-Modell gilt nicht. Um nur einige bedeutende Beispiele zu nennen:
  • SPM (Standard Progressive Matrices, John C. Raven): gravierende Modellabweichungen festgestellt
  • HAWIK-IV - frühere Versionen; für betroffene Untertests laut der Monografie von Kubinger (1983) in Bezug auf den HAWIK und laut Steuer (1988) in Bezug auf den HAWIK-R gravierende Modellabweichungen festgestellt.
  • Beispiele: - Untertest Allgemeines Wissen (HAWIK-R): Aufgaben besitzen abhängig vom Geschlecht unterschiedliche (relative) Schwierigkeiten ("Welche Farbe erhält man wenn man die Farben Blau und Gelb miteinander vermischt?" ... bevorzugt Mädchen // "Wie viele Menschen gibt es auf der Welt?" ... bevorzugt Jungen) .. der Test misst also auch das Geschlecht.- Untertest Allgemeines Wissen (HAWIK): Aufgabe "Was musst du tun, damit das Wasser kocht?" ist für leistungsschwache Kinder leichter zu beantworten als für leistungsstarke Kinder.(ist auch im aktuellen HAWIK-IV enthalten)
Tags: Rasch-Modell, Skalierung
Quelle: S92
61
Kartenlink
0
Wie kann die Überprüfung des Rasch-Modells bei nicht-dichotomen Antwortformat erfolgen?
Welche Ergebnisse zeigten die Überprüfungen mittels Rasch-Modell?
Für bestimmte andere Verrechnungsmodi existieren innerhalb der Item-Response -Theorie andere Modelle bzw. Verallgemeinerungen des Rasch-Modells, die teilweise analoge Bedeutung haben. Wenn etwa zusätzlich zur Bewertung in richtig/falsch, teilrichtige Antworten berücksichtigt und verrechnet werden, dann müssten sich die mit dem mehrkategoriellen mehrdimensionalen Rasch-Modell gewonnene Itemkategorienparameter (für z.B. "teilw. richtig"/1 Punkt, "vollkommen richtig"/2 Punkte) über alle Items hinweg in der behaupteten Relation zueinander verhalten (im Beispiel also 1:2).

Entsprechende Modelltests bei Tests angewendet, die bei ihrer Entwicklung (noch) nicht daraufhin geprüft wurden, dokumentieren erfahrungsgemäß deutlich, dass die Verrechnungsfairness nicht gegeben ist.

Beispiel: Anwendung des mehrkategoriell mehrdimensionalen Rasch-Modell geschätzten Itemparameter im Untertest Gemeinsamkeiten finden (HAWIK-R).
Die optimal angepasste Gerade weist auf einen Anstieg von 0,52 auf - wegen relativer Antworthäufigkeiten von 0,00 bzw. 1,00 musten einige Aufgaben aus der analyse ausgeschlossen werden.

Es ist einsichtig, dass umso strengere Voraussetzungen bzw. Modellansprüche an die Items zu stellen sind, je komplizierter der vorgesehene Verrechnungsmodus ist.
Tags: Rasch-Modell, Skalierung
Quelle: S93
Kartensatzinfo:
Autor: coster
Oberthema: Psychologie
Thema: Psychologische Diagnostik
Schule / Uni: Universität Wien
Ort: Wien
Veröffentlicht: 12.06.2013
Tags: SS2013, Holocher-Ertl
 
Schlagwörter Karten:
Alle Karten (119)
16 PF-R (3)
AIST-R/UST-R (2)
Aufmerksamkeit (1)
Augenscheinvalidität (1)
Beobachten (1)
Big Five (1)
culture-fair (5)
Definition (3)
Diagnostik (15)
Eichmaßstäbe (3)
Eichung (9)
Eigenschaft (1)
Entscheidungstheorie (1)
Erhebungstechniken (5)
Ethik (1)
Fairness (7)
Faktorenanalyse (2)
Formal (8)
Fragen (3)
Freiwillige (1)
GIS (1)
Grundsätze (6)
Gruppenverfahren (1)
Gütekriterien (1)
Individualverfahren (1)
Innere Konsistenz (1)
Intelligenz (1)
Intelligenz-Testbatterien (2)
Interessen (4)
IQ (1)
Item-Response-Theorie (1)
Klassische Testtheorie (2)
Konfidenzintervall (2)
Konzentration (1)
Kriteriumsorientierte Diagnostik (1)
Laien (1)
Leistungsdiagnostik (13)
Memory (1)
Merkmal (1)
Messen (1)
Multiple-Choice-Format (5)
NEO-PI-R (2)
Nützlichkeit (2)
Objektive Persönlichkeitstests (2)
Objektivität (5)
Ökonomie (3)
Persönlichkeitsfragebogen (14)
Postkorb (1)
Profil (1)
Prognose (1)
Projektive Verfahren (1)
Prozentrang (2)
Prüfen (3)
Psychologe (1)
Psychologengesetz (1)
Rasch-Modell (5)
Reasoning (1)
Rechtliche Rahmenbedingungen (1)
Reliabilität (6)
Repräsentativität (2)
Schwierigkeit (1)
Skalierung (8)
Space (1)
Speed-and-Power-Test (2)
spezielle Leistungstests (12)
Stichprobenunabhängig (1)
stichprobenunabhängig (1)
Taylor-Russel-Tafeln (1)
Test (2)
trait (1)
Unverfälschbarkeit (3)
Validität (8)
Verbal comprehension (1)
Verfahren (3)
Verhaltensdisposition (1)
Voraussetzung (1)
Zumutbarkeit (2)
Missbrauch melden

Abbrechen
E-Mail

Passwort

Login    

Passwort vergessen?
Deutsch  English