Das Konzept
Titel-Seite

Der Autor:
Marco Schmitt

Links

Validitaet
Inhalt








 
  Validitaet

   Der Grad der Genauigkeit, mit der ein Test misst, 
   was er messen soll Õ wird erschlossen durch:
  
a) inhaltliche Validität, 
   b) kriteriumsbezogene Validität, 
   c) Konstruktvalidität


Validitätsarten:

·       Validität lässt sich nach unterschiedlichen diagnostischen bzw. prognostischen Schlussweisen bestimmen

1.      Vom (beobachtbaren) „Verhalten in der Testsituation“ wird geschlossen auf das (ebenfalls beobachtbare) „Verhalten außerhalb der Testsituation“ = Repräsentations- oder Korrelationsschluß

2.      vom Verhalten in der Testsituation wird geschlossen auf Fähigkeiten, Dispositionen oder Persönlichkeitsmerkmale als Grundlagen oder Bedingungen des Verhaltens; geschlossen wird somit auf unbeobachtbare Konstrukte = Konstruktvalidität

 

-         Kreuzvalidierung (cross validation): die Testvalidität wird an mehreren Stichproben unabhängig voneinander berechnet.

 

a)     inhaltliche Validität/ content validity (Õ Repräsentationsschluss
  das Testverhalten sei direkt repräsentativ für ein bestimmtes Gesamtverhalten)

Der Inhalt der Test – Items definiert das Ziel – Merkmal hinreichend genau. Man geht von der Annahme aus, dass die Testaufgaben selbst das bestmögliche Kriterium für das zu untersuchende Persönlichkeitsmerkmal darstellen. Dabei ist zu fragen, ob der Test eine repräsentative Stichprobe aus der Gesamtmenge der Aufgaben, welche das Merkmal charakterisieren, darstellt?

Da es kaum eine vollständige Auflistung aller relevanter Items geben kann, muss man sich mit einer Näherungslösung begnügen; exemplarische Aufzählung von Items. Der Test selbst beinhaltet die zu messenden Merkmale; z.B. Kenntnis-, Interessen-, Schreibmaschinentest. Keine rechnerischen Koeffizienten.

 

·   logische Validität: Einschätzung der inhaltlichen Validität durch Experten aufgrund logisch – wissenschaftlicher Einsicht.

·   Augenschein – Validität: (psychologische Validität); der Test wirkt für den zu Untersuchenden den Eindruck, valide zu sein.

·   Triviale Validität: im Test werden genau und vollständig dieselben Anforderungen (Aufgaben) gestellt, die in der realen lebenstätigkweit gestellt werden.

·   Repräsentative Validität: (curriculare Validität); die Aufgaben sind für die in einem Lehrplan aufgestellten Lernziele repräsentativ

 

Ü    Probleme:

-  Gefahr der zu starken Generalisierung, häufig überzogen

-  Testergebnisse sehr spezifisch und können daher kaum generalisiert werden

-  Eignet sich nicht für Testverfahren, die Konstrukte messen sollen

 

b)   kriteriumsbezogene Validität/ empirische (Õ Korrelationsschlüsse, empirisch bewiesener Zusammenhang zwischen Testerhalten und Verhalten außerhalb der Testsituation)

Korrelation der Testergebnisse mit einem beobachtbaren Kriterium; rtc = Korrelation zwischen Testergebnissen und Kriterium

-  bedeutsamste der Validitätsarten, ist gemeint, wenn man allgemein von Validität spricht

-  Kriteriumsverunreinigung: das Kriterium (Experte, z.B. Lehrer) ändert sein Urteil aufgrund der vorherigen Kenntnis um das Testergebnis

·        innere Validität: (Binnenvalidierung); Korrelation des neuen Tests mit alten Tests, die das gleiche Konstrukt messen sollen.

    Validitätskoeffizienten sind mit Vorsicht zu genießen, da beide Tests ja aufgrund eines unbekannten und daher unkontrollierten, zusätzlichen Merkmals miteinander hoch korrelieren könnten. Um diese Gefahr zu mindern, können gleichzeitig mehrere Einzeltests als Kriterium für die Validierung des einen neuen Tests herangezogen werden (multiple Korrelation) = „multiple Validität“, so dass es eher unwahrscheinlich ist, das alle eingesetzten Tests das gleiche „unerwünschte“ Merkmal messen. vs.

·   Äußere Validität: Korrelation mit Außenkriterium, z.B. Schulnoten, Expertenurteile.              Expertenratings stellen dabei ein sehr relatives Kriterium dar, da es im Prinzip einem ständigen Wandel unterworfen sein kann. Oder Experten haben die gleiche Orientierung, hängen der gleichen (Theorie) Schule an Õ Gefahr der Kreisvalidierung, d.h. die Validierung findet gewissermaßen in einem geschlossenen System statt

 

·  Vorhersage – Validität: (prognostische/ prädikative V. predictive validity); Korrelation der Testergebnisse mit einem zukünftigen Kriteriumsmeßwert (z.B. Medizinertest mit späteren Examensnoten); bedeutet, daß zwischen Testdurchführung und der Erhebung des Kriteriums ein gewisser Zeitraum liegt. Die Länge des Zeitraumes hängt davon ab, wie groß der Prognosezeitraum sein soll.Wenn es um Prognosen (z.B. Einstellungstests) geht sollte im Testmanual eine Vorhersagevalidität berechnet worden sein vs.

·  Übereinstimmungs – Validität: (concurrent validity) Korrelation der Testergebnisse mit einem zeitlich koexistierenden Kriterium; Testergebnis und zu validierender Test werden gleichzeitig erhoben. Bei Fragestellungen einer Merkmalsausprägung zum gegenwärtigen Zeitpunkt.

 

·  Differentielle Validität:

a)  es werden mehrere Validitätskoeffizienten für verschiedene Innen- und/ oder Außenkriterien berechnet; mit mehreren Kriterien werden mehrere einfache Korrelationen gerechnet; und/ oder

b)  es werden mehrere unterschiedliche Stichproben herangezogen. Der Test zeigt dann eine hohe (differentielle) Validität, wenn alle Koeffizienten ähnlich hoch sind. Der Test kann zur Messung eines Merkmals bei ganz unterschiedlichen Klienten eingesetzt werden.

c)  es existieren Moderatorvariablen (z.B. Alter), die eine Population in Untergruppen mit unterschiedlicher Validität trennen; (z.B. Auswirkung der Schulbildung auf Leistungstests, hohe Validität für Minderbegabte, aber niedrige für Höherbegabte).

 

·  Multipler Validitätskoeffizient: es wird ein multipler Validitätskoeffizient Rtc anhand zweier oder mehrerer Kriterien berechnet (bei mehreren Prädiktoren/ Prinzip der multiplen Regression). Man untersucht die Korrelation des neu erprobten Tests zur Gesamtheit aller bewährten Tests.Wird durchgeführt, wenn die Kriterien jeweils andere Aspekte des zu validierenden Test erfassen; z.B: bei neuen Testverfahren, die komplexere Merkmale erfassen. Die multiple Korrelation liegt dann höher als die einzelnen Korrelationen. Aber Problem der Suppressorvariablen: korrelieren nicht mit vorherzusagender Variable, wohl aber mit den vorhersagenden Variablen (Prädiktoren). Sie erzeugen eine höhere multiple Validität, die real jedoch nicht vorliegt. Z.B. Bei Rechentest die Lesefertigkeit (Textaufgaben)

Ü Probleme:

-   die Höhe des Validitätskoeffizienten ist von der Auswahl des Kriteriums abhängig, dieses wiederum hängt von der Zielsetzung/ Fragestellung des Verfahrens ab.

-   Eine große Rolle spielt die Stichprobe, an der die Validitätsüberprüfung vorgenommen wurde.

-  Die Berechnung der Validität erfolgt mittels linearer Verfahren; die Beziehung zwischen Kriterium und Test kann aber auch nicht- linear sein.

-   Bei der Binnenvalidierung (neuer Test mit altem Testverfahren) können mögliche Fehler vervielfältigt werden.

 

c)  Konstruktvalidität (ÕIndikationsschluß, Schluß vom Testverhalten auf „Dispositionen, Charakterzüge, Fähigkeiten etc“, die dem Testverhalten als zugrunde liegend angenommen werden)

Es soll geprüft werden, ob ein theoretisch begründetes Konstrukt durch den Test erfaßt wird, also der Test das zugrundeliegende Konstrukt auch tatsächlich mißt; gleichzeitig wird die genaue Bestimmung des zu messenden Konstrukts fortgeführt (Einordnung in ein nomologisches Netz), zielt stärker auf theoretische Fragen (z.B. faktoranalytische Untersuchung von Persönlichkeits- oder Intelligenztests).

 

-   Multitrait – Multimethod – Validierung: Merkmals – Methoden – Einheit, Die mittels Test gewonnenen Daten enthalten zwei Komponenten: Angaben über Methoden und Angaben über Merkmale. Ziel ist es, diese beiden Komponenten zu trennen.

·  Konvergente Validität: Positive Korrelationen mit konstruktnahem Außen- oder Innenkriterien; negative Korrelationen mit einem Test, der genau das Gegenteil mißt.

·  Divergente Validität (diskriminante V.): Nullkorrelationen bzw. negative Korrelationen mit konstruktfernen Außen- oder Innenkriterien.

 

·  Faktorielle Validität: gemeinsame Faktorenanalyse von: Test, konstruktnahen und –fernen Testes und Kriterien.

·  Extremgruppenvalidität: Vergleich zweier Gruppen, die das zu untersuchende Merkmal in extrem unterschiedlichem Grad aufweisen, t- Wert für die Differenzen der Gruppenmittelwerte.

·  Analyse intraindividueller Veränderungen: bei wiederholter Durchführung mit und ohne systemeatischer Variation der Durchführungsbedingungen; zeitlich konstantes Merkmal (Trait – Konstrukt, Intelligenz) oder augenblickliche Stimmungslage (State – Konstrukt)

·  Inhaltlich – logische Analyse der Testelemente: - Faktorenanalyse, - innere Konsistenz; Übereinstimmung der Dimensionen des Tests mit der testimanenten Theorie

 

 

G.    Systematik von Validitätskriterien  [nach Lienert]

- einfache Validitätskriterien

- kombinierte Validitätskriterien

- simultankombinierte, - sukssezivkombinierte

- objektive Validitätskriterien

- subjektive Validitätskriterien

- qualitative Validitätskriterien

-  quantitative und quantitativ abgestufte Validitätskriterien

 

H.    Kombination mehrerer Einzeltests zu einem Gesamturteil

a)  multiple Regressionsgleichung

-    bei der Konstruktion von Testbatterien: Die Gewichtung der Prädiktoren wird so vorgenommen, daß eine möglichst gut Vorhersage des Kriteriums (der Regressionsberechnung, nicht der Validierung) möglich wird. Dabei müssen Prädiktoren, die eine enge Beziehung zum Kriterium haben, höher gewichtet werden; während interkorrelierte Prädiktoren niedriger gewichtet werden sollten, da sie ja sonst doppelt einfließen würden. 

-   Die Zuweisung eines Klienten zu einer bestimmten Gruppe (z.B. geistig behindert ja./. nein) erfolgt dann aufgrund des Gesamtergebnisses (cut – off – score), welches wiederum aus den unterschiedlich gewichteten Einzelergebnissen (Prädiktoren) zusammengesetzt wird.

 

b)  multiple – cut - off – score (Multipler Test Trennwert)

-   Die Zuweisung des Klienten zu einer bestimmten Gruppe erfolgt über mehrere cut – off – scores, wenn z.B. für jeden Einzeltest ein eigener cut – off – score festgelegt wurde.

-   Entscheidung für Zuweisung, wenn Klient z.B. bei mehr als der Hälfte der Tests unterhalb des jeweiligen Grenzwertes liegt.

Ü  Der wesentliche Unterschied beider Methoden liegt darin, daß bei der ersten Methode eine Kompensation schlechter Einzeltestergebnisse durch bessere Ergebnisse in anderen Tests möglich ist. Bei der zweiten Methode geht dies nicht. Auf der Grundlage theoretischer Überlegungen ist zu entscheiden, ob eine Kompensation sinnvoll ist oder nicht.

 

 

I.       Faktoren, die die Validität mitbestimmen

 

a)      Reliabilität

-   mit zunehmender Reliabilität steigt auch die Validität an, wobei der Anstieg der Validität langsamer verläuft.

-   Eine hohe Reliabilität ist eine notwendige, aber noch keine hinreichende Bedingung für eine hohe Validität.

 

b) Homogenität

-   bei mittlerer Homogenität (Interkorrelation der Testitems) werden die höchsten Validitätskoeffizienten erreicht, während bei geringer und hoher Homogenität die Validität abnimmt (umgekehrte U –Funktion),

-   nach Lienert besteht eine partielle Inkompatibilität zwischen Reliabilität und Validität, weil eine große Homogenität der Aufgaben zu einer geringen Validität aber hohen Reliabilität führt, während eine höhere Validität eher durch heterogene Aufgaben gewährleistet wird. Für die Validität wirkt sich eine unterschiedliche Aufgabenschwierigkeit günstiger aus, denn die Schwierigkeitsvariabilität der Aufgaben führt zu einer Verminderung der Aufgabeninterkorrelationen und ebenso zu einer Verminderung der Trennschärfekoeffizienten., was die empirischen Validitätserwartungen verbessert.

-   Durch den Aufbau von Testbatterien kann dieses Dilemma überwunden werden: die Teiltests in sich wahren die Reliabilität, die Batterie der Kombination der Teiltest sichert die Validität.

 

c)      Testlänge

-  mit Hilfe der Spearman -. Brown – Formel läßt sich errechnen, welche Validität bei einer Verlängerung um X Items erreicht würde. Dafür muß allerdings die Reliabilität des Tests bekannt sein. Ebenfalls wird mit Verlängerung wiederum die Reliabilität eines Tests verändert. [Formel Vorlesung I, S. 52] Die neue Validität r´tc wird ermittelt, indem die alte Validität durch Aufgabenanzahl und Reliabilität geteilt wird r´tc =                         
Dabei ist r´tc ein sogenannter minderungskorrigierter Validitätskoeffizient.

-   will man wissen, um wie viele Aufgaben man einen Test verlängern müßte, um eine gewünschte Validität zu erreichen, so ist die Formel nach n´ aufzulösen.

-   Netto – Effektivität eines Items: Validitätszuwachs, den der Test erfährt, wenn ein bestimmtes Item zusätzlich in den Test aufgenommen wird.

 

d) Reliabilität des Validitätskriteriums Õ Minderungskorrekturen („correction for attanuation“)

-   Frage, wie hoch der Validitätskoeffizient eines Test wäre, wenn man ein vollkommen reliables Kriterium hätte gewinnen können.

-   Es läßt sich für den Validitätskoeffizienten eine Minderungskorrektur errechnen, eine Korrektur für die Minderung, die der Validitätskoeffizient zufolge mangelnder Kriteriumsreliabilität erlitten hat: crit.corr.rtc             rcc  = Reliabilitätskoeffizient des Validitätskriteriums

-         doppelte Minderungskorrektur (besonders bei Tests mit mangelnder Reliabilität)   

                 crit. et test corr.rtc =

-   Der einfach minderungskorrigierte Validitätskoeffizient entspricht derjenigen Validität, die der Test haben würde, wenn das Kriterium absolut reliabel wäre.

-   Der doppelt minderungskorrigierte Validitätskoefizient entspricht derjenigen Validität die der Test haben würde, wenn Kriterium und Test absolut reliabel wären.

-   Anwendung, wenn z.B. das gemessene persönlichkeitsmerkmal größere Konstanz aufweist als das stattdessen gewählte Validitätskriterium (z.B. Experten/ Lehrerurteil)

 

e)  Validität des Kriteriums

-  d.h. es ist die Güte des Kriteriums (alter Test) zu berücksichtigen

-   ebenso kann die Reliabilität des Kriteriums betrachtet werden. Bei geringer Reliabilität kann eine Minderungskorrektur des Validitätskoeffizienten des neuen Test berechnet werden. s.o.

 

J.      Validität und Testinterpretation

 

a)   Standardschätzfehler

 

-   Da das Merkmal selbst nicht direkt gemessen werden kann, geschieht eine Aussage darüber immer nur im Sinne einer Abschätzung.

-   Der Fehler hängt von der Validität des Testverfahrens ab und wird als Standardschätzfehler bezeichnet.

·  Standardschätzfehler SSF   syx = sy

-   syx = Kriterium; sy = sc = Standardabweichung des Kriteriums, rtc2 = quadrierte Korrelation zwischen Testergebnis und Kriterium

-   mit Hilfe des Standardschätzfehlers kann –wie beim Standardmeßfehler- ein Konfidenz- intervall für die Lage des Kriteriumwertes nach der Erhebung der Prädiktoren berechnet werden.

-          Õ Größe des Fehlers in Relation zum „Raten“ des Kriteriumwertes ;  

             Beisp. rtc = .80    = = .60

·  Der Determinationskoeffizient D = r2 gibt den relativen Anteil der gemeinsamen Varianz bei Test und Kriterium an.

·  Schätzungseffekt/ Effektivitätswert E = 100 (1-  )  gibt an, um welchen prozentsatz ein Schätzfehler geringer ausfällt, als er bei Fehlen einer Korrelation zwischen Test und Kriterium ausfallen würde [???, Vorlesung I, Abb. S. 50]

  

-   Für die Festlegung eines cut – off – scores wird keine völlig exakte Schätzung des Merkmals des Probanden benötigt. Will man vermeiden, daß etwa bei der Personalauswahl zu viele ungeeignete Personen eingestellt werden, so setzt man einfach den cut –off – score hinauf und kann so recht gut auch mit einer geringeren Schätzgenauigkeit arbeiten.

  

b.  Validität und Grundquote – Anteil geeigneter Pbn und Selektionsrate

  

·   Bei Selektionsfragestellungen tritt das Problem der Bestimmung des sog. Cut – off – Wert (überprüfter Grenzwert/ Schwellenwert) auf, bei dessen Unterschreitung „Nichteignung“ und bei dessen Überschreitung „Eignung“ diagnostiziert wird. Dieser soll eine „populationsunabhängigere“ Entscheidung gewährleisten und gleichzeitig garantieren, daß Mindestvoraussetzungen beim Pbn vorhanden sind. 

-   Die cut – off – Festlegung bestimmt darüber, ob mehr Geeignete als solche erkannt wurden oder mehr Nichtgeeignete.

-   Einfache Entscheidungsstrategie: Vorgehen (Testanwendung), Entscheidung (angenommen./. nicht angenommen), Ergebnis (gültige Annahme, falsche Annahme, gültige Zurückweiseung, ungültige Zurückweisung), Wahrscheinlichkeit (prozentualer Anteil), Nützlichkeitsberechnung [Folie Vorlesung I, S. 60] Welche Fehlerquelle man vor allem minimiert, sollte man aus den Konsequenzen des diagnostischen Urteils ableiten.

  

·Das Grundquotenverhältnis drückt die Schwierigkeit der diagnostischen Entscheidung aus:

-   Bei einem Grundquotenverhältnis von 50 :50 sind bereits wenig valide Tests in der Lage, den Fehler % - Wert gegenüber einer Nicht – Anwendung des Tests zu senken.

-  Bei einem stark ungleichen Verhältnis (etwa 90 : 10 oder 20 : 80) vermögen nur Tests mit einer hohen Validität den F – Wert noch zu senken, d.h. überzufällig viele Geeignete zu identifizieren.

·  Die Prognosegüte eines Tests wird nicht nur durch den Validitätskoeffizienten, sondern auch durch das Verhältnis der Grundquote (relativer Anteil derjenigen in der aunausgelesenen Population, die über das gewünschte Merkmal verfügen, z.B. tatsächlich Geeignete) und Selektionsquote/rate (Anteil des Bedarfs, im Verhältnis zum Angebot der geeigneten Population) bestimmt.

·  Mit  Hilfe der Taylor – Russel – Tafeln läßt sich bestimmen, wie hoch der Prozentsatz der Geeigneten unter der Voraussetzung bestimmter Grundquoten, Selektionsquoten und Testvaliditäten unter den vom Test als „geeignet“ klassifizierten Pbn tatsächlich ist. Sie ermöglichen eine Abschätzung des Entscheidungsfehlers. 

-  Beispiel: Test mit einer Validität von rtc= .55, Grundquote =90% geeignete Personen in der Population, Selektionsrate: 70 % der Bewerber müssen eingestellt werden, dann liegt der erwartete Anteil tatsächlich geeigneter, ausgewählter Bewerber (Treffer) bei 96%.

-   Andererseits kann man auch die erforderliche Validität eines Tests ableiten, wenn man die Grundquote und Selektionsrate kennt.

  

· Die Bedeutung der Höhe der Validitätätskoeffizienten hängt weitgehend von seinem speziellen Verwendungszweck ab:

-  individuelle Begutachtung und Entscheidung aufgrund eines Tests rtc > als .70, bei Einbeziehung mehrerer Verfahren rtc   .50

-  nicht – individuelle Auslese (Eignungsauslese), siehe oben

-  Gruppenvergleich, Unterschiede eines Persönlichkeitsmerkmals bei verschiedenen Gruppen Õ Validitätskoeffizient sollte im Verhältnis zum Reliabilitätskoeffizienten relativ hoch sein.

·  allgemeine Richtlinien über die erforderliche Höhe von Validitätskoeffizienten [Lienert, S. 270]

-  für die Prognose ist grundsätzlich nur die praktische Validität von Belang

-  für die Diagnose, bei der es mehr auf das Verstehen und Erklären ankommt, sind logische und faktorielle Validität und die darauf basierenden Beschreibungen oft aufschlußreicher als die praktische Validität.

·  Erwartungstafeln: hieraus läßt sich ablesen, bei welchem Standardwert wieviel Prozent der Pbn z.B. erfolgreich eine Ausbildung beenden werden (mit welcher Wahrscheinlichkeit ein Pbn mit einem bestimmten Testwert ein Kriterium erreicht Õ prognostische Validität). Dabei wird die Beziehung zwischen Test und Kriterium linear angenommen.

-  Ein äußeres Kriterium liegt vor; z.B. Schulerfolg, Berufserfolg/ Bewährung. Das Testergebnis wird damit verglichen. Es wird z.B. geguckt, ob das Ergebnis vom Verlauf her identisch ist (ähnlicher Testverlauf, Raven – Matritzen Test); IST – 70 Bewährung in einem bestimmten Beruf/ Leistungshöhe; bei diesem Testergebnis liegt der Pbn an welcher Stelle (durchschnittlich/ unter- bzw. überdurchschnittlich) hinsichtlich unterschiedlicher Schulformen.

 

·  Verhältnis Grundquote/ Selektionsquote/ Validität

a)  bei geringen Selektionsraten schon eine Verbesserung der Trefferquote durch gering/ mäßig validen Test

b) gute Erhöhung der Trefferquote bei ausgewogenem Verhältnis Grundquote/ Selektionsrate

c)  hohe Grundquote Õ kaum Verbesserungen durch mittel- bzw. hochvaliden Test, die Auswahl per Zufall gewährleistet schon eine hohe Trefferquote

 

 

 

·  Zusammenhang Trennschärfe/ Homogenität/ Validität

a)    Validität am besten bei ­

- mittlerer Homogenität (Interitemkorrelation, umgekehrte U – Funktion)

- unterschiedlicher Aufgabenschwierigkeit Õ führt zur Verminderung der Aufgabeninterkorrelation (niedrigere Homogenität) und zur Verminderung des Trennschärfekoeffizienten

- hohe Reliabilität aber notwendige Voraussetzung für Validität

  

b)  Reliabilität am höchsten ­

- hohe Streuung der Testrohwerte

- ist abhängig von der Homogenität der Stichprobe (heterogene Stichprobe Õ größere Streuung)

- große Homogenität der Items (hohe Iteminterkorrelation, Voraussetzung: ähnliche Aufgabenschwierigkeit) Õ hohe interne Konsistenz

c)      Homogenität sinkt ¯

- wenn die Items unterschiedliche Merkmale/ Inhalte messen

- die Aufgabenschwierigkeit sehr unterschiedlich ist

d) Aufgabenschwierigkeit (Schwierigkeitsindex)

- bei p = .50 die höchste Streuung Õ wirkt sich positiv auf die Reliabilität aus ­

- niedrige oder hohe Aufgabenschwierigkeit Õ geringe Streuung

e) Trennschärfe am größten ­

- bei großer Iteminterkorrelation (große Homogenität)

- bei mittlerer Aufgabenschwierigkeit p = .50, umgekehrte U – Funktion

- je steiler die ICC, desto trennschärfer das Item; gut geeignet bei Kriteriumsorientierter Messung mit Multiplen Test – Trennwert, wenn eine Population in zwei Merkmalsklassen getrennt werden soll

- wenn breiter differenziert werden soll (gesamte Leistungsspektrum) dann muß die Trennschärfe geringer ausfallen, ICC flacher

 

Ô partielle Inkompatibilität von Reliabilität und Validität

 

a) Gulliksen – Technik: bevorzugt Aufgaben mit mittlerer Schwierigkeit; Einsatz bei heterogenen Tests, die im mittleren Bereich gut differenzieren sollen

b) Kennwertselektion: bevorzugt Aufgaben mit niedriger oder hoher Schwierigkeit; Einsatz bei homogenen Tests, differenziert über das gesamte Leistungsspektrum

 

 

·  Suppressorvariable: negatives   - Gewicht; der die Vorhersage störende verbale Anteil des Prädiktors wird dadurch quasi substrahiert. Im Idealfall ergibt sich dann wegen der Unterdrückung der verbalen Komponente eine beträchtliche Verbesserung der Vorhersage. Die Suppressorvariable unterdrückt irrelevante Varianzen in den anderen Prädiktorvariablen und erhöht so die Nützlichkeit anderer Prädiktorvariablen.

·  Moderatorvariablen: haben Einfluß auf den Zusammenhang zweier Merkmale; Pbn unterscheiden sich hinsichtlich der Moderatorvariable