Vorhersage des Berufserfolgs (mit Diagramm und Statistiken)

Die Vorhersage des Arbeitserfolgs beinhaltet das Bestimmen, inwieweit der Prädiktor mit dem Kriterium zusammenhängt. Nehmen wir beispielsweise an, man wäre daran interessiert, ein Auswahlprogramm für die Einstellung neuer Mitarbeiter anzustellen. Nehmen wir weiter an, es sei entschieden worden, einen Papier-Bleistift-Test der klerikalen Eignung als potenziellen Prädiktor für die Effizienz der Filialangestellten zu verwenden, und die Effizienz sollte anhand von Bewertungen der Vorgesetzten bestimmt werden. Tabelle 2.3 zeigt einige hypothetische Daten für diese angenommene Situation, wobei für zwölf Protokollierer sowohl für den Kleriotest als auch für das Effizienzkriterium eine Bewertung erzielt wurde. Abbildung 2.5 zeigt eine grafische Darstellung der Daten in Tabelle 2.3.

Beachten Sie, dass es einen systematischen Trend gibt. Im Allgemeinen gilt: Je höher eine Person beim klerikalen Test, desto höher die Punktzahl der beruflichen Fähigkeiten. Daraus lässt sich ableiten, dass ein eindeutiger Zusammenhang zwischen Testleistung (Prädiktor) und Arbeitsfähigkeit (Kriterium) besteht. Wir können auch davon ausgehen, dass wir, wenn wir diejenigen Personen auswählen, die im Test eine höhere Punktzahl erreichen, eher geeignet sind, Personen zu beschäftigen, die kompetenter sind, als wenn wir Personen unabhängig von der Testergebnisse einstellen.

Festlegung des Beziehungsgrades:

Der Grad der Beziehung zwischen zwei beliebigen Variablen kann als das Ausmaß definiert werden, in dem diese beiden Variablen gemeinsam systematisch variieren. Der technischere Ausdruck dafür ist der Grad der Kovarianz zwischen Variablen. Ein formales Maß für den Kovarianzgrad zwischen zwei beliebigen Punktesätzen wird durch eine als Korrelationskoeffizient bezeichnete Statistik bereitgestellt. Wenn zwei Sätze von Scores in hohem Maße miteinander verbunden sind, sagen wir, dass sie stark miteinander korrelieren. Das häufigste Maß für die Korrelation ist der Pearson-Produktmoment-Korrelationskoeffizient, der mit dem Symbol r bezeichnet wird.

Als Maß für die Beziehung variiert r zwischen + 1.00 und -1.00. Wenn r + 1, 00 ist, sind die beiden Sätze von Bewertungen positiv und perfekt aufeinander bezogen. Wenn r -1, 00 ist, sind die beiden Sätze von Bewertungen negativ und perfekt aufeinander bezogen. Wenn r = 0, 00 ist, haben die beiden Sätze von Bewertungen überhaupt keine Beziehung zueinander. Abbildung 2.6 zeigt Diagramme verschiedener Größen von r.

Bei der Vorhersage des Auftragserfolgs ist das Vorzeichen des Korrelationskoeffizienten nicht wichtig, aber die Größe ist. Je größer die absolute Größe von r ist, desto besser ist die Vorhersage der Kriteriumsbewertungen auf der Grundlage der vom Prädiktor erhaltenen Informationen.

Um die Korrelationsgründe zu verstehen, kann es hilfreich sein, eine bildliche Darstellung der Kovarianz und ihrer Beziehung zu r in Betracht zu ziehen. Jeder Satz von Bewertungen wird eine gewisse Variation aufweisen - in der Tat folgen, wie wir bereits gesehen haben, die Bewertungen von Personen mit vielen Merkmalen einer Normalverteilung mit einer kleinen Anzahl sehr hoher Bewertungen, einer kleinen Anzahl sehr niedriger Bewertungen und den meisten der Ergebnisse in der Mitte der Verteilung.

Angenommen, wir repräsentieren diese Abweichung in einem Satz Kriteriumsbewertungen, wie oben gezeigt, wobei die Gesamtfläche mit 1, 00 definiert ist. Wir können dies tun, da es möglich ist, jeden Satz von Rohwerten so zu transformieren, dass seine Varianz unter Verwendung der sogenannten az-Wertetransformation 1, 00 beträgt.

Nehmen wir ebenfalls an, wir haben eine Reihe von Prädiktorwerten, die ebenfalls variieren und normal verteilt sind, und wiederum ist die Fläche als gleich 1, 00 definiert. Wir können nun r geometrisch als auf den Überlappungsbetrag (Kovarianz) der beiden Punktesätze bezogen darstellen.

Eine genauere Definition von r als Statistik ist, dass es das Verhältnis des Betrags der Kovarianz zwischen zwei Variablen zur Quadratwurzel des Produkts der jeweiligen Varianzen (manchmal als geometrischer Mittelwert bezeichnet) ist, der wie folgt dargestellt werden kann:

Um auf die in Tabelle 2.3 angegebenen Daten zurückzukommen, ist es möglich, die Korrelation zwischen diesen beiden Punktesätzen unter Verwendung der Formel zu berechnen

Der Leser wird darauf hingewiesen, dass r nicht als Prozentsatz interpretiert werden kann. Wenn r = 0, 50 ist, bedeutet dies nicht, dass 50 Prozent der Varianz des Kriteriums aus der Auswahlvariablen vorhersagbar sind. Das Quadrat von r kann jedoch so interpretiert werden. Eine Korrelation von 0, 50 ergibt im Quadrat r2 = 0, 25, was als Prozentsatz der Abweichung in dem von der Auswahlvariablen vorhergesagten Kriterium interpretiert werden kann.

Die Statistik r 2 wird manchmal als Bestimmungskoeffizient bezeichnet, da sie den Betrag der Varianz in einer Variablen darstellt, der durch Kenntnis der Werte einer zweiten Variablen "bestimmt" werden kann. Abbildung 2.7 zeigt die Beziehung zwischen r (dem Maß der Beziehung) und r 2 . Es ist zu beachten, dass es möglich ist, rs von ziemlich beträchtlicher Größe zu erhalten und dennoch nur einen kleinen Teil der Kriteriumsvarianz zu berücksichtigen.

Regression:

Wie wir gesehen haben, misst der Korrelationskoeffizient r den Grad der Beziehung zwischen zwei Variablen. An sich gibt es jedoch kein Verfahren, mit dem wir einen Satz von Ergebnissen aus einem anderen Satz vorhersagen können. Die Technik, mit der dies durchgeführt wird, wird als Regressionsanalyse bezeichnet. Die Regression kann wie folgt auf die Korrelation bezogen betrachtet werden: Die Korrelation misst die Größe oder den Grad der Beziehung zwischen zwei Variablen, während die Regression eine Beschreibung der Art der Beziehung zwischen Variablen enthält, die wiederum verwendet werden kann, um Vorhersagen zu treffen.

Um die Regression zu veranschaulichen, betrachten Sie die in Abbildung 2.8a dargestellten Werte. Offensichtlich besteht in diesem Fall ein erheblicher positiver Zusammenhang zwischen dem Prädiktor und dem Kriterium. Leider liefert Abbildung 2.8a keine Informationen über die genaue Beziehung außer der Tatsache, dass es sich um eine lineare handelt (r misst immer nur den Grad der linearen Beziehung zwischen zwei Variablen und nicht die krummlinige Beziehung). Wenn wir Kriteriumswerte von einem Auswahlgerät vorhersagen wollen, müssen wir die beobachtete Beziehung zwischen Prädiktor und Kriterium genauer beschreiben.

Dies wird durch Auffinden der Linie oder Funktion erreicht, die die Datenpunkte am besten beschreibt. Dies wird als Anpassen einer "Linie der besten Anpassung" an die Daten bezeichnet. Da wir davon ausgehen, dass die Beziehung linear ist (wir haben r verwendet, um ihre Größe zu messen), muss der verwendete Linientyp gerade sein, dh es sind keine gekrümmten Linien zulässig. Diese am besten passende gerade Linie wird Regressionsgerade genannt und kann verwendet werden, um das Kriterium aus dem Prädiktor vorherzusagen.

Abbildung 2.8b zeigt zwei verschiedene Linien mit der besten Übereinstimmung, die sich erzielen lassen, wenn wir zwei verschiedene Personen bitten, die Daten zu untersuchen, und dann eine Linie durch die Punkte ziehen, die ihrer Meinung nach am besten den Trend oder die Beziehung zwischen den Variablen beschreiben. Obwohl der allgemeine Trend ähnlich ist, stellen wir fest, dass die beiden Personen in ihrer Einschätzung der Beziehung nicht völlig übereinstimmen.

Diese Nichtübereinstimmung würde wiederum zu einer Nichtübereinstimmung der vorhergesagten Kriteriumsbewertung führen, abhängig davon, welche geschätzte Regressionsgerade verwendet wurde. Bei einem Bewerber mit einer Punktzahl x für das Auswahlinstrument würden wir für diesen Bewerber eine Kriteriumsbewertung von y 1 vorhersagen, wenn wir die Regressionsgerade der ersten Person verwenden würden. Wenn wir die Regressionsgerade der zweiten Person verwenden, würden wir y 2 als wahrscheinlichste Kriteriumsbewertung vorhersagen. Welche Regression ist richtig?

Diese Frage ist schwer zu beantworten, es sei denn, es gibt eine Grundlage, um zu entscheiden, was ein „Best-Fit“ wirklich ist. Glücklicherweise haben Statistiker im Allgemeinen zugestimmt, dass eine Linie am besten passt, die durch die Punkte verläuft, so dass die Summe der quadratischen Abstände (in der y-Dimension) der Punkte von der Linie wie in Abbildung 2.9 gezeigt minimiert wird.

Eine Linie, die das Minimieren von Σd 2 bewirkt, wird als Regressionsgerade der kleinsten Quadrate bezeichnet. Solche Regressionsgeraden stehen mathematisch in direktem Zusammenhang mit r. Die Verwendung der Methode der kleinsten Quadrate zum Erhalten unserer Vorhersagelinie stellt sicher, dass verschiedene Personen dieselbe Linie haben (vorausgesetzt, sie machen keine Fehler bei der Berechnung). In ähnlicher Weise wird der vorhergesagte Kriteriumswert für einen bestimmten x-Wert nicht variieren, je nachdem, wer auf die Vorhersagelinie passt (siehe Abbildung 2.8c).

An diesem Punkt kann der Leser fragen: "Warum müssen wir Kriteriumswerte vorhersagen, wenn wir sie bereits haben?" Die Antwort ist ziemlich einfach. Die anfängliche Messung des Ausmaßes der Beziehung zwischen dem Prädiktor und dem Kriterium erfordert offensichtlich beide Sätze von Bewertungen oder die Beziehung konnte nicht hergestellt werden. Sollte sich das Auswahlgerät als nützlich erweisen, kann es mit allen neuen Antragstellern verwendet werden, für die ein Prädiktorwert vorhanden sein kann, für die jedoch kein Kriteriumswert vorliegt.

Unser Ziel ist es, die Leistungskriterien zukünftiger Bewerber vorherzusagen. Wenn ein neuer Bewerber in einem Test, der einen hohen positiven Zusammenhang mit dem Kriterium feststellte, eine hohe Punktzahl erzielt, sollten wir von ihm eine hohe Wahrscheinlichkeit erwarten, dass er sich als erfolgreicher Mitarbeiter herausstellt.