Nichtparametrische Tests: Konzepte, Vorsichtsmaßnahmen und Vorteile

Nachdem Sie diesen Artikel gelesen haben, werden Sie Folgendes kennenlernen: 1. Konzepte nichtparametrischer Tests 2. Annahmen nichtparametrischer Tests 3. Vorsichtsmaßnahmen 4. Einige nichtparametrische Tests 5. Vorteile 6. Nachteile.

Konzepte nichtparametrischer Tests:

Etwas in jüngerer Zeit haben wir die Entwicklung einer großen Anzahl von Inferenztechniken gesehen, die keine zahlreichen oder strengen Annahmen über die Bevölkerung treffen, von der wir die Daten genommen haben. Diese distributionsfreien oder nicht-parametrischen Techniken führen zu Schlussfolgerungen, die weniger Qualifikationen erfordern.

Nachdem wir eine davon verwendet haben, können wir vielleicht sagen: "Unabhängig von der Form der Bevölkerung (en) können wir folgern, dass ..."

Die zwei alternativen Namen, die häufig für diese Tests angegeben werden, sind:

Verteilungsfrei:

Nichtparametrische Tests sind „distributionsfrei“. Sie gehen nicht davon aus, dass die untersuchten Bewertungen aus einer Population stammen, die auf bestimmte Weise verteilt ist, z. B. aus einer normalverteilten Population.

Bei Tests der Signifikanz der Differenz zwischen zwei Mitteln (beispielsweise in Bezug auf CR oder t) wird davon ausgegangen, dass die Bewertungen, auf denen unsere Statistiken basieren, normalerweise in der Bevölkerung verteilt sind. Was unter der Nullhypothese tatsächlich getan wird, ist die Schätzung der Wahrscheinlichkeit eines echten Unterschieds zwischen den beiden Parametern aus unseren Stichprobenstatistiken.

Wenn N ziemlich klein ist oder die Daten stark verzerrt sind, so dass die Annahme der Normalität zweifelhaft ist, sind „parametrische Methoden“ von zweifelhaftem Wert oder überhaupt nicht anwendbar. Was wir in solchen Fällen brauchen, sind Techniken, die es uns ermöglichen, Proben zu vergleichen und Schlussfolgerungen oder Signifikanztests zu machen, ohne dass wir Normalität in der Bevölkerung annehmen müssen.

Solche Methoden werden als nicht parametrisch oder vertriebsfrei bezeichnet. Der Chi-Quadrat-Test X 2 ist zum Beispiel eine nicht parametrische Technik. Die Bedeutung von X 2 hängt nur von den Freiheitsgraden in der Tabelle ab. Es muss keine Annahme hinsichtlich der Verteilungsform für die in die Kategorien der X 2 -Tabelle klassifizierten Variablen gemacht werden.

Der Rangdifferenz-Korrelationskoeffizient (rho) ist ebenfalls eine nicht parametrische Technik. Wenn p aus Scores berechnet wird, die in der Reihenfolge des Verdienstes eingestuft sind, neigt die Verteilung, aus der die Scores gezogen werden, zu einer falschen Verzerrung, und N ist fast immer klein.

Einstufungstests:

Alternativ werden viele dieser Tests als „Ranglistentests“ bezeichnet, und dieser Titel legt ihren anderen Hauptvorteil nahe: Nichtparametrische Techniken können mit Bewertungen verwendet werden, die nicht in einem numerischen Sinne exakt sind, aber in Wirklichkeit lediglich Rangstufen sind.

Annahmen nichtparametrischer Tests:

Ein nichtparametrischer statistischer Test basiert auf einem Modell, das nur sehr allgemeine Bedingungen und keine hinsichtlich der spezifischen Form der Verteilung angibt, aus der die Probe entnommen wurde.

Bestimmte Annahmen sind mit den meisten nichtparametrischen statistischen Tests verbunden, nämlich:

1. dass die Beobachtungen unabhängig sind;

2. Die zu untersuchende Variable hat eine grundlegende Kontinuität.

3. Nichtparametrische Verfahren, um andere Bevölkerungshypothesen zu berücksichtigen als parametrische Verfahren.

4. Im Gegensatz zu parametrischen Tests gibt es nichtparametrische Tests, die angemessen auf Daten angewendet werden können, die in einer ordinalen Skala gemessen werden, und andere auf Daten in einer nominalen oder kategorialen Skala.

Vorsichtsmaßnahmen bei der Verwendung nicht parametrischer Tests:

Bei der Verwendung nichtparametrischer Tests wird der Schüler vor den folgenden Fehlern gewarnt:

1. Wenn sich die Messungen auf Intervall- und Verhältnisskalen beziehen, führt die Transformation der Messungen auf nominalen oder ordinalen Skalen zum Verlust vieler Informationen. Daher sollten in solchen Situationen soweit möglich parametrische Tests durchgeführt werden. Bei der Verwendung einer nicht parametrischen Methode als Abkürzung werfen wir Dollar weg, um Pfennige zu sparen.

2. In Situationen, in denen die Annahmen, die einem parametrischen Test zugrunde liegen, erfüllt sind und sowohl parametrische als auch nichtparametrische Tests angewendet werden können, sollte die Entscheidung beim parametrischen Test liegen, da die meisten parametrischen Tests in solchen Situationen eine größere Leistungsfähigkeit haben.

3. Nichtparametrische Tests bieten zweifellos ein Mittel, um die Annahme einer Normalität der Verteilung zu vermeiden. Diese Methoden tun jedoch nichts, um die Annahmen der Unabhängigkeit von Homoskedastizität zu vermeiden, wo immer dies möglich ist.

4. Verhaltensforscher sollten die Nullhypothese, Alternativhypothese, statistischen Test, Stichprobenverteilung und Signifikanzniveau vor der Datenerfassung angeben. Die Jagd nach einem statistischen Test, nachdem die Daten gesammelt wurden, neigt dazu, die Auswirkungen möglicher Unterschiede zu maximieren, die einen Test gegenüber einem anderen begünstigen.

Infolgedessen ist die Möglichkeit, die Nullhypothese zurückzuweisen, wenn sie wahr ist (Fehler vom Typ I), stark erhöht. Diese Warnung gilt jedoch gleichermaßen für parametrische und nichtparametrische Tests.

5. Wir haben nicht das Problem, statistische Tests für kategoriale Variablen auszuwählen. Nicht-parametrische Tests allein sind für Aufzählungsdaten geeignet.

6. Die F- und T-Tests werden im Allgemeinen als robuster Test betrachtet, da die Verletzung der zugrunde liegenden Annahmen die Schlussfolgerungen nicht ungültig macht.

Es ist üblich, die Verwendung eines normalen theoretischen Tests in einer Situation zu rechtfertigen, in der Normalität nicht garantiert werden kann, mit dem Argument, dass er unter Nicht-Normalität robust ist.

Einige nicht parametrische Tests:

Wir werden einige gängige nichtparametrische Tests diskutieren.

1. Zeichentest:

Der Vorzeichentest ist die einfachste aller distributionsfreien Statistiken und hat ein sehr hohes Maß an allgemeiner Anwendbarkeit. Sie ist in Situationen anwendbar, in denen das kritische Verhältnis t für korrelierte Proben nicht verwendet werden kann, da die Annahmen von Normalität und Homoskedastizität nicht erfüllt sind.

Die Studierenden sind sich der Tatsache bewusst, dass bestimmte Bedingungen in der Versuchsanordnung das Element der Beziehung zwischen den beiden Datensätzen einführen.

Diese Bedingungen sind im Allgemeinen eine Situation vor dem Test, nach dem Test. eine Test- und Wiederholungssituation; Test einer Probandengruppe bei zwei Tests; Bildung von "übereinstimmenden Gruppen" durch Paarung einiger fremder Variablen, die nicht untersucht werden, die jedoch die Beobachtungen beeinflussen können.

Beim Vorzeichentest testen wir die Signifikanz des Vorzeichens der Differenz (als Plus oder Minus). Dieser Test wird angewendet, wenn N weniger als 25 beträgt.

Das folgende Beispiel verdeutlicht den Sign-Test:

Beispiel:

Die Punktzahlen, die häufig unter zwei verschiedenen Bedingungen, A und B, behandelt werden, sind unten angegeben. Wenden Sie den Zeichentest an und testen Sie die Hypothese, dass A B überlegen ist.

Ohne 0 (Null) haben wir neun Unterschiede, von denen sieben plus sind.

Nun müssen wir das Binomial (p + q) 9 erweitern

(p + q) 9 = p 9 + 9p 8 q + 36p 7 q 2 + 84p 6 q 3 + 126 p 5 q 4 + 126 p 4 q 5 + 84p 3 q 6 + 36 p 2 q 7 + 9 pq 8 + q 9 .

Die Gesamtzahl der Kombinationen beträgt 2 9 oder 512. Durch Hinzufügen der ersten 3 Terme (nämlich p 9 + 9p 8 q + 36 p 7 q 2 ) ergeben sich insgesamt 46 Kombinationen (dh 1 aus 9, 9 aus 8) und 36 von 7) die 7 oder mehr Pluszeichen enthalten.

Etwa 46 Mal in 512 Studien treten 7 oder mehr Pluszeichen von 9 auf, wenn die mittlere Anzahl von + Zeichen unter der Nullhypothese 4, 5 beträgt. Die Wahrscheinlichkeit von 7 oder mehr + Zeichen beträgt daher 46/512 oder 0, 09 und ist eindeutig nicht signifikant.

Dies ist ein einseitiger Test, da unsere Hypothese besagt, dass A besser als B ist. Wenn die Hypothese zu Beginn gewesen wäre, dass A und B sich unterscheiden, ohne anzugeben, welcher überlegen ist, hätten wir einen zweiseitigen Test gehabt, für den P = ist .18.

Es stehen Tabellen zur Verfügung, die die Anzahl der Zeichen angeben, die für die Bedeutung auf verschiedenen Ebenen erforderlich sind, wenn N in der Größe variiert. Wenn die Anzahl der Paare 20 beträgt, kann die Normalkurve als Annäherung an die binomiale Expansion oder den angewendeten x 2 -Test verwendet werden.

2. Median Test:

Der Median-Test wird verwendet, um die Leistung von zwei unabhängigen Gruppen zu vergleichen, beispielsweise einer experimentellen Gruppe und einer Kontrollgruppe. Zuerst werden die beiden Gruppen zusammengewürfelt und ein gemeinsamer Median berechnet.

Wenn die beiden Gruppen zufällig aus derselben Population gezogen wurden, sollte die Hälfte der Werte in jeder Gruppe über und 1/2 unter dem gemeinsamen Median liegen. Um diese Nullhypothese zu testen, müssen wir eine 2 x 2-Tabelle erstellen und x 2 berechnen.

Die Methode wird in folgendem Beispiel gezeigt:

Beispiel:

Ein klinischer Psychologe möchte die Auswirkungen einer beruhigenden Droge auf den Tremor der Hand untersuchen. 14 psychiatrische Patienten erhalten das Medikament und 18 weitere Patienten erhalten eine harmlose Dosis. Die erste Gruppe ist die experimentelle, die zweite die Kontrollgruppe.

Steigert das Medikament die Stetigkeit - wie niedrigere Werte in der Versuchsgruppe zeigen? Da es uns nur darum geht, ob das Medikament den Tremor reduziert, ist dies ein einseitiger Test.

Median-Test für Versuchs- und Kontrollgruppen. Pluszeichen geben Werte über dem gemeinsamen Mittelwert an, Minuszeichen unter dem gemeinsamen Mittelwert.

N = 14 N = 18

Häufiger Median = 49, 5

Der gemeinsame Median ist 49, 5. In der Versuchsgruppe sind 4 Werte über und 10 unter dem üblichen Medianwert, statt den 7 oben und 7 unten, die zufällig zu erwarten sind. In der Kontrollgruppe liegen 12 Werte über und 6 unter dem üblichen Medianwert, anstelle der erwarteten 9 in jeder Kategorie.

Diese Frequenzen werden in der folgenden Tabelle eingetragen und X 2 wird durch die unten angegebene Formel mit Kontinuitätskorrektur berechnet:

AX 2 c von 3, 17 mit 1 Freiheitsgrad ergibt ein ap, das bei 0, 08 etwa in der Mitte zwischen 0, 05 und 0, 1 liegt. Wir wollten wissen, ob der Median der experimentellen Gruppe signifikant niedriger war als der der Kontrolle (was auf mehr Stabilität und weniger Tremor hinweist).

Für diese Hypothese ist ein einseitiger Test, p / 2, ungefähr 0, 04 und X 2 c ist auf dem 0, 5-Niveau signifikant. Wäre unsere Hypothese gewesen, dass sich die beiden Gruppen unterscheiden, ohne die Richtung anzugeben, hätten wir einen zweiseitigen Test gehabt und X 2 wäre als nicht signifikant markiert worden.

Etwas zaghaft gemacht, lautet unsere Schlussfolgerung, dass das Medikament eine gewisse Verringerung des Tremors bewirkt. Aufgrund der kleinen Proben und des Fehlens eines höchst signifikanten Befundes würde der klinische Psychologe das Experiment fast sicher wiederholen - vielleicht mehrmals.

X 2 ist im Median-Test allgemein anwendbar. Wenn jedoch N 1 und N 2 klein sind (z. B. weniger als etwa 10) und der X 2 -Test nicht genau ist, sollte das genaue Verfahren zur Berechnung der Wahrscheinlichkeiten verwendet werden.

Vorteile nichtparametrischer Tests:

1. Wenn die Stichprobengröße sehr klein ist, gibt es möglicherweise keine Alternative zur Verwendung eines nichtparametrischen statistischen Tests, es sei denn, die Art der Bevölkerungsverteilung ist genau bekannt.

2. Nichtparametrische Tests machen normalerweise weniger Annahmen über die Daten und können für eine bestimmte Situation relevanter sein. Darüber hinaus ist die durch den nichtparametrischen Test getestete Hypothese möglicherweise für die Forschungsuntersuchung geeigneter.

3. Es stehen nichtparametrische statistische Tests zur Verfügung, um Daten zu analysieren, die inhärent in Rängen liegen, sowie Daten, deren scheinbar numerische Bewertungen die Rangesstärke haben. Das heißt, der Forscher kann möglicherweise nur von seinen Subjekten sagen, dass einer mehr oder weniger über die Charakteristik verfügt als der andere, ohne jedoch sagen zu können, wie viel mehr oder weniger.

Wenn wir beispielsweise eine solche Variable wie Angst untersuchen, können wir möglicherweise feststellen, dass das Subjekt A ängstlicher ist als das Subjekt B, ohne zu wissen, wie viel ängstlicher A ist.

Wenn sich Daten inhärent in Rängen befinden oder wenn sie nur als Plus oder Minus (mehr oder weniger, besser oder schlechter) kategorisiert werden können, können sie mit nichtparametrischen Methoden behandelt werden, während sie nicht mit parametrischen Methoden behandelt werden können, sofern sie nicht prekär sind Möglicherweise werden unrealistische Annahmen über die zugrunde liegenden Ausschüttungen gemacht.

4. Es stehen nichtparametrische Methoden zur Verfügung, um Daten zu behandeln, die einfach klassifizierend oder kategorial sind, dh in einer nominalen Skala gemessen werden. Für solche Daten gilt keine parametrische Technik.

5. Es gibt geeignete nichtparametrische statistische Tests zur Behandlung von Proben, die sich aus Beobachtungen verschiedener Bevölkerungsgruppen zusammensetzen. Parametrische Tests können solche Daten häufig nicht verarbeiten, ohne dass wir scheinbar unrealistische Annahmen machen müssen oder umständliche Berechnungen erfordern.

6. Nichtparametrische statistische Tests sind normalerweise leichter zu erlernen und anzuwenden als parametrische Tests. Darüber hinaus ist ihre Interpretation oft direkter als die Interpretation parametrischer Tests.

Nachteile nichtparametrischer Tests:

1. Wenn alle Annahmen einer parametrischen statistischen Methode tatsächlich in den Daten erfüllt sind und die Forschungshypothese mit einem parametrischen Test getestet werden könnte, sind nicht-parametrische statistische Tests verschwenderisch.

2. Der Verschwendungsgrad wird durch die Leistungseffizienz des nichtparametrischen Tests ausgedrückt.

3. Ein weiterer Einwand gegen nichtparametrische statistische Tests ist, dass sie nicht systematisch sind, während parametrische statistische Tests systematisiert wurden und verschiedene Tests lediglich Variationen eines zentralen Themas darstellen.

4. Ein weiterer Einwand gegen nichtparametrische statistische Tests hat mit Bequemlichkeit zu tun. Tabellen, die für die Implementierung nichtparametrischer Tests erforderlich sind, sind weit verstreut und erscheinen in verschiedenen Formaten.