Konzept des Chi-Square-Tests

In diesem Artikel werden wir über das Konzept des Chi-Quadrat-Tests diskutieren.

Der Chi-Quadrat-Test wurde verwendet, um zu testen, dass Allele nach Mendelschen Prinzipien getrennt werden. Es ist ein Vergleich von erwarteten und beobachteten Zahlen erforderlich. Sie wird in Statistiken zur Beurteilung der Signifikanz der Stichprobendaten verwendet. Prof. Fisher entwickelte den Chi-Quadrat-Test. Symbolisch als X 2 (ausgesprochen als Ki-Quadrat).

Es ist ein statistisches Maß, mit dessen Hilfe die Signifikanz der Differenz zwischen den beobachteten genotypischen Zahlen (Häufigkeiten) und den erwarteten Zahlen (Häufigkeiten), die aus einem hypothetischen Universum erhalten werden, beurteilt werden kann.

Ob das experimentelle und vorhergesagte Verhältnis in guter Übereinstimmung ist oder nicht. Dies könnte durch den Chi-Quadrat-Test getestet werden. Dieser Test stellt fest, dass im Verlauf eines Versuchsverfahrens, das sich mit quantitativen Daten befasst, einige Abweichungen, die als "experimenteller Fehler" bezeichnet werden, allein dem Zufallsfehler zuzuschreiben sind.

Dies kann nach folgender Formel berechnet werden:

X 2 = ∑ = (Beobachtungswert - Erwarteter Wert) 2 / Erwarteter Wert

Nehmen wir als Beispiel das Verhältnis von Phänotyp und Genotyp der von Mendel durchgeführten Experimente. Die Anwendung von X 2 zeigt, dass die beobachteten Häufigkeiten mit den vorhergesagten Verhältnissen übereinstimmen. Die Daten von Mendels tatsächlichen Experimenten sind in der folgenden Tabelle angegeben. Die Schwankungen des erwarteten und des vorhergesagten Verhältnisses beruhen allein auf experimentellen Fehlern.

Mendel beobachtete in seinem Experiment das Verhältnis von 9: 3: 3: 1 im Dihybridkreuz in der F2-Generation, während das Verhältnis in Monohybridkreuz in der F2-Generation 1: 2: 1 betrug. Er fand 315 Runden, gelbe Samen, 101 Runden, grüne Samen, 108 Falten, gelbe Samen und 32 Falten, grüne Samen.

Die erwarteten Zahlen jedes Phänotyps sind also 556 (9/16) = 312, 75 runde, gelbe Samen; 556 (3/16) = 104, 25 Runde. Grüne Samen; 556 (3/16) = 104, 25 Falten, gelbe Samen und 556 (1/16) = 34, 75 Falten, grüne Samen. Chi-Quadrat zeigt, ob der Unterschied zwischen dem tatsächlichen und dem vorhergesagten Verhältnis auf experimentellen Fehlern beruht oder nicht.

Der berechnete Chi-Quadrat-Wert beträgt 0, 470 und wird durch Anwenden der folgenden Formel erhalten:

X 2 = ∑ = (Beobachtungswert - Erwarteter Wert) 2 / Erwarteter Wert

Der Freiheitsgrad ist für die Berechnung von X 2 erforderlich, die Anzahl der unabhängigen Einschränkungen bestimmt die Anzahl der Freiheitsgrade (oder df). Der Freiheitsgrad ist ein Maß für die Anzahl unabhängiger Variablen, die in einem bestimmten Experiment vorhanden sind.

Es wird angegeben, dass sich die Fehlerwahrscheinlichkeit nur auf eine unabhängige Variable auswirkt. In den oben angegebenen Mendels-Experimenten sind die Variablen nur 4, der Freiheitsgrad ist 4 -1 = 3. Die Anzahl von drei beliebigen phänotypischen Klassen wird bestimmt, die Anzahl der vierten Klasse ist festgelegt.

Um die Wahrscheinlichkeit herauszufinden, müssen wir den Chi-Quadrat-Tisch konsultieren.

Die Tabelle ist wie folgt angegeben:

Die Hypothese ist mit dem P-Wert niemals einverstanden oder widerspricht ihnen. Die Ergebnisse des Prüfers, die hinsichtlich der Hypothese akzeptabel oder nicht akzeptabel sind, werten die Ergebnisse der Chi-Quadrat-Beobachtungen aus. Die 5 Prozentpunkte (0-05) auf der Tabelle werden normalerweise als willkürlicher Standard für die Bestimmung der Signifikanz oder der Passungsgüte gewählt.

Der Tabellenwert von X 2 für den Freiheitsgrad 3 bei 5% beträgt 7, 82, ein Chi-Quadrat-Wert beträgt 0, 47, was niedriger als der Tabellenwert ist, und ist daher korrekt. Mit anderen Worten kann gesagt werden, dass eine Wahrscheinlichkeit bei einem Signifikanzniveau von 5% 7, 82 ist, was mehr / größer ist, daher ist die Hypothese korrekt. Wenn es weniger als 5% ist, dann abgelehnt.

Nehmen wir ein anderes Beispiel, um die Anwendung von Chi-Quadrat-Tests zu verstehen. Die genetische Theorie besagt, dass Kinder mit einem Elternteil der Blutgruppe A und dem anderen der Blutgruppe B immer von einer der drei Arten A, AB, B sind und dass der Anteil der drei Arten im Durchschnitt 1: 2 beträgt : 1. Es wurde eine Stichprobe von 300 Kindern gesammelt - 30% waren Typ A, 45% - Typ AB und der Rest - Typ B.

Der Tabellenwert X 2 für (3 - 1) 2d. bei 5% (0, 05) ist das Signifikanzniveau 5, 99. Der berechnete Wert von Chi-Quadrat ist 4, 5, was niedriger ist als der Tabellenwert und kann aufgrund des zufälligen Versuchsfehlers als aufgetreten angesehen werden. Dies stützt die theoretische Hypothese der Vererbungstheorie (Segregation von Allelen), dass A, AB und B im Verhältnis 1: 2: 1 stehen.

Ein anderes Beispiel in diesem Zusammenhang ist wie folgt:

Das Verhältnis der Bohne in vier Gruppen, nämlich A, B, C und D, sollte 9: 3: 3: 1 betragen. Ein Bauer säte 1600 Bohnen. Die Ergebnisse seines Experiments zeigen, dass in vier Gruppen die Daten 882, 313, 287 und 118 sind. Stützt das experimentelle Ergebnis die Theorie, dass sie im Verhältnis 9: 3: 3: 1 liegen?

Unter der Nullhypothese, dass die Versuchsergebnisse die Theorie stützen, sind die erwarteten Häufigkeiten:

9/10 x 1600, 3/16 x 1600, 3/16 x 1600, 1/16 x 1600 = 900, 300, 300, 100

Somit:

Der Tabellenwert von X 2 für 3 df bei einem Signifikanzniveau von 5% = 7, 815.

Da der berechnete Wert von X 2 niedriger als der Tabellenwert ist, kann die Hypothese akzeptiert werden und die Ergebnisse stimmen mit der Theorie überein.

Der Chi-Quadrat-Test wird auch verwendet, um zu bestimmen, ob sich die Bevölkerung im Hardy-Weinberg-Gleichgewicht befindet.

Eine Anwendung der Hardy-Weinberg-Methode ist die Vorhersage der Häufigkeit von einzelnen Homozygoten für ein schädliches rezessives Allel. Diese Autoren haben entdeckt, dass bei einer Population mit zufälliger Paarung (Panmictic) ohne Mutationen, ohne Selektionsdruck, ohne genetische Drift und ohne Migration die relativen Häufigkeiten jedes Gens (Allels) von Generation zu Generation konstant bleiben.

Das Gesetz teilt den Genotypfrequenzen die Genfrequenzen in zufällig zusammengehörenden Populationen mit, wobei die Allele, die sich an einem bestimmten Ort aufteilen, die erwarteten Genotypfrequenzen in dieser Population leicht berechnen können. Dies ist als Hardy-Weinberg-Gesetz bekannt oder wird oft als Gesetz des Bevölkerungsgleichgewichts bezeichnet.

Sobald wir die Häufigkeiten der Allele in der Population kennen, ist es möglich, die Häufigkeit zu berechnen, mit der der Genotyp aus dieser Generation im Nachwuchs vorhanden sein wird. Die Population von sexuell reproduzierenden diploiden Organismen an einem Locus mit zwei Allelen mit den Frequenzen p und q, nach einer Generation der zufälligen Paarung, wären die Frequenzen des Genotyps AA, Aa und aa sind p 2, 2pq, q 2 .

Nehmen wir ein Beispiel, dass zwei Allele des Gens AA dominieren, während aa, dh die Allele rezessiv sind. Nach den Erbschaftsgesetzen von Mendel wäre das Genotyp-Verhältnis 25% AA (homozygot dominant), 50 wären Aa (heterozygot) und 25% wären aa (homozygot rezessiv).

Die statistische Formel für dieses Gesetz lautet p 2 + 2pq + q 2 . Nach Mendels Gesetzen sollte die genetische Kombination folgende sein.

Dies zeigt, dass Allele von Generation zu Generation konstant bleiben.

Die Anwendung des Chi-Quadrat-Tests unterscheidet sich geringfügig von der Anwendung des Hardy-Weinberg-Gesetzes, da es sich um Frequenzen des erwarteten Genotyps und nicht um Zahlen handelt. Der Freiheitsgrad wird n-2 anstelle von n-1 angenommen.