8 Wichtige Arten von Wahrscheinlichkeitsproben

Dieser Artikel beleuchtet die acht wichtigen Arten von Wahrscheinlichkeits-Stichproben, die zur Durchführung von Sozialforschung verwendet werden. Es gibt folgende Typen: 1. Einfache Zufallsstichprobe 2. Systematische Stichprobenentnahme 3. Stratifizierte Stichprobenentnahme 4. Proportional geschichtete Probenahme 5. Überproportionale geschichtete Probenahme 6. Optimale Zuteilungsprobe 7. Cluster-Probenahme 8. Multiphasen-Probenahme.

Geben Sie # 1 ein. Einfache Zufallsstichprobe:

Einfache Zufallsstichproben sind gewissermaßen das Grundthema aller wissenschaftlichen Stichproben. Es ist das primäre Design für die Wahrscheinlichkeitsentnahme. In der Tat sind alle anderen Methoden der wissenschaftlichen Probenahme Variationen der einfachen Stichprobenauswahl. Das Verständnis einer verfeinerten oder komplexen Vielzahl von Stichprobenverfahren setzt das Verständnis der einfachen Stichprobenauswahl voraus.

Eine einfache Zufallsstichprobe wird durch einen Prozess ausgewählt, der nicht nur jedem Element in der Grundgesamtheit die gleiche Chance bietet, in die Stichprobe aufgenommen zu werden, sondern auch die Auswahl jeder möglichen Kombination von Fällen in der gewünschten Stichprobengröße gleich wahrscheinlich macht. Angenommen, man hat zum Beispiel eine Bevölkerung von sechs Kindern, nämlich A, B, C, D, E und F.

Es gibt die folgenden möglichen Kombinationen von Fällen, von denen jedes zwei Elemente aus dieser Grundgesamtheit aufweist, nämlich AB, AC, AD, AE, AF, BC, BD, BE, BF, CD, CE, EF, DE, DF und EF, dh in allen 15 Kombinationen.

Wenn wir jede Kombination auf Karten gleicher Größe schreiben, die Karten in einen Korb legen, gründlich mischen und eine Person mit verbundenen Augen eine auswählen lassen, wird jede der Karten die gleiche Chance haben, ausgewählt / in die Stichprobe aufgenommen zu werden.

Die beiden Fälle (das Paar), die auf die Karte geschrieben werden, die von der blind gefalteten Person aufgegriffen wird, bilden somit die gewünschte einfache Stichprobe. Wenn man einfache Zufallsstichproben von drei Fällen aus der obigen Population von sechs Fällen auswählen möchte, sind die möglichen Stichproben von jeweils drei Fällen ABC, ABD, ABE, ABF, ACD, ACE, ACF, ADE, ADF, BCD, BCE, BCF, BDE, BDF, BEF, CDE, CDF, CEF und DEF, dh insgesamt 20 Kombinationen.

Jede dieser Kombinationen hat eine gleiche Auswahlmöglichkeit in der Stichprobe. Mit derselben Methode kann aus dieser Grundgesamtheit eine einfache Zufallsstichprobe aus vier Fällen ausgewählt werden.

Prinzipiell kann man mit dieser Methode aus einer Population beliebig große Stichproben auswählen. In der Praxis wäre es jedoch eine sehr umständliche und in manchen Fällen unmögliche Aufgabe, alle möglichen Kombinationen der gewünschten Fallzahlen aufzulisten. Das gleiche Ergebnis kann erhalten werden, indem einzelne Elemente unter Verwendung der obigen Methode (Lotterie) nacheinander ausgewählt werden oder ein Buch mit Zufallszahlen verwendet wird.

Das Tabellenbuch mit der Liste der Zufallszahlen ist nach Tippet benannt, der das Konzept der Zufälligkeit zuerst in ein Buch der Zufallszahlen übersetzt.

Dieses Buch wird durch ein sehr kompliziertes Verfahren so erstellt, dass die Zahlen keinen Hinweis auf eine systematische Ordnung zeigen, das heißt, niemand kann die folgende Nummer anhand der vorhergehenden Zahl schätzen und umgekehrt. Lassen Sie uns die zwei Methoden zum Zeichnen einer einfachen Stichprobe diskutieren.

Lotterie-Methode:

Diese Methode umfasst die folgenden Schritte:

(a) Jedem Mitglied oder Element in der "Bevölkerung" wird eine eindeutige Nummer zugewiesen. Das heißt, keine zwei Mitglieder haben dieselbe Nummer,

(b) Jede Nummer ist auf einer separaten Karte oder einem Chip vermerkt. Jeder Chip oder jede Karte sollte in Bezug auf Gewicht, Größe und Form usw. allen anderen ähnlich sein.

(c) Die Karten oder Chips werden in eine Schüssel gegeben und sorgfältig gemischt.

(d) Eine blind gefaltete Person wird aufgefordert, Chips oder Karten aus der Schüssel zu entnehmen.

Unter diesen Umständen kann davon ausgegangen werden, dass die Wahrscheinlichkeit, eine beliebige Karte zu ziehen, dieselbe ist wie die Wahrscheinlichkeit, eine andere Karte zu ziehen. Da jede Karte ein Mitglied der Bevölkerung darstellt, wäre die Wahrscheinlichkeit der Auswahl jeweils gleich.

Wenn nach der Auswahl einer Karte (Chip) diese in die Schüssel eingesetzt und der Inhalt erneut gründlich gemischt wurde, hätte jeder Chip die gleiche Wahrscheinlichkeit, dass er in der zweiten, vierten oder n-ten Zeichnung ausgewählt wird. Ein solches Verfahren würde letztendlich eine einfache Stichprobe ergeben.

Sample mit Hilfe von Zufallszahlen auswählen :

Wir haben bereits gesagt, was Zufallszahlen sind. Diese Zahlen helfen zu vermeiden, dass Vorurteile (ungleiche Chancen) für Elemente, die eine Grundgesamtheit umfassen, bei der Auswahl der Stichprobe in die Stichprobe einbezogen werden.

Diese Zufallszahlen sind so vorbereitet, dass sie das mathematische Kriterium der vollständigen Zufälligkeit erfüllen. Jedes Standardbuch zur Statistik enthält einige Seiten mit Zufallszahlen. Diese Nummern sind im Allgemeinen auf aufeinanderfolgenden Seiten in Spalten aufgeführt.

Folgendes ist ein Teil eines Satzes von Zufallszahlen:

Die Verwendung der Tabellen mit Zufallszahlen umfasst die folgenden Schritte:

(a) Jedem Mitglied der Bevölkerung wird eine eindeutige Nummer zugewiesen. Zum Beispiel kann ein Mitglied die Nummer 77 und ein anderes 83 usw. haben.

(b) Die Tabelle der Zufallszahlen wird an einem beliebigen Punkt eingegeben (mit einer blinden Markierung auf einer beliebigen Seite des Tabellenbuchs), und die Fälle, deren Nummern aufsteigen, wenn man sich von diesem Punkt aus die Spalte nach unten bewegt, werden bis in die Stichprobe einbezogen die gewünschte Anzahl von Fällen wird erhalten.

Angenommen, unsere Bevölkerung besteht aus fünfhundert Elementen, und wir möchten fünfzig Fälle als Stichprobe ziehen. Angenommen, wir verwenden die letzten drei Ziffern in jeder Anzahl von fünf Ziffern (da die Universumsgröße 500 ist, dh dreizeilig).

Wir fahren die Spalte hinunter, beginnend mit 42827; Da wir uns jedoch entschieden haben, nur drei Ziffern zu verwenden (sagen wir die letzten drei), beginnen wir mit 827 (die ersten beiden Ziffern werden ignoriert). Wir notieren jetzt jede Zahl unter 501 (da die Bevölkerung 500 ist).

Die Stichprobe würde sich aus den Bestandteilen der Bevölkerung zusammensetzen, deren Nummern den ausgewählten entsprechen. Wir hören auf, nachdem wir 50 (von uns festgelegte Größe) Elemente ausgewählt haben. Auf der Grundlage des obigen Abschnitts der Tabelle wählen wir 12 Zahlen aus, die den ausgewählten entsprechen. Wir werden 12 Fälle wählen, die den Zahlen 237, 225, 280, 184, 203, 190, 213, 027, 336, 281, 288, 251 entsprechen.

Merkmale der einfachen Zufallsauswahl:

Wir betrachten zunächst eine sehr wichtige Eigenschaft der einfachen Stichproben. Je größer die Größe der Stichprobe ist, desto wahrscheinlicher ist es, dass ihr Mittelwert (Durchschnittswert) nahe an dem Bevölkerungsmittelwert liegt, dh dem wahren Wert. Lassen Sie uns diese Eigenschaft veranschaulichen, indem wir eine Bevölkerung mit sechs Mitgliedern (Kindern) annehmen.

Das Alter dieser Kinder sei jeweils: A = 2 Jahre, B = 3 Jahre, C = 4 Jahre, D = 6 Jahre, E = 9 Jahre und F = 12 Jahre. Lassen Sie uns aus dieser Grundgesamtheit Zufallsstichproben von einem, zwei, drei, vier und fünf Mitgliedern ziehen und sehen, wie sich die Mittelwerte der Stichprobe (Durchschnittswerte) in Bezug auf den wahren "Grundgesamtheit" (dh 2 + 3 + 4) verhalten + 6 + 9 + 12 = 36/6 = 6). Die folgende Tabelle veranschaulicht das Verhalten der Probenmittel in Bezug auf die Größe der Proben.

Tabelle mit den möglichen Stichproben von einem, zwei, drei, vier und fünf Elementen (Kinder, aus der Bevölkerung von sechs Kindern im Alter von 2, 3, 4, 6, 9 bzw. 12 Jahren):

In der angegebenen Tabelle sind alle möglichen Zufallsmuster verschiedener Größen (dh 1, 2, 3, 4 und 5) und ihre entsprechenden Mittel gezeigt. Der wahre (Bevölkerungs-) Mittelwert beträgt 6 Jahre. Dieser Mittelwert kann natürlich berechnet werden, indem die Mittelwerte der Gesamtkombinationen der Elemente in der Grundgesamtheit für eine gegebene Stichprobengröße addiert werden.

In der Tabelle sehen wir zum Beispiel, dass es für die Stichprobengröße von drei Elementen 20 mögliche Kombinationen von Elementen gibt, wobei jede Kombination die gleiche Chance hat, als Stichprobe nach dem Wahrscheinlichkeitsprinzip ausgewählt zu werden.

Durch Addition der Mittelwerte dieser möglichen Kombinationen in der Tabelle ergibt sich die Gesamtpunktzahl von 120. Der Mittelwert beträgt 120 ÷ 20 = 6, was natürlich auch der Durchschnittswert der Bevölkerung ist. Dies gilt auch für andere Kolonnen.

Lassen Sie uns nun die Tabelle sorgfältig untersuchen. Wir werden feststellen, dass es für Stichproben von jeweils einem Element (Spalte A) nur einen Mittelwert gibt, der um nicht mehr als eine Einheit vom tatsächlichen Bevölkerungsdurchschnitt von 6 Jahren abweicht. Das heißt, alle anderen, nämlich 2, 3, 4, 9 und 12, weichen um mehr als eine Einheit vom Populationsmittelwert ab, dh 6. Wenn wir die Stichprobe vergrößern, z. B. in Spalte B, wo Wenn die Stichprobengröße 2 ist, finden wir einen größeren Anteil der Mittelwerte (Durchschnittswerte), die nicht um mehr als 1 Einheit vom Bevölkerungsdurchschnitt abweichen.

Die obige Tabelle zeigt, dass es für die Stichprobe von zwei 15 mögliche Kombinationen und somit 15 mögliche Mittel gibt. Von diesen 15 Mitteln gibt es 5 Mittel, die nicht um mehr als 1 Einheit vom Bevölkerungsdurchschnitt abweichen.

Das heißt, es gibt 33% der Stichprobenmittelwerte, die nahe am Populationsmittelwert innerhalb von +1 und -1 Einheiten liegen. In Spalte C der Tabelle sehen wir 20 mögliche Elementkombinationen für die Stichprobengröße von jeweils drei Elementen.

Aus den 20 möglichen Stichprobenmitteln stellen wir fest, dass 10, dh 50%, nicht um mehr als 1 Einheit vom Populationsmittel abweichen. Für die Stichprobengröße von vier Elementen gibt es 67% der Mittelwerte, die im Bereich von +1 und -1 Einheit vom wahren (Bevölkerungs-) Mittel liegen.

Schließlich gibt es für die Stichprobengröße von fünf Elementen viel mehr, dh 83% solcher Mittel oder Schätzungen. Die Lektion, die aus unseren Beobachtungen hervorgeht, ist ziemlich klar, dh je größer die Stichprobe, desto wahrscheinlicher ist es, dass ihr Mittelwert dem Bevölkerungsmittelwert nahe kommt.

Dies ist dasselbe, als würde man sagen, dass die Streuung der Schätzungen (Mittelwerte) mit zunehmender Probengröße abnimmt. Dies ist in der obigen Tabelle deutlich zu sehen. Bei der Stichprobengröße von Eins (Spalte A) ist der Mittelbereich der größte, dh zwischen 2 und 12 = 10. Bei der Stichprobengröße von Zwei liegt der Bereich zwischen 2, 5 und 10, 5 = 8.

Für die Stichprobengröße von drei, vier und fünf beträgt der Variabilitätsbereich der Mittel jeweils 3 bis 9 = 6, 3, 8 bis 7, 8 = 4 und 4, 8 bis 6, 8 = 2. Es ist auch aus der Tabelle ersichtlich, dass es sich um eine Stichprobe handelt Der Mittelwert unterscheidet sich vom Populationsmittelwert, je seltener er auftritt.

Wir können dieses Phänomen in Bezug auf einfache Zufallsstichproben anhand einer Reihe von Kurven, die die Beziehung zwischen der Variabilität der Schätzungen und der Stichprobengröße darstellen, klar darstellen. Betrachten wir eine große Einwohnerzahl. Man kann sich vorstellen, dass ihr Alter zwischen mindestens 1 Jahr und höchstens 80 Jahren liegt.

Die normale und vernünftige Erwartung wäre, dass es weniger Fälle gibt, wenn man sich den Extremen nähert, und dass die Anzahl der Fälle fortschreitend und symmetrisch zunimmt, wenn wir uns von diesen Extremen entfernen.

Das Durchschnittsalter der Bevölkerung beträgt, sagen wir, 40 Jahre. Eine solche Verteilung der Bewohner kann durch eine Kurve dargestellt werden, die als normale oder glockenförmige Kurve (A in der folgenden Abbildung) bezeichnet wird. Nehmen wir nun an, dass wir aus dieser Grundgesamtheit verschiedene Stichproben unterschiedlicher Größe entnehmen, z. B. 10.100 und 10.000. Für jede Stichprobengröße erhalten wir eine sehr große Anzahl von Stichproben aus der Bevölkerung.

Jede dieser Stichproben gibt uns eine bestimmte Schätzung des Bevölkerungsmittelwerts. Einige dieser Mittel sind Überschätzungen und einige Unterschätzungen des Bevölkerungsmerkmals (Durchschnitts- oder Durchschnittsalter). Einige Mittel werden sehr nahe sein, einige ziemlich weit.

Wenn wir solche Stichprobenmittel für eine bestimmte Stichprobengröße darstellen und diese Punkte verbinden, erhalten wir jeweils eine normale Kurve. Unterschiedliche Normalkurven repräsentieren somit die Werte der Abtastmittelwerte für Proben unterschiedlicher Größe.

Das obige Diagramm approximiert ein Bild davon, wie sich die Abtastmittel relativ zur Größe der Probe verhalten würden. Die Kurve A repräsentiert die Altersorte einzelner Personen. Der geschätzte Mittelwert der Stichproben von jeweils 10 Individuen ergibt sich aus der Kurve B, die eine recht breite Streuung vom wahren Bevölkerungsdurchschnitt (40 Jahre) zeigt.

Die Stichprobenmittelwerte von jeweils 100 Individuen bilden eine Normalkurve C, die eine viel geringere Abweichung vom Populationsmittelwert zeigt. Schließlich ergibt sich der Mittelwert der Proben von 10.000 aus einer Kurve, die der vertikalen Linie, die dem Bevölkerungsdurchschnitt entspricht, sehr nahe kommt. Die Abweichung der die Kurve D darstellenden Werte vom Populationsmittelwert wäre vernachlässigbar, wie aus dem Diagramm ersichtlich ist.

Aus der obigen Abbildung ist auch sehr leicht erkennbar, dass für Proben beliebiger Größe der wahrscheinlichste Mittelwert der Stichprobe der Mittelwert der Bevölkerung ist. Am nächsten sind die Mittelwerte, die nahe an dem Bevölkerungsmittelwert liegen.

Daraus lässt sich schlussfolgern, dass je mehr ein Stichprobenmittelwert vom Populationsmittelwert abweicht, desto unwahrscheinlicher ist es. Und schließlich sehen wir auch das, was wir bereits über das Verhalten der Stichproben gesagt haben. Je größer die Stichprobe, desto wahrscheinlicher ist es, dass ihr Mittelwert dem Populationsmittelwert entspricht.

Diese Art von Verhalten der einfachen Zufallsstichproben (Wahrscheinlichkeit) in Bezug auf den Mittelwert sowie auf Proportionen und andere Arten von Statistiken ermöglicht es uns, nicht nur die Bevölkerungsmerkmale (z. B. Mittelwert), aber auch die Wahrscheinlichkeit, dass die Stichprobe um einen bestimmten Betrag vom tatsächlichen Bevölkerungswert abweicht.

Ein typisches Merkmal der einfachen Zufallsstichprobe ist, dass bei einer großen Population im Vergleich zur Stichprobengröße (z. B. mehr als zehnmal so groß), die Variabilität der Stichprobenverteilungen stärker durch die absolute Anzahl der Fälle in der EU beeinflusst wird Stichprobe als durch den Anteil der Bevölkerung, den die Stichprobe enthält.

Mit anderen Worten, die Größe der Fehler, die wahrscheinlich bei der Probenahme auftreten, hängt mehr von der absoluten Größe der Stichprobe ab als von dem Anteil, den sie mit der Grundgesamtheit hat, dh wie groß oder wie klein ein Teil davon ist Population.

Je größer die Größe der Zufallsstichprobe ist, desto größer ist die Wahrscheinlichkeit, dass die Bevölkerungskennlinie unabhängig von ihrem Anteil im Verhältnis zur Bevölkerung angemessen geschätzt wird.

Somit würde die Schätzung einer Volksabstimmung bei einer nationalen Umfrage im Rahmen einer tolerierbaren Fehlerquote keine wesentlich größere Stichprobe erfordern als die, die für eine Schätzung der Bevölkerungsabstimmung in einer bestimmten Provinz erforderlich wäre, in der die Umfrage zustande kommt ist im Zweifel.

Um dies zu erläutern, wird eine Stichprobe von 500 (Stichprobe von 100%) eine perfekte Genauigkeit ergeben, wenn eine Gemeinde nur 500 Einwohner hat. Eine Stichprobe von 500 ergibt für ein Township mit 1000 Einwohnern eine etwas genauere Genauigkeit als für eine Stadt mit 10.000 Einwohnern. Aber jenseits des Punktes, an dem die Probe ein großer Teil des "Universums" ist, gibt es keinen merklichen Unterschied in der Genauigkeit, wenn die Größe des "Universums" zunimmt.

Bei jedem gegebenen Genauigkeitsgrad würden identische Stichprobengrößen für Gemeinden unterschiedlicher Bevölkerungsgruppe den gleichen Genauigkeitsgrad erzielen, z. B. im Bereich von 10.000 bis 10 Millionen. Das Verhältnis der Stichprobengröße zu den Bevölkerungen dieser Gemeinschaften bedeutet nichts, obwohl dies wichtig erscheint, wenn wir intuitiv vorgehen.

Typ # 2. Systematische Probenahme:

Diese Art der Abtastung ist für alle praktischen Zwecke eine Annäherung an die einfache Stichprobenauswahl. Voraussetzung ist, dass die Bevölkerung durch ihre Reihenfolge eindeutig identifiziert werden kann. Zum Beispiel können die Bewohner einer Gemeinde aufgelistet und ihre Namen alphabetisch neu angeordnet werden. Jeder dieser Namen kann eine eindeutige Nummer erhalten. Ein solcher Index wird als "Rahmen" der betreffenden Bevölkerung bezeichnet.

Angenommen, dieser Rahmen besteht aus 1.000 Mitgliedern mit jeweils einer eindeutigen Nummer, dh von 1 bis 1.000. Angenommen, wir möchten eine Stichprobe von 100 auswählen. Wir können mit der Auswahl einer Zahl zwischen 1 und 10 beginnen (beide enthalten). Nehmen wir an, wir treffen eine zufällige Auswahl durch Eingabe der Liste und erhalten 7.

Wir fahren dann mit der Auswahl der Mitglieder fort. beginnend mit 7 mit einem regelmäßigen Intervall von 10. Die ausgewählten Mitglieder werden ausgewählt: beginnend mit einem regulären Intervall von 10. Die ausgewählte Stichprobe würde also aus Elementen mit den Nrn. 7, 17, 27, 37, 47, … 977 bestehen. 987, 997. Diese Elemente zusammen würden eine systematische Stichprobe darstellen.

Es sollte beachtet werden, dass eine systematische Stichprobe nur dann als Wahrscheinlichkeitsstichprobe angesehen werden kann, wenn der erste Fall (z. B. 7) zufällig ausgewählt wurde und dann der zehnte Fall aus dem Rahmen ausgewählt wurde.

Wenn der erste Fall nicht zufällig ausgewählt wird, ist die resultierende Stichprobe keine Wahrscheinlichkeitsstichprobe, da die meisten Fälle, die sich nicht im Abstand von zehn von der ursprünglich gewählten Zahl befinden, eine Null haben (0) ) Wahrscheinlichkeit, in die Stichprobe aufgenommen zu werden.

Es ist zu beachten, dass bei der systematischen Probenahme, wenn der erste Fall zufällig gezogen wird, im Voraus keine Einschränkung hinsichtlich der Wahrscheinlichkeit besteht, dass ein bestimmter Fall in die Probe aufgenommen wird. Sobald jedoch der erste Fall ausgewählt ist, werden die Chancen nachfolgender Fälle entscheidend beeinflusst oder verändert. In dem obigen Beispiel haben die Fälle außer 17, 27, 37, 47 usw. keine Chance, in die Stichprobe aufgenommen zu werden.

Dies bedeutet, dass ein systematischer Stichprobenplan nicht alle möglichen Kombinationen von Fällen bietet, sondern die gleiche Chance, in die Stichprobe aufgenommen zu werden.

Daher können die Ergebnisse ziemlich trügerisch sein, wenn die Fälle in der Liste in einer zyklischen Reihenfolge angeordnet sind oder wenn die Bevölkerung hinsichtlich der untersuchten Merkmale (z. B. Einkommen oder Studienstunden) nicht gründlich durchmischt ist, dh in gewisser Weise dass jedes der zehn Mitglieder die gleiche Chance hatte, ausgewählt zu werden.

Typ # 3. Geschichtete Zufallsstichprobe:

Bei der geschichteten Zufallsauswahl wird die Grundgesamtheit zunächst in eine Anzahl von Schichten unterteilt. Solche Schichten können auf einem einzigen Kriterium basieren, z. B. Bildungsniveau, das eine Anzahl von Schichten ergibt, die den verschiedenen Bildungsniveaus entsprechen, oder auf der Kombination von zwei oder mehr Kriterien (z. B. Alter und Geschlecht), wodurch Schichten wie etwa männliche Männer entstehen 30 Jahre und Männer über 30 Jahre, Frauen unter 30 Jahre und Frauen über 30 Jahre.

Bei der geschichteten Zufallsstichprobe wird aus jeder der Schichten eine einfache Zufallsstichprobe genommen, und diese Unterabtastungen werden zusammengeführt, um die Gesamtstichprobe zu bilden.

Im Allgemeinen trägt die Schichtung des Universums zum Zweck der Probenahme zur Effizienz der Probenahme bei, wenn Klassen festgelegt werden, dh wenn die Population in Klassen von Mitgliedern oder Elementen unterteilt werden kann, die intern vergleichsweise homogen und relativ zueinander und heterogen sind in Bezug auf die untersuchten Merkmale. Nehmen wir an, Alter und Geschlecht sind zwei mögliche Grundlagen der Stratifizierung.

Sollten wir nun feststellen, dass die Stratifizierung aufgrund des Geschlechts (männlich / weiblich) zwei Schichten ergibt, die sich hinsichtlich der Bewertungen anderer relevanter Merkmale, die untersucht werden, deutlich voneinander unterscheiden, während das Alter als Grundlage der Stratifizierung dagegen nicht gilt Ertragsschichten, die sich hinsichtlich der Bewertungen der anderen signifikanten Merkmale erheblich voneinander unterscheiden, dann ist es ratsam, die Bevölkerung nach Geschlecht und nicht nach Alter zu stratifizieren.

Mit anderen Worten, das Kriterium des Geschlechts wird in diesem Fall eine effektivere Grundlage für die Schichtung sein. Es ist durchaus möglich, dass der Prozess der Zerlegung der Bevölkerung in innerhomogene Schichten, die hinsichtlich bestimmter relevanter Merkmale relativ heterogen sind, zu teuer ist.

In einer solchen Situation kann der Forscher wählen, eine große einfache Stichprobe auszuwählen und die hohen Kosten auszugleichen, indem er (durch eine große einfache Stichprobe) die Gesamtgröße der Probe erhöht und die mit der Stratifizierung verbundenen Gefahren vermeidet.

Es sollte klar verstanden werden, dass die Stratifizierung kaum etwas damit zu tun hat, dass die Probe eine Nachbildung der Bevölkerung ist.

Tatsächlich beziehen sich die Fragen bei der Entscheidung, ob eine Stratifizierung durchgeführt werden soll, hauptsächlich auf die erwartete Homogenität der definierten Schichten in Bezug auf die zu untersuchenden Merkmale und die vergleichenden Kosten verschiedener Präzisionsmethoden. Die geschichtete Zufallsauswahl umfasst wie die einfache Zufallsauswahl repräsentative Stichprobenpläne.

Wir wenden uns nun der Diskussion über die Hauptformen oder die geschichtete Probenahme zu. Die Anzahl der Fälle, die in jeder Schicht ausgewählt werden, kann proportional zur Stärke der Schicht sein oder in keinem Verhältnis dazu stehen.

Die Anzahl der Fälle kann von Schicht zu Schicht gleich sein oder je nach Stichprobenplan von Schicht zu Schicht variieren. Wir werden nun kurz auf diese zwei Formen eingehen, dh verhältnismäßige und überproportionale geschichtete Stichproben.

Geben Sie # 4 ein. Proportional geschichtete Stichproben :

Bei der proportionalen Probenahme werden Fälle aus jeder Schicht in demselben Verhältnis gezogen, wie sie im Universum vorkommen. Angenommen, wir wissen, dass 60% der "Bevölkerung" männlich und 40% weiblich sind. Bei einer anteiligen geschichteten Stichprobe mit Bezug auf diese „Population“ würde eine Stichprobe so gezogen, dass diese gleiche Aufteilung zwischen den Geschlechtern in der Stichprobe mit 60:40 reflektiert wird.

Wenn das systematische Probenahmeverfahren in einer Studie verwendet wird, bestimmt die Basis, auf der die Liste erstellt wird, ob die resultierende Probe eine proportionale geschichtete Probe ist oder nicht. Wenn zum Beispiel jeder 7. Name in einer regulären Reihenfolge aus einer Liste alphabetisch angeordneter Namen ausgewählt wird, sollte das Ergebnis etwa 1/7 der Namen enthalten, die mit jedem Buchstaben des Alphabets beginnen.

Die resultierende Stichprobe wäre in diesem Fall eine proportionale geschichtete alphabetische Stichprobe. Wenn die alphabetische Anordnung völlig unabhängig ist und für das untersuchte Problem keine Rolle spielt, kann die Probe natürlich als Zufallsstichprobe mit gewissen Einschränkungen betrachtet werden, die für die oben diskutierten systematischen Proben typisch sind.

Für das Abtasten der verschiedenen Schichten in unterschiedlichen oder ungleichen Verhältnissen können verschiedene Gründe angeführt werden. Manchmal ist es erforderlich, den Anteil der Stichproben aus Schichten mit einer geringen Anzahl von Fällen zu erhöhen, um zu gewährleisten, dass diese Schichten überhaupt Stichproben erhalten.

Wenn Sie beispielsweise zu einem bestimmten Zeitpunkt eine Studie über den Einzelhandelsverkauf von Bekleidungsstücken in einer bestimmten Stadt planen, könnte eine einfache Stichprobe von Einzelhandelsgeschäften für Kleidungsstücke keine genaue Schätzung des Gesamtverkaufsvolumens liefern, da dies eine kleine ist Die Anzahl der Betriebe mit einem sehr großen Anteil am Gesamtumsatz wird möglicherweise von der Stichprobe ausgeschlossen.

In diesem Fall wäre es klug, die Bevölkerung der Bekleidungsgeschäfte in Bezug auf einige wenige Bekleidungsgeschäfte, die ein sehr großes Umsatzvolumen haben, in die oberste Schicht einzuordnen. Der Forscher tut gut daran, alle in seine Stichprobe aufzunehmen.

Das heißt, er kann zuweilen gut tun, um eine 100% ige Probe aus dieser Schicht und einen viel geringeren Prozentsatz der Fälle aus den anderen Schichten zu entnehmen, die eine große Anzahl von Geschäften repräsentieren (mit geringem oder mäßigem Umsatzvolumen). Allein eine solche überproportionale Stichprobe liefert höchstwahrscheinlich verlässliche Schätzungen für die Bevölkerung.

Ein weiterer Grund, einen größeren Teil der Fälle aus einer Schicht als aus einer anderen zu ziehen, ist der, dass der Forscher die Fälle innerhalb jeder Schicht zur weiteren Analyse unterteilen möchte.

Die auf diese Weise abgeleiteten Teilschichten enthalten möglicherweise nicht alle eine ausreichende Anzahl von Fällen, um Proben aus den anderen Teilschichten und in demselben Verhältnis wie die anderen Teilschichten zu entnehmen, und würden daher nicht genügend Fälle bieten, um als ausreichende Grundlage für die weitere Analyse zu dienen. In diesem Fall muss möglicherweise ein höherer Anteil der Fälle aus der Subschicht entnommen werden.

Im Allgemeinen kann man sagen, dass die höchste Genauigkeit und Repräsentation erzielt werden kann, wenn Proben aus den verschiedenen Schichten ihre relativen Variabilitäten in Bezug auf die untersuchten Merkmale angemessen widerspiegeln und nicht ihre relative Größe in der "Population" darstellen.

Es ist ratsam, stärker in Schichten zu untersuchen, wenn der Forscher Grund zu der Annahme hat, dass die Variabilität bezüglich eines bestimmten Merkmals, z. B. Einstellungen oder Partizipation, größer wäre.

Daher sollte in einer Studie zur Vorhersage des Ergebnisses der nationalen Wahlen unter Verwendung der Methode der geschichteten Stichprobenahme mit Staaten als Grundlage der Stratifizierung eine stärkere Stichprobe aus den Gebieten oder Regionen entnommen werden, in denen das Ergebnis stark getrübt und in Zweifel geraten ist .

Typ # 5. Unproportionales, stratifiziertes Sampling :

Wir haben bereits die Merkmale der überproportionalen Probenahme vorgeschlagen und auch einige der Hauptvorteile dieses Probenahmeverfahrens. Es ist klar, dass eine geschichtete Probe, bei der die Anzahl der Elemente, die aus verschiedenen Schichten gezogen werden, unabhängig von der Größe dieser Schichten ist, als unproportionale geschichtete Probe bezeichnet werden kann.

Derselbe Effekt kann alternativ erzielt werden, indem aus jeder Schicht eine gleiche Anzahl von Fällen gezogen wird, unabhängig davon, wie stark oder schwach die Schicht in der Bevölkerung vertreten ist.

Als eine Konsequenz der Art und Weise der Auswahl besteht ein Vorteil der überproportional geschichteten Probenahme darin, dass alle Schichten hinsichtlich der Größe der Probe gleichermaßen zuverlässig sind. Ein noch wichtigerer Vorteil ist die Wirtschaftlichkeit.

Diese Art von Stichproben ist insofern wirtschaftlich, als den Ermittlern die Mühe erspart wird, unnötig große Informationsmengen aus den meisten Bevölkerungsgruppen zu erhalten.

Eine solche Probe kann jedoch auch die kombinierten Nachteile einer ungleichen Anzahl von Fällen, dh Kleinheit und Nichtrepräsentativität, verraten. Darüber hinaus erfordert eine überproportionale Stichprobe ein tiefes Wissen über relevante Merkmale der verschiedenen Schichten.

Typ # 6. Optimale Zuweisungsprobe :

Bei diesem Probenahmeverfahren ist die Größe der aus jeder Schicht entnommenen Probe sowohl der Größe als auch der Streuung der Werte innerhalb einer bestimmten Schicht proportional. Die genaue Anwendung dieses Stichprobenverfahrens erfordert die Verwendung bestimmter statistischer Konzepte, die noch nicht ausreichend oder überzeugend eingeführt wurden.

Wir wissen jetzt etwas über die geschichtete Zufallsauswahl und ihre verschiedenen Ausprägungen. Lassen Sie uns nun sehen, wie die Variablen oder Kriterien für die Schichtung geplant werden sollten.

Die folgenden Überlegungen beziehen sich idealerweise auf die Auswahl der Kontrollen für die Stratifizierung:

(a) Die Informationen, die für die Einrichtung von Schichten relevant sind, sollten auf dem neuesten Stand, genau, vollständig, auf die Bevölkerung anwendbar und für den Forscher verfügbar sein.

Viele Merkmale der Bevölkerung können nicht als Kontrollen verwendet werden, da keine zufriedenstellenden Statistiken über sie vorliegen. In einer sehr dynamischen Gesellschaft, die durch große Umwälzungen in der Bevölkerung gekennzeichnet ist, läuft der Forscher, der die Strategie der Schichtung einsetzt, in der Regel Gefahr, bei seinen Schätzungen hinsichtlich der Größe der von ihm in seiner Stichprobe ausgeführten Schichten falsch zu laufen.

(b) Der Forscher sollte Grund zu der Annahme haben, dass die für die Stratifizierung verwendeten Faktoren oder Kriterien angesichts des untersuchten Problems signifikant sind.

(c) Wenn die betrachtete Schicht nicht groß genug ist und die Probennehmer und Außendienstmitarbeiter daher keine großen Schwierigkeiten haben, Kandidaten dafür zu finden, sollte sie nicht verwendet werden.

(d) Bei der Auswahl der Fälle für die Stratifizierung sollte der Forscher versuchen, diejenigen zu wählen, die hinsichtlich der für das untersuchte Problem signifikanten Merkmale homogen sind. Wie bereits erwähnt, ist die Stratifizierung dahingehend wirksam, dass die Elemente in der Schicht einander ähnlich sind und sich gleichzeitig von den Elementen in anderen Schichten unterscheiden.

Betrachten wir nun die Vorzüge und Einschränkungen der stratifizierten Zufallsauswahl allgemein:

(1) Bei Anwendung des stratifizierten Stichprobenverfahrens kann der Forscher sicher sein, dass keine wesentlichen Gruppen oder Kategorien von der Stichprobe ausgeschlossen werden. Dadurch wird eine größere Repräsentativität der Probe sichergestellt und gelegentliche Pannen, die bei der einfachen Stichprobenentnahme auftreten, werden vermieden.

(2) Bei homogeneren Populationen kann mit weniger Fällen eine höhere Genauigkeit erreicht werden.

(3) Im Vergleich zu den einfachen Stichproben sind stratifizierte Stichproben geografischer konzentriert, wodurch die Kosten für Zeit, Geld und Energie bei der Befragung der Befragten gesenkt werden.

(4) Die Stichproben, die ein Interviewer auswählt, können repräsentativer sein, wenn seine Quote durch das unpersönliche Stratifizierungsverfahren zugeteilt wird, als wenn er sein eigenes Urteil (wie bei der Quotenauswahl) verwendet.

Die Haupteinschränkung der geschichteten Zufallsstichprobe besteht darin, dass der Forscher viel über das Problem der Forschung und ihre Beziehung zu anderen Faktoren wissen muss, um den maximalen Nutzen aus einer Studie zu ziehen. Ein solches Wissen ist nicht immer auf dem Vormarsch und oft ist das Warten lang.

Es sollte daran erinnert werden, dass der Standpunkt der Theorie der Wahrscheinlichkeitsabtastung im Wesentlichen irrelevant ist, ob die Stratifizierung während des Abtastverfahrens oder während der Analyse von Daten eingeführt wird, es sei denn, die erstere ermöglicht die Kontrolle der Größe der Probe aus jeder Schicht erhalten und somit die Effizienz des Probenentwurfs erhöhen.

Mit anderen Worten, das Verfahren des Ziehens einer einfachen Zufallsstichprobe und des anschließenden Aufteilens in Schichten ist in der Wirkung äquivalent zum Ziehen einer geschichteten Zufallsstichprobe unter Verwendung des Abtastrahmens innerhalb jeder Schicht, wobei die Bevölkerungszahl dieser Schicht in der gegebenen Einfachheit enthalten ist zufällige Probe.

Typ # 7. Cluster-Sampling :

Normalerweise verursachen einfache Zufallsstichproben und stratifizierte Zufallsstichproben enorme Kosten, wenn mit großen und räumlich oder geographisch verteilten Bevölkerungsgruppen umgegangen wird.

Bei den oben genannten Stichprobenarten können die in der Stichprobe ausgewählten Elemente so weit gestreut sein, dass die Befragung zu hohen Kosten führen kann, einen höheren Anteil an unproduktiver Zeit (auf Reisen) und eine größere Wahrscheinlichkeit, dass die Interviewer nicht einheitlich sind. Befragungen, Aufzeichnungen und schließlich ein hoher Aufwand für die Überwachung des Außendienstes.

Es gibt auch andere praktische Faktoren dieser Probenahme. Zum Beispiel kann es als weniger störend angesehen werden und daher zulässig sein, einen Fragebogen an drei oder vier Abteilungen einer Fabrik oder eines Büros zu übergeben, anstatt ihn anhand einer Stichprobe aus allen Abteilungen auf einer einfachen oder stratifizierten Zufallsbasis zu verwalten kann die Fabrikroutinen viel störender gestalten.

Aus einigen Gründen verwenden groß angelegte Umfragestudien selten einfache oder stratifizierte Stichproben. Stattdessen nutzen sie die Methode der Cluster-Sampling.

Bei der Stichprobenauswahl entnimmt der Probennehmer zuerst bestimmte Bevölkerungsgruppen, bestimmte große Gruppierungen, dh „Cluster“. Diese Cluster können Stadtbezirke, Haushalte oder mehrere geographische oder soziale Einheiten sein. Die Probenahme von Clustern aus der Grundgesamtheit erfolgt durch einfache oder stratifizierte Stichprobenverfahren. Aus diesen ausgewählten Clustern werden die Bestandteile durch Rückgriff auf Verfahren ausgewählt, die die Zufälligkeit sicherstellen.

Angenommen, ein Forscher möchte beispielsweise eine Stichprobenstudie über die Probleme von Studenten an Hochschulen in Maharashtra durchführen.

Er kann wie folgt vorgehen:

(a) Er bereitet zunächst eine Liste aller Universitäten des Landes vor und wählt nach dem Zufallsprinzip eine Auswahl der Universitäten aus.

(b) Für jede der Universitäten des Staates, die in die Stichprobe einbezogen wurden, erstellt er eine Liste der Colleges, die seiner Rechtshoheit unterstehen, und entnimmt stichprobenartig eine Auswahl von Colleges.

(c) Für jede der Colleges, die zufällig in die Stichprobe aufgenommen werden, erstellt er eine Liste aller Studenten, die in der Stichprobe eingeschrieben sind. Von diesen Studenten wählt er zufällig eine Stichprobe der gewünschten Größe (einfach oder geschichtet) aus.

Auf diese Weise erhält der Forscher eine Wahrscheinlichkeit oder Zufallsauswahl von Elementen, die mehr oder weniger konzentriert sind, geographisch. Auf diese Weise ist er in der Lage, hohe Ausgaben zu vermeiden, die andernfalls entstanden wären, wenn er auf einfache oder geschichtete Zufallsstichproben zurückgegriffen hätte, und er muss nicht die Prinzipien und Vorteile der Wahrscheinlichkeitsstichprobe opfern.

Charakteristischerweise durchläuft dieses Probenahmeverfahren eine Reihe von Stufen. In gewissem Sinne handelt es sich also um eine "mehrstufige" Abtastung, die manchmal unter diesem Namen bekannt ist. Dieses Stichprobenverfahren bewegt sich schrittweise von den inklusiveren zu den weniger umfassenden Stichprobeneinheiten, die der Forscher schließlich bei den Elementen der Bevölkerung erreicht, die seine gewünschte Stichprobe bilden.

Es ist zu beachten, dass es bei Cluster-Stichproben nicht mehr der Fall ist, dass jede Kombination der gewünschten Anzahl von Elementen in der Grundgesamtheit gleichermaßen als Stichproben der Grundgesamtheit ausgewählt wird. Die Art der Auswirkungen, die wir in unserer Analyse von einfachen Stichproben gesehen haben, dh der Bevölkerungswert ist der wahrscheinlichste Abtastwert, kann hier nicht gesehen werden.

But such effects do materialize in a more complicated way, though, of course, the sampling efficiency is hampered to some extent. It has been found that on a per case basis, the cluster sampling is much less efficient in getting information than comparably effective stratified random sampling.

Relatively speaking, in the cluster sampling, the margin of error is much greater. This handicap, however, is more than balanced by associated economies, which permit the sampling of a sufficiently large number of cases at a smaller total cost.

Depending on the specific features of the sampling plan attendant upon the objects of survey, cluster sampling may be more or less efficient than simple random sampling. The economies associated with cluster sampling generally tilt the balance in favour of employing cluster sampling in large-scale surveys, although compared to simple random sampling, more cases are needed for the same level of accuracy.

Type # 8. Multi-Phase Sampling:

It is sometimes convenient to confine certain questions about specific aspects of the study to a fraction of the sample, while other information is being collected from the whole sample. This procedure is known as 'multi-phase sampling.'

The basic information recorded from the whole sample makes it possible to compare certain characteristics of the sub-sample with that of the whole sample.

One additional point that merits mention is that multi-phase sampling facilitates stratification of the sub-sample since the information collected from the first phase sample can sometimes be gathered before the sub-sampling process takes place. It will be remembered that panel studies involve multi-phase sampling.