Datenanalyse: 4 Schritte

Dieser Artikel beleuchtet die vier Hauptschritte der Datenanalyse. Die Schritte sind: 1. Festlegung von Kategorien oder Klassifizierung von Daten 2. Kodierung 3. Tabellierung 4. Statistische Analyse von Daten.

Schritt # 1. Festlegung von Kategorien oder Klassifizierung von Daten :

Die sozialwissenschaftliche Forschung umfasst im Allgemeinen eine Vielzahl von Antworten auf verschiedene Arten von Fragen oder Stimuli, die der Stichprobe oder der „Bevölkerung“ der Befragten präsentiert werden. Diese Antworten können verbal oder nicht verbal sein.

Wenn eine große Anzahl verschiedener Arten von Antworten so organisiert werden soll, dass sie zur Beantwortung der Forschungsfragen oder zum Zeichnen von Verallgemeinerungen verwendet werden können, müssen sie offensichtlich in einer begrenzten Anzahl von Kategorien oder Klassen zusammengefasst werden. Ein einfaches Beispiel: Stellen Sie sich eine Frage an die Befragten: "Befürworten Sie die objektive Prüfung für Studenten?"

Die Antworten der Befragten können möglicherweise in vier große Kategorien unterteilt werden, wie unter:

(a) Antworten mit "Ja".

(b) "Nein" Antworten.

(c) "Weiß nicht", "Kann nicht sagen" usw., Antworten.

(d) "Keine Antwort".

Nehmen wir an, eine andere Frage an die Befragten lautet: „Zu welcher sozialen Klasse würden Sie sagen, dass Sie dazugehören?“

Die Antworten der Befragten lassen sich in folgende Kategorien einteilen:

(a) Oberschicht

(b) Mittelklasse.

(c) Untere Klasse.

(d) "Ich kann es nicht sagen."

(e) Andere Antworten (wie "Ich glaube nicht an soziale Schichten." "Es ist kaum wichtig, wo ich hingehöre" usw.).

Eine Voraussetzung für die Entscheidung über die Kategorien, die zur Gruppierung der Daten einzurichten sind, ist, dass der Forscher ein geeignetes Klassifizierungsprinzip auswählen muss. Falls eine Forschungsfrage oder Hypothese formuliert wurde, bietet sie eine gute logische Grundlage für die Auswahl eines Klassifizierungsprinzips.

Angenommen, die Hypothese in einer Studie lautet:

"Studenten, die bereits an koedukativen Schulen studiert haben, werden dem System der Coedukation eine günstigere Haltung einnehmen."

Offensichtlich wird hier eines der Prinzipien der Klassifizierung von Antworten sein, ob der Befragte bereits Erfahrungen mit dem Bildungssystem gemacht hat oder nicht. Eine andere Grundlage für die Klassifizierung der Antworten wäre der Grad der Bevorzugung oder der Ungünstigkeit, die gegenüber dem Co-Education-System ausgedrückt wird. Abhängig davon, welche weiteren Assoziationen geprüft werden sollen, können auch andere Klassifizierungsgrundlagen herangezogen werden.

Die erste Grundlage der Klassifizierung würde zwei Kategorien von Antworten ergeben:

(a) Sie sagten, sie hätten bereits Erfahrungen mit Co-Education gemacht.

(b) Sie hatten keine Erfahrung mit Co-Education.

Diese beiden Kategorien enthalten in sich die gesamte Bandbreite der Antworten (vorausgesetzt natürlich, dass sich kein Befragter weigerte, zu antworten oder eine "andere Antwort" zu geben.) Keine der oben genannten Annahmen entsprechenden Antworten liegen außerhalb des Umfangs dieser beiden Kategorien. Diese beiden Kategorien bilden zusammen ein sogenanntes "Kategorieset".

Ein "Kategorieset" muss die folgenden drei Anforderungen erfüllen:

(1) Die Kategorien sollten von einem einzigen Klassifizierungsprinzip abgeleitet werden. Diese Anforderung ist durchaus verständlich, denn wenn mehr als ein Klassifizierungsprinzip angewendet wird, kann eine einzige Antwort von mehreren Kategorien beansprucht werden.

Daher sind die Kategorien nicht unabhängig voneinander. Wenn wir zum Beispiel drei Kategorien haben, aus denen sich die Kategorien zusammensetzen, z. B. männlich, weiblich, kind, die offensichtlich von zwei Klassifizierungsprinzipien abgeleitet werden, nämlich Geschlecht und Alter, dann kann jeder Fall (Befragter) durch mehr als abgedeckt werden eine Kategorie im Kategoriesatz.

Zum Beispiel kann ein Kind auch ein Mann sein, eine Frau kann auch ein Kind sein und so weiter. Das Klassifikationsprinzip kann jedoch ein zusammengesetztes sein, dh aus zwei oder mehr Kriterien zusammengesetzt sein, dh männliches Kind, weibliches Kind usw.

(2) Die zweite Voraussetzung ist, dass die Kategoriengruppe erschöpfend ist, das heißt, es sollte möglich sein, jede Antwort in eine der Kategorien innerhalb der Gruppe zu setzen. "Keine Antwort" sollte ausgelassen werden, weil keine geeignete Kategorie in der Gruppe enthalten ist, in der sie enthalten ist.

Was auch immer die Antworten sein mögen, es muss von einer Kategorie innerhalb des Sets abgedeckt werden. Wenn beispielsweise die Menschen auf der Welt aufgrund ihres Rassenbestandes eingestuft werden sollten, würde der Kategoriensatz aus drei Kategorien bestehen, nämlich (a) Kaukasoiden, (b) Negroiden und (c) Mongoloiden eine erschöpfende Kategoriesammlung in Übereinstimmung mit der oben umrissenen Anforderung sein, da sie keine einzige Kategorie enthält, in der viele der Inder (und einige andere) einen Platz finden können.

(3) Die letzte Anforderung ist eine Konsequenz der ersten, nämlich, dass sich die Kategorien innerhalb des Satzes gegenseitig ausschließen sollen; Das heißt, die Kategorien sollten sich nicht überlappen. Daher würde keine Antwort von mehr als einer Kategorie innerhalb des Satzes beansprucht.

Die Festlegung von Kategorien für Daten, die für Sozialwissenschaften charakteristisch sind, ist nicht immer eine einfache Aufgabe. Das Klassifikationsprinzip kann oft ein zusammengesetztes sein (im Gegensatz zu einfachem, einheitlichem). Die Aufgabe, alle sich gegenseitig ausschließenden Kategorien herauszuarbeiten, die zusammen das gesamte Reaktionsuniversum auf der Grundlage eines zusammengesetzten Klassifizierungsprinzips erschöpfen würden, ist in der Tat eine anspruchsvolle, fordernde Einbildungskraft.

In solchen Fällen ist es eine große Hilfe, die Attribute, die das zusammengesetzte Prinzip der Klassifizierung bilden, auf Symbole oder Codes zu reduzieren und mit Hilfe der Technik der booleschen Erweiterung die gesamte Bandbreite möglicher Kategorien aus dem Kategoriesatz herauszuziehen.

Nehmen wir ein sehr einfaches Beispiel. Angenommen, der Forscher betrachtet drei Merkmale, z. B. Geschlecht (männlich, weiblich), Alter (unter 21 Jahren oder über 21 Jahre) und Familienstand (verheiratet oder ledig) als Bestandteile seines einzigen (aber zusammengesetzten) Klassifizierungsprinzips und reduziert diese auf Symbole wie unter:

Männlich = S, weiblich = S̅

Unter 21 Jahren = A, Über 21 Jahren = A̅

Verheiratet = M, Single = M̅

Das resultierende Kategorieset wird die erschöpfende Gesamtheit sein, die aus allen möglichen Kombinationen dieser drei Merkmale besteht, die das zusammengesetzte Klassifizierungsprinzip bilden. Die möglichen Kombinationen, dh Kategorien, sind 2 3 = 2 x 2 x 2 = 8 in der Anzahl.

Dies sind wie unter:

(1) SAM

(2) S AM

(3) S A M

(4) SA M̅

(5) S A A M

(6) S A M M

(7) S A̅ M̅

(8) S̅A̅M̅

Durch Dekodierung, dh durch Ersetzen der Symbole durch die realen Konnotationen, erhalten wir acht sich gegenseitig ausschließende Kategorien, die wie folgt lauten:

(1) Männer unter 21 und verheiratet.

(2) Frauen unter 21 Jahren und verheiratet.

(3) Männer über 21 Jahre und verheiratet.

(4) Männer unter 21 Jahren und unverheiratet.

(5) Frauen über 21 Jahre alt und verheiratet.

(6) Frauen unter 21 Jahren und unverheiratet.

(7) Männer über 21 Jahre und unverheiratet.

(8) Frauen über 21 Jahre und unverheiratet.

Wenn das zusammengesetzte Klassifizierungsprinzip aus vier Attributen besteht, haben wir 2 4 = 2x 2 x 2 x 2, dh 16 sich gegenseitig ausschließende Kategorien. Es sollte jetzt klar sein, wie diese Methode der Kategorisierung anstelle von Intuition die Klassifizierung viel einfacher und narrensicher macht.

Es ist offensichtlich, dass die Festlegung einer Reihe von Kategorien relativ einfach ist, wenn die Antworten der Befragten während der Studie relativ einfach und eindeutig sind und die Kategorien somit eindeutig definiert werden können. Obwohl Kategorien immer auf diese Weise definiert werden sollten, ist die Aufgabe bei bestimmten Inhaltstypen viel schwieriger.

Nehmen Sie an, der Forscher fragte in einer Studie die männlichen Studenten: „Wie würden Sie sagen, dass die weiblichen Studenten das Gefühl haben, an einem College mit männlichen Studenten wie Sie zu studieren?“ Die Antworten reichen von Anzeichen sehr günstiger Einstellungen (für weibliche Studenten unterstellt) ) auf Imputationen sehr ungünstiger Einstellungen. Angenommen, dies sind einige der Antworten der Befragten.

(1) Sie mögen die Idee. '

(2) "Ich glaube nicht, dass sie etwas dagegen haben."

(3) "Sie glauben, dass es sie erniedrigt."

(4) Ich komme nicht mit ihnen in Kontakt, also würde ich es nicht wissen. '

(5) "Sie hassen es."

(6) "Manche mögen es, andere nicht."

(7) "Sie wollen hier studieren, um zu sagen, dass sie nicht weniger als die Männer sind."

(8) "In einer reinen Frauenschule würden sie sehr vermisst werden, so dass sie es hier zu mögen scheinen."

In Bezug auf die obigen Antworten wäre es nicht schwierig, eine einfache Gruppe von Kategorien zu entwickeln, die auf dem Klassifizierungsprinzip von günstigen gegenüber ungünstigen Einstellungen basiert, die Schülerinnen zugeschrieben werden. Wir finden jedoch, dass sowohl günstige als auch ungünstige Antworten unterschiedliche Bedeutungsnuancen vermitteln.

Der männliche Student, der sagt: „Sie (die Studentinnen) möchten hier studieren, damit sie sagen können, dass sie nicht weniger als Männer sind“, vermittelt etwas anderes als jemand, der sagt: „Sie mögen die Idee.“ Ebenso der männliche Student, der sagt "Sie denken, es senkt sie" sagt wieder etwas anderes als denjenigen, der sagt: "Sie hassen es."

Wir sehen also zwei Attribute, dh:

(1) Anrechnung günstiger oder ungünstiger Einstellungen gegenüber Mädchen und

(2) Der explizite Hinweis oder das Fehlen eines Hinweises auf Vorteile oder Schäden, die günstige oder ungünstige Einstellungen begünstigen, sind zwei wesentliche Bestandteile eines zusammengesetzten Klassifizierungsprinzips.

Die Kategorien in dem Kategoriesatz gemäß den idealen Anforderungen eines zuvor erörterten Kategoriesatzes können wie folgt festgelegt werden:

(1) Günstige Einstellung gegenüber Studentinnen, die sich aus den Vorteilen ergibt, die sie aus dem Studium an derselben Hochschule mit männlichen Studenten ziehen (z. B. 7. und 8. Antwort).

(2) Günstige Einstellung gegenüber Mädchen ohne expliziten Hinweis auf die Vorteile, die sie durch das Studium an derselben Hochschule mit Männern erworben haben (z. B. Aussage Nr. 1).

(3) Neutrale oder zuvorkommende Einstellung gegenüber Mädchen (z. B. Aussage Nr. 1).

(4) Ungünstige Einstellung gegenüber Mädchen, die sich aus Benachteiligungen (negativen Vorteilen) ergibt, die sie aus dem Studium an derselben Hochschule mit männlichen Studenten ziehen.

(5) Ungünstige Einstellung gegenüber Mädchen ohne expliziten Hinweis auf Nachteile oder Verluste, die sich aus der gemeinsamen Ausbildung ergeben (z. B. Erklärung Nr. 5).

(6) Andere Antworten, kann nicht sagen, keine Antwort, ich weiß es nicht (zB Aussage Nr. 4).

Die obige Abbildung würde eine Vorstellung davon vermitteln, wie sehr komplex eine Klassifizierung in der Sozialwissenschaft werden kann. Die Arbeit mit solchen komplexen Kategorien erfordert eine erhebliche Sorgfalt und Einarbeitungsaufwand. Selbst wenn die Kategorien sorgfältig ausgearbeitet wurden, stellt ihre Verwendung größere Probleme dar als die Verwendung von Kategorien enger und genauer definiert.

Wenn ein männlicher Student in dem obigen Beispiel sagt: „Sie mögen es hier gut, sie wissen, warum“, ist es eine Frage, ob diese Aussage einen Nutzen impliziert oder nicht. Daher müssten zusätzliche Regeln aufgestellt werden, um mit solchen Antworten umzugehen.

Es muss sogar auf Kosten einiger Wiederholungen gesagt werden, dass, obwohl es prinzipiell möglich ist, viele Antwortattribute für die Formulierung von Kategoriesätzen zu verwenden, dies in der Praxis oft unnötig, unwirtschaftlich und nicht lohnend ist, da nicht alle dieser klassifizierenden Prinzipien auf das Ziel der Studie beziehen.

Wenden wir uns nun dem Problem zu, ein Klassifizierungsprinzip für die Kategorisierung unstrukturierten Materials zu wählen (dh Informationen, die von unstrukturierten Werkzeugen gesammelt werden).

In Studien mit strukturierten Instrumenten zur Sammlung von Daten, die für klar formulierte Forschungsfragen oder -hypothesen relevant sind, wird das geeignete Prinzip für die Einstufung der Antworten durch die Art der Fragen und die gesicherten Antworten ziemlich eindeutig vorgegeben.

Bei der Arbeit mit unstrukturierten Materialien oder Daten besteht jedoch das erste Problem darin, zu entscheiden, welche Aspekte des Materials kategorisiert werden sollen, dh welche Klassifizierungsprinzipien bei der Festlegung von Kategorien zu verwenden sind.

In exploratorischen Studien, die definitiv nicht mit einem gut formulierten Problem oder einer expliziten Hypothese beginnen, ist die Entscheidung über die Klassifikationsprinzipien schwer zu treffen. Zum Zeitpunkt der Datenerhebung weiß der Ermittler nicht, welche Aspekte sich als am wichtigsten erweisen können.

Er muss daher eine große Datenmenge unstrukturierten Typs sammeln. In der Analyse steht der Forscher vor dem Problem, nicht nur mit unstrukturierten Materialien, sondern auch mit einem großen Volumen davon umzugehen.

Es ist ratsam, bei der Analyse von Daten einer explorativen Studie eine Arbeitshypothese zu entwickeln, die praktikable befriedigende Klassifizierungsprinzipien liefert. Der Forscher muss sein gesamtes Material sorgfältig durchlesen und ständig auf die latenten Hinweise in den Daten aufmerksam machen. Solche Hinweise werden oft durch das Studieren von Materialien zu Themen oder Situationen gesichert, die sich von denen unterscheiden, die er untersucht.

Eine solche Studie hilft dem Ermittler, die wichtigen Unterschiede zwischen den beiden Situationen zu erkennen. Ein anderes Verfahren, um solche Anhaltspunkte zu finden, besteht darin, die Fälle in Gruppen zusammenzufassen, die eine enge Verwandtschaft zu haben scheinen oder zusammenzugehen scheinen, und sich dann zu fragen, warum er das Gefühl hatte, dass sich die Fälle, die er in eine einzige Gruppe stellte, als gleich empfunden haben.

Ein weiterer Ansatz, der Anhaltspunkte für die Formulierung der Arbeitshypothese anregen könnte, ist das Feststellen von Dingen, die angesichts bestimmter theoretischer Erwartungen oder des gesunden Menschenverstandes überraschend erscheinen, und dann nach einer möglichen Erklärung der überraschenden oder unerwarteten Phänomene zu suchen.

Es sollte jedoch daran erinnert werden, dass die Analyse von unstrukturiertem Material auch bei einer klaren Hypothese besondere Probleme aufwirft. Erstens besteht immer die Möglichkeit, dass Informationen zu einem bestimmten Punkt in einigen Dokumenten fehlen.

Es besteht auch die Wahrscheinlichkeit, dass sehr viel Material die Hypothese nicht direkt beeinflusst. Außerdem gibt es das Problem, über die Größe der Einheiten des Materials zu entscheiden, auf das die Kategorien angewendet werden sollen.

Wenn zum Beispiel ein Forscher Fallakten verwendet, die von den Sozialämtern geführt werden, muss er entscheiden, welche Einheit (z. B. Kunden, Erklärungen, Handlungen, Sozialarbeiter, Sitzungen mit dem Kunden oder die gesamte Aufzeichnung) am besten geeignet ist, Antworten auf seine Fragen zu geben spezifische Forschungsfragen.

Schritt # 2. Codierung:

Die Codierung besteht darin, jeder Antwort, die in eine vorbestimmte Klasse fällt, Symbole zuzuordnen, üblicherweise Ziffern. Mit anderen Worten kann die Kodierung als der Klassifizierungsprozess angesehen werden, der für die nachfolgende Tabellierung erforderlich ist. Durch die Codierung werden die Rohdaten in Symbole umgewandelt, die tabelliert und gezählt werden können.

Diese Umwandlung ist jedoch nicht automatisch, sie erfordert ein hohes Urteilsvermögen des Codierers. „Codierer“ ist der offizielle Titel einer Person, der die Verantwortung übertragen wird, bestimmte Antworten zu geben, nachdem die aufgezeichneten Notizen im Büro abgelegt wurden.

Es sollte jedoch daran erinnert werden, dass die Beurteilung, welcher Antwort ein bestimmter Code zugewiesen werden soll, häufig von einer anderen Person als der Person getroffen wird, die nach der offiziellen Bezeichnung „Codierer“ handelt.

Die Codierung kann an drei verschiedenen Stellen in einer Studie erfolgen, an denen jeweils verschiedene Arten von Personen für die Zuordnung von Codes zu den Rohdaten verantwortlich sein können. In manchen Studien kann der Befragte selbst aufgefordert werden, seiner eigenen Reaktion oder Situation Codes zuzuweisen.

Dies gilt für viele Fragen des Umfragetyps und der Multiple-Choice-Fragen. Wenn der Befragte beispielsweise gefragt wird, zu welcher der Klassen (z. B. Einkommensgruppen) er gehört, z. B. (a) unter 3000 Rupien pm, (b) Rs. 3001 / - bis Rs. 6000 / - pm, (c) Rs. 6001 / - in Rs. 9000 / - pm, (d) Rs. 9001 / - und darüber, der Befragte kodiert seine Antwort einfach durch Abhaken seiner Position unter den gegebenen Alternativen.

Der zweite Punkt, an dem die Kodierung stattfinden kann, ist, wenn der Interviewer oder Beobachter im Verlauf der Datenerhebung die Antworten der Probanden kategorisiert. Dies geschieht, wenn ein Interviewer oder Beobachter eine Ratingskala einsetzt, um die Reaktion oder das Verhalten einer Person zu beschreiben.

Der letzte Punkt, an dem die Kodierung erfolgen kann, ist natürlich, wenn die unkategorisierten Rohdaten (insbesondere durch unstrukturierte Datenerhebungsinstrumente gesammelt) im Projektbüro abgelegt werden und die offiziellen Codierer hier ihre Einschätzung ausüben, um bestimmte Codes bestimmten zuzuordnen Antworten oder Daten.

Lassen Sie uns kurz die Vor- und Nachteile der Kodierung durch die amtlichen Kodierer im Büro und die Kodierung durch die Interviewer oder Beobachter, die im Zuge der Datenerhebung vor Ort durchgeführt wurden, vergleichen.

Die Interviewer oder Beobachter sind in der Lage, die Situation sowie das Verhalten des Einzelnen zu bemerken. Somit haben sie mehr Informationen, auf die sie ihre Beurteilung hinsichtlich der angemessenen Kategorisierung der Antworten stützen können, im Vergleich zu den Codierern, die auf der Grundlage schriftlicher Aufzeichnungen arbeiten, die möglicherweise keine vollständige Vorstellung von der tatsächlichen Bedeutung der Antwort geben.

Ein weiterer Vorteil der Kodierung durch Datensammler selbst ist, dass sowohl Zeit als auch Arbeit eingespart werden können.

Im Gegenteil, die Kodierung im Büro durch Kodierer hat gewisse Signalvorteile. Die Kodierung komplexer Daten, die Zeit zum Nachdenken erfordert, sollte von den Bürocodern empfohlen werden. Die von Datensammlern vor Ort vorgenommene Kodierungsentscheidung ist möglicherweise nicht so kritisch wie die Beurteilung mit mehr Zeit für die Beratung.

Die Beurteilung von Datensammlern kann durch viele Faktoren beeinflusst werden, nämlich durch das Erscheinungsbild des Befragten, Akzente und Antworten auf vorherige Fragen, Verhaltensweisen usw. Zweitens besteht die Gefahr, dass die Datensammler beim Codieren von Antworten nicht einheitlich sind.

Somit wird die Vergleichbarkeit von Daten, die von einer großen Anzahl von Befragten erhalten werden, beeinträchtigt. Drittens können die Interviewer oder Beobachter in Bezug auf das von ihnen codierte Material ihre eigenen persönlichen Referenzrahmen entwickeln. Dies würde dazu führen, dass ihre Kategorisierungen nach einiger Zeit unzuverlässig werden. Ein allgemeiner Bezugsrahmen ist beim Office-Codiervorgang einfacher zu erhalten und zu pflegen als im Feld.

Lassen Sie uns einige wichtige Probleme im Zusammenhang mit der Codierzuverlässigkeit diskutieren. Es gibt viele Dinge, die das Urteil der Codierer unzuverlässig machen können. Einige der Faktoren können sich aus den zu kategorisierenden Daten ergeben, einige aus der Art der anzuwendenden Kategorien und wieder andere können von den Codierern selbst herrühren.

Wir werden nun kurz einige dieser Faktoren und die Möglichkeiten, vor denen sie geschützt werden können, betrachten.

Viele der bei der Codierung auftretenden Schwierigkeiten sind auf die Unzulänglichkeiten der Daten zurückzuführen. Häufig liefern die Daten nicht genügend relevante Informationen für eine zuverlässige Kodierung. Dies kann auf fehlerhafte und unzulängliche Datenerfassungsverfahren zurückzuführen sein. Diese Schwierigkeiten können jedoch im Allgemeinen durch sorgfältige Bearbeitung der Daten überwunden werden. Der Prozess, der darin besteht, die Daten zu überprüfen, um ihre Codierungsqualität zu verbessern, wird als Editieren bezeichnet.

Wenn der Datensammler sein Material dem Projektbüro übergibt, besteht immer noch die Möglichkeit, viele mögliche Codierungsschwierigkeiten zu beseitigen. Eine sorgfältige Prüfung der Daten nach deren Erhebung und gegebenenfalls eine systematische Befragung der Interviewer oder Beobachter hilft, Codierungsprobleme zu vermeiden.

Die Bearbeitung trägt nicht nur dazu bei, spätere Codierungsprobleme zu vermeiden, sondern kann auch die Qualität der Datenerfassung erheblich verbessern, indem sie darauf hinweist, wo die Interviewer oder Beobachter möglicherweise missverstandene Anweisungen oder nicht ausreichend detaillierte Daten aufgezeichnet haben.

Tatsächlich sollte das Editieren während des Vor-Testens des Interviews oder des Beobachtungszeitplans für die Interviewer oder Beobachter und tatsächlich während des Zeitraums der Datenerfassung erfolgen. Die Bearbeitung im Projektbüro hilft bei der Beseitigung von Codierungsproblemen.

Die Bearbeitung muss also durchgeführt werden, während die Interviewer oder Beobachter leicht für Befragungen zur Verfügung gestellt werden können. Beim Bearbeiten werden die Interview- oder Beobachtungszeitpläne sorgfältig geprüft.

Diese sollten überprüft werden auf:

(1) Vollständigkeit: Die Redakteure müssen sicherstellen, dass alle Elemente ordnungsgemäß ausgefüllt sind. Ein Leerzeichen neben einer Frage in einem Interviewzeitplan kann zum Beispiel entweder "Keine Antwort" oder "Weiß nicht" oder Ablehnung bedeuten Antwort oder Nichtanwendbarkeit der Frage oder durch Übersehen ausgelassene Frage usw.

(2) Der Redakteur sollte die Interview- oder Beobachtungspläne überprüfen, um herauszufinden, ob die Handschrift oder die vom Interviewer oder Beobachter zugewiesenen Symbole oder Codes vom Codierer leicht verstanden werden können.

Es ist immer ratsam, die Lesbarkeit bei der Abgabe des Materials zu überprüfen und gegebenenfalls den Interviewer oder Beobachter dazu zu bringen, es neu zu schreiben. Geschieht dies nicht, kann die Kodierung zu einem Zeitpunkt stecken bleiben, wenn die Interviewer oder Beobachter nicht leicht zur Befragung abgerufen werden können.

(3) Beim Editieren wird auch die Verständlichkeit der Zeitpläne geprüft. Es kommt oft vor, dass eine aufgezeichnete Antwort für den Interviewer oder Beobachter vollkommen verständlich ist, für den Codierer jedoch nicht verständlich ist, da der Kontext des Verhaltens oder der Antwort dem Codierer nicht bekannt ist. Durch systematische Befragung der Datensammler werden Verwirrung und Unklarheiten beseitigt und die Codierqualität erheblich verbessert.

(4) Die Daten sollten auch geprüft oder geprüft werden, um festzustellen, ob bestimmte Inkonsistenzen bezüglich der im Zeitplan aufgezeichneten Antworten bestehen.

Zum Beispiel hätte ein Befragter in einer der vorangegangenen Fragen vielleicht gesagt, er habe nie Leute einer bestimmten Gruppe getroffen, und als Antwort auf eine spätere Frage hätte er vielleicht etwas darüber gesagt, dass er bestimmte Personen dieser Gruppe im Laufe seines Aufenthalts besucht hatte Runden. Wenn dies der Fall ist, besteht die offensichtliche Notwendigkeit, diese Inkonsistenz zu untersuchen und durch Befragung der Datensammler zu klären.

(5) Es ist auch zu prüfen, mit welcher Einheitlichkeit die Interviewer die Anweisungen zur Datenerhebung und -aufzeichnung befolgt haben. Die Codierung kann behindert werden, wenn eine Antwort in anderen als den in den Anweisungen angegebenen Einheiten aufgezeichnet wird.

(6) Es ist darauf hinzuweisen, dass eine bestimmte Antwort für die Untersuchung einfach als irrelevant erscheint. Dies ist wahrscheinlich der Fall, wenn eine Frage nicht eindeutig bearbeitet oder nicht intelligent gestellt wird. Die Daten sollten daher sorgfältig geprüft werden, um die unangemessenen Antworten von den entsprechenden Antworten zu trennen.

Der Wert der Kategorisierung von Daten hängt natürlich von der Zuverlässigkeit der verwendeten Kategorien ab. Es ist notwendig, dass die Kategorien neben ihrer Relevanz für Forschungszwecke auch konzeptionell definiert werden.

Die Kodierung ist unzuverlässig, wenn die Kategorien nicht eindeutig anhand von Indikatoren definiert werden, die hier und jetzt für Daten gelten. In der Praxis werden die Kategorien anhand von Beispielen aus den vorliegenden Daten definiert. Es ist sehr hilfreich, wenn Abbildungen aus Daten nicht nur zeigen, welche Art von Antworten die Kategorie kennzeichnen, sondern auch dazu beitragen, die Grenzlinie zwischen scheinbar ähnlichen Kategorien zu unterscheiden.

Es ist offensichtlich, dass die Codierqualität von der Kompetenz der Codierer beeinflusst wird. Die Ausbildung von Programmierern ist daher ein wichtiger Schritt in jeder Studie.

Die Schulung der Programmierer kann in folgenden Schritten erfolgen:

Zunächst werden die verschiedenen Codes der Trainesse (Codierer) erläutert und anhand von Beispielen aus den zu kategorisierenden Daten veranschaulicht.

Zweitens üben alle Codierer-Auszubildenden an einer Stichprobe der Daten. Die auftretenden Probleme werden von den Programmierern als Gruppe mit dem Vorgesetzten besprochen, um gemeinsame Verfahren und Definitionen zu entwickeln.

Drittens werden Hinweise aus der Praxiscodierung verwendet, um Änderungen in den Kategorien vorzunehmen, um sie besser auf das Material anwendbar zu machen, und um die Verfahren und Definitionen, die während der vorläufigen Codierung entwickelt wurden, schriftlich niederzulegen.

Viertens, an einem Punkt in der Übungsphase, in dem relativ wenige neue Probleme auftreten, arbeiten die Codierer an einem identischen Teil der Daten, ohne sich oder den Vorgesetzten zu befragen. Die Konsistenz oder die Zuverlässigkeit der Codierung wird dann berechnet, um zu bestimmen, ob es möglich ist, die Codierung mit rechtem Ernst zu beginnen.

Abhängig von den Ergebnissen der Zuverlässigkeits- oder Konsistenzprüfungen kann entschieden werden, die zu unzuverlässig erscheinenden Kategorien zu streichen oder mehr Zeit damit zu verbringen, Codierer zu trainieren, oder Codierer, die am inkonsistentesten sind usw.

Schließlich werden regelmäßig Überprüfungen durchgeführt, um sicherzustellen, dass die Codierer nicht mit mehr Erfahrung nachlässig werden oder keine eigensinnigen Methoden entwickeln, um mit neuen Problemen im Material umzugehen. Um die Einheitlichkeit zu gewährleisten, sollte eine Entscheidung, die nach dem Beginn der Codierung getroffen wird, allen Codierern unverzüglich mitgeteilt werden.

Es ist offensichtlich, dass die Konsistenz und Angemessenheit, mit der eine bestimmte Art von Antwort einer bestimmten Kategorie zugeordnet wird, einen wichtigen Einfluss auf das Ergebnis der Analyse hat. Daher ist es wichtig, die Zuverlässigkeit der Codierung zu prüfen und die Übereinstimmung zwischen den Codierern zu erhöhen wie möglich.

Es ist natürlich schwierig, ein bestimmtes Maß an Zuverlässigkeit als den zu erreichenden Standard festzulegen. Unterschiedliche Materialtypen weisen unterschiedliche Schwierigkeitsgrade beim Erreichen der Zuverlässigkeit auf. In der Regel ist die Zuverlässigkeit umso höher, je strukturierter das zu codierende Material ist und je einfacher die verwendeten Kategorien sind.

Es ist zu beachten, dass die in einer Studie verwendeten Codetypen davon abhängen, ob die Daten maschinell oder von Hand tabelliert werden sollen. Wenn die Daten manuell sortiert werden sollen, ist eine Wortbeschreibung der Klassen zufriedenstellend.

Es können auch Abkürzungen oder Buchstaben von Alpha-Bates verwendet werden, z. B. 'Y für Ja, ' N 'für Nein usw. Die Maschinentabelle erfordert dagegen, dass Klassen in numerischen Symbolen ausgedrückt werden, da die Maschinen nur mit numerischen Daten gespeist werden können.

Die mechanische Tabellierung erfordert die Verwendung von Lochkarten. Die Anzahl der verschiedenen Klassen, die auf der Lochkarte angezeigt werden können, ist jedoch begrenzt. In jedem Fall können alle für die Maschinentabelle verwendeten Codes auch für die Handtabelle verwendet werden.

Wenn Codes auf Lochkarten gesetzt werden sollen, von denen zwei Größen allgemein verwendet werden, dh 80 Spaltenkarten und die 54 Spaltenkarten, ist es wünschenswert, zehn oder weniger Klassen / Kategorien für die meisten Informationen oder Antworten zu verwenden.

Die Lochkarte enthält 10 nummerierte Leerzeichen und ein X und Y in jeder Spalte, sodass insgesamt 12 Codes verwendet werden können. Es ist ein ziemlich kompliziertes Verfahren, mehr als einen Elementtyp in einer Spalte abzurufen. Zum Beispiel können Krippen- und Alterscodes nicht in eine einzige Spalte eingegeben werden, es sei denn, es werden jeweils nur sechs Altersgruppen verwendet.

Schritt # 3. Tabellierung:

Die Tabellierung ist ein Teil des technischen Prozesses bei der statistischen Analyse der Daten. Das wesentliche Element der Tabellierung ist die Zusammenfassung der Ergebnisse in Form statistischer Tabellen.

Nur wenn Rohdaten in Gruppen unterteilt werden und die Anzahl der Fälle, die in diese verschiedenen Gruppen fallen, gezählt wird, kann der Forscher bestimmen, was seine Ergebnisse bedeuten, und seine Ergebnisse in einer möglichen Form dem Verbraucher mitteilen leicht verständlich sein.

Die Tabellierung hängt natürlich von der Festlegung von Kategorien für Rohdaten, der Bearbeitung und Codierung der Antwort ab (Stanzen und Durchlaufen der Karten durch Maschinen für die mechanische Tabellierung und Sortieren und Zählen für die Hand-Tabellierung).

Erfahrene Forscher entwickeln im Allgemeinen etwa gleichzeitig mit der Erstellung oder Erstellung der Datenerfassungsinstrumente und der Erstellung von Stichprobenplänen Tabellierungspläne. Unerfahrene Forscher beschäftigen sich selten mit Tabellierungsplänen, bis die Daten gesammelt wurden. Natürlich ist es für den Forscher nicht möglich, den gesamten Tabellierungsbereich vorherzusehen, der später gewünscht wird.

Er sollte mit seinem Forschungsproblem oder dem Untersuchungsgegenstand vertraut sein, um Tabellen erstellen zu können, die Antworten auf die Fragen geben, die zu der Studie geführt haben. Der Forscher sollte in der Lage sein, adäquate Tabellierungspläne zu erstellen, wenn er die Ergebnisse früherer Forschungen verwendet, deren Elemente mit denen übereinstimmen, für die die Pläne erstellt werden.

In exploratorischen Studien ist es ein besseres und sichereres Verfahren, das Datenerfassungsinstrument anhand einer Bevölkerungsstichprobe vorzuprüfen, die dem Typ entspricht, der in der abschließenden Studie behandelt würde. Auf diese Weise können im Allgemeinen einige Hinweise erhalten werden, welche Art von Tabellierung sinnvoll ist.

Die Tabellierung kann vollständig mit manuellen Methoden erfolgen. dies wird als Hand-Tabellierung bezeichnet. Alternativ kann dies durch mechanische Verfahren erfolgen, bei denen automatische und schnelle Leistungsmaschinen für den Großteil der Daten verwendet werden, wobei der Prozess als mechanische Tabellierung bezeichnet wird.

Der Forscher muss entscheiden, bevor er detaillierte Tabellierungspläne für seine Studie zeichnet, welche Tabellierungsmethode er verwenden würde. Diese Entscheidung basiert auf verschiedenen Überlegungen wie Kosten, Zeit, Personal usw.

Sowohl die Hand-Tabellierung als auch die mechanischen Tabellierungsverfahren haben ihre jeweiligen Vorzüge und Einschränkungen. Die Aufmerksamkeit des Forschers auf diese Vorzüge und Nachteile ist besser geeignet, um zu entscheiden, welche Methode für sein Problem geeignet ist.

Wir werden kurz auf die Vorteile dieser beiden Tabulierungsmethoden eingehen:

(1) Die mechanische Tabellierung erfordert viel Schreibarbeit und spezialisierte Operationen. Natürlich erleichtert es die Geschwindigkeit, aber die Geschwindigkeit ist möglicherweise nicht immer ein angemessener Ausgleich für zusätzliche Büroarbeit.

(2) Wenn die Anzahl und die Art der gewünschten Tabellen nicht vor Beginn der Tabellierungsarbeit festgelegt werden, Maschinen-Tabellierung kann zweckmäßiger sein. Wenn die Hand-Tabellierung jedoch als effizient angesehen wird, wird die Reihenfolge, in der verschiedene Sortierungen und Zählungen vorgenommen werden, vor der Tabellierung festgelegt.

(3) Ein Hauptvorteil der Maschinentabelle ist, dass sie Kreuzklassifizierungen erleichtert. In groß angelegten Studien, in denen viele Variablen korreliert oder kreuzklassifiziert werden müssen, ist die Tabellierung von Maschinen vernünftigerweise vorzuziehen.

Aus diesem Grund wird die mechanische Tabellierung in Studien verwendet, die viele Wechselwirkungen zwischen den Variablen erfordern. Wenn jedoch die Gesamtzahl der Befragten gering ist, kann deren manuelle Zählung nach dem klassifikationsübergreifenden Prinzip relativ wirtschaftlich sein.

(4) Wenn sehr viele codierte Informationen vorhanden sind und für jeden Fall mehrere Lochkarten erforderlich sind, kann eine Hand-Tabellierung vorzuziehen sein.

(5) Wenn gewünscht wird, die Daten in relativ kurzer Zeit für eine neue Tabellierung bereit zu halten, sind Lochkarten normalerweise nützlich. Die mechanische Tabellierung ist nützlich für periodische Studien oder Umfragen, bei denen die gleichen Informationen in regelmäßigen Abständen erhoben werden müssen.

(6) Bei Sortier- und Zählvorgängen ist es weniger wahrscheinlich, dass Fehler auftreten, wenn sie maschinell ausgeführt werden, als wenn sie von Hand ausgeführt werden. Natürlich können und werden Fehler in der Maschinentabelle auftreten, und wenn dies der Fall ist, sind sie oft sehr schwer zu identifizieren und zu überprüfen.

Alle Fehler, die beim Codieren, Editieren oder bei der Feldarbeit der Umfrage entdeckt wurden, können die Tabellierarbeit beeinträchtigen. Daher ist es häufig wünschenswert, mit der Hand-Tabellierung neben der Feldarbeit fortzufahren.

(7) Die Kosten für Tabellierungsvorgänge sind ein wichtiges Anliegen des Forschers. Die Maschinentabelleierung ist oft mit viel höheren Kosten verbunden, da die meisten Lochkarten, Gebühren für das Stanzen und Prüfen, Maschinenkosten für Sortier- und Tabellierungsmaschinen und die Kosten für die Einstellung spezieller Dienstleistungen für bestimmte Arten von Maschinenbedienern oft viel mehr als die beteiligten Beteiligten ausmachen tabellierung.

(8) Ein weiterer wichtiger Aspekt ist die Zeit. Bei der maschinellen Tabellierung wird die Tabulierungsarbeit als solche in sehr kurzer Zeit erledigt, aber die Vorbereitungsschritte sowie die Schulung, Überwachung und mögliche Nichtverfügbarkeit bestimmter Leihmaschinen, die zu einer Verschiebung der Arbeit führen, können unweigerlich zur Verschwendung beitragen von Zeit.

(9) Die Bequemlichkeitserwägungen können kaum ignoriert werden. Wenn die mechanische Tabellierung die Versendung von Rohdaten an ein Büro in der Nähe des Projektbüros erfordert, entstehen Unannehmlichkeiten, die beim Verpacken, beim Transport usw. anfallen.

(10) Schließlich kann auch die Menge des aufzuzeichnenden und zu analysierenden Kommentars die Auswahl der Tabellierungsmethoden beeinflussen. In einigen Meinungsumfragen sind die wörtlichen Kommentare der Informanten wichtig. Die Handcode-Karte, die allein für die Hand-Tabulation verwendet wird, kann Platz für solche Anmerkungen oder Kommentare bieten.

Maschinen, die Tabellierarbeiten erledigen, sind vielfältig. Die Entwicklungen auf diesem Gebiet waren in den letzten Jahren extrem schnell. Einige Maschinen sortieren und zählen einfach Karten, andere sortieren, zählen und drucken die Ergebnisse, andere wiederum sind für komplizierteste statistische Operationen oder Berechnungen gerüstet.

Diese letztgenannten Maschinen sind äußerst komplex und müssen von einem Spezialisten in der Linie für eine bestimmte Operation programmiert werden. A table is an exhibit of the numerical data systematically arranged in labelled columns (vertical) and rows (horizontal).

A simple or elementary table indicates simple counts of the frequencies with which the various categories in each set occur in the data, for example, the number of people in the sample who have attended high school but not passed, the number of people who have attended college but not graduated and so on. The table given below simply points out the frequencies of visits of fifty respondents to the cinema.

In research, we are often interested in finding out the correlation between two or more variables, eg, education and income and fertility, simple tables (illustrated above) showing frequency distribution of the respondents in respect of a single characteristic, eg, education or income or fertility, do not help us see the relationship among two or more variables.

The way to see the relationship is by preparing cross-tables or breakdown tables. Such tables make possible the grouping of cases that occur jointly in two or more categories, for example, tabulation of the number of cases that are high in education, low in income and have between 2 and 3 children, or the number of cases that are low in education, low in income and have between 4 and 5 children and so on. The most elementary form of cross-tabulation the students are familiar with is the college time-table.

Suppose a researcher wants to see the relationship among three variables, viz., occupation, income and fertility. He must employ a scheme of tabulation that will afford all possible combinations of the different categories of these three variables.

Cross- tabulation of the data on a hypothetical sample of 100 persons may be presented as under:

In the above table, we have indicated the number of children in rows. This variable of fertility has been divided into five categories, ie, no issue, 1 to 2 issues, 3 to 4, 5 to 6, 7 and above. So in the margin on the left hand, we have these 5 categories of fertility. We have indicated the income of 100 respondents in columns.

The income variable has been sub-divided into five categories, ie, below Rs.200, Rs.201-400, 401-600, 601-800, 801-1000. Thus, we have five columns corresponding to these categories.

Again since we have one more variable, ie, occupation to accommodate, the columns for income have each been sub-divided into two parts corresponding to the two categories in which the occupations have been divided, ie, white collar occupation and blue-collar occupation.

Thus, we have ten vertical columns, corresponding to income and occupation. The number of horizontal rows we have for the categories of the fertility variable is five. Thus, we have ten columns crossed by five rows making up the body of the table.

The intersection of the columns and rows has effected 50 (fifty) cells or boxes. Each of these boxes or cells houses a particular number of cases which are different from those in other cells either in respect of income or occupation, in fertility or in any two of these or in all of these. Let us read the table to get some idea as to what it represents.

Out of the total sample of 100 cases, there are 25 who have between 3 and 4 issues. Of these 25, reading from the left-hand side, 5 persons (with between 3 and 4 children) have income below Rs.200/- and are employed in white-collar occupations.

Two persons (with between 3 and 4 children) have income below Rs.200 and are employed in blue- collar occupations. Let us now take the second row. Of the total respondents, 38 have between 1 and 2 children. 11 (in the 7th cell) who have between 1 and 2 children are from the income group Rs.601 to Rs.800 and are employed in white-collar occupation.

This exercise should make it very clear that cross-tabulation is an essential step in the discovery of or testing of relationships among the variables contained in the data.

Tabulation is a means to present data in a summarized form in a way that facilitates the required statistical calculations. Data may, however, be presented in other ways, ie, instead of presenting them in a tabular form, the researcher may present them in the form of diagrams or graphs. Such diagrammatic or graphic representations do have the merit of being intelligible to a less knowledgeable reader.

But they suffer from the limitation that they are not so useful as a basis for statistical calculations. Let us now proceed to discuss the next operation, ie, the statistical analysis of data. Tabulation is a prerequisite or a first step in this direction.

Step # 4. Statistical Analysis of Data :

In research, we are not concerned with each individual respondent. The purpose of research is broader than this. That is, we wish to know much more than simply that a given respondent, for example, has extremely favourable attitude toward disarmament and that another respondent has moderately unfavorable attitudes toward the same issue. But this information is just not enough.

Social science researches are generally directed toward providing information about a particular population of respondents mostly via a sample. The sample of the totality might be asked certain questions related to the problem of our study, or be subjected to some form of observation.

Let us suppose that we have asked a sample of a thousand college students studying in 'post-graduate' classes a series of questions with a view to securing information about their study habits. Our research would thus be directed toward providing information about the 'population' of 'post-graduate' students of which the thousand cases is a sample.

As a necessary step to characterizing this 'population', we would have to describe or summarize the information about study habits that we have obtained on the sample thereof. Tabulation is just a part of this step. In addition, we must estimate the reliability of generalizations of the 'population' from the obtained data. Statistical methods are useful in fulfilling both these ends.