3 Hauptdatenformen

Um die Natur der Daten zu verstehen, ist es notwendig, die verschiedenen Datenformen zu studieren, wie unten gezeigt:

1. Qualitativ und Quantitativ.

2. Fortlaufende und diskrete Daten.

3. Primär- und Sekundärdaten.

Form # 1. Qualitative und quantitative Daten:

Betrachten wir eine Reihe von Daten in Tabelle 2.1:

In Tabelle 2.1 wurde die Anzahl der Schulen entsprechend der Verwaltung der Schulen angegeben. Daher wurden die Schulen in 4 Kategorien eingeteilt, nämlich staatliche Schulen, lokale Körperschulen, privatgestützte Schulen und private nicht unterstützte Schulen. Eine bestimmte Schule gehört zu einer der vier Kategorien. Diese Daten werden als kategoriale oder qualitative Daten angezeigt.

Hier ist die Kategorie oder die Qualität, auf die verwiesen wird, Management. Kategoriale oder qualitative Daten ergeben sich somit aus Informationen, die in Kategorien eingeteilt wurden. Solche Kategorien sind alphabetisch oder in der Reihenfolge abnehmender Frequenzen oder auf andere herkömmliche Weise aufgelistet. Jedes Datenelement gehört eindeutig zu einer Klassifikation oder Kategorie.

Wir stoßen häufig auf kategoriale oder qualitative Daten, die mit einer Skala nicht messbar sind und als solche nicht in der Größenordnung ausgedrückt werden können. Geschlecht, Nationalität, Beruf, Religion, Art der Kriminalität, Familienstand, Alphabetisierung usw. sind Beispiele für qualitative Daten. Die Menschen unterscheiden sich je nach Geschlecht als "männlich" und "weiblich", je nach Nationalität als "amerikanisch", "französisch", italienisch oder indisch.

Studierende an einem College können der Fakultät "Wissenschaft", "Kunst" oder "Handel" zugeordnet werden. In diesem Klassifizierungssystem gibt es keine natürliche Ordnung in den Klassen. Dies ist entweder rein willkürlich oder erfolgt aufgrund der Anwesenheit oder Abwesenheit eines bestimmten Attributs in einer Person oder einem Objekt.

In Tabelle 2.2 wurde die Anzahl der Schüler anhand der Höhen angegeben. Schüler, die in einen bestimmten Höhenbereich fallen, werden in einer Gruppe zusammengefasst, z. B. befinden sich 15 Schüler im Höhenbereich zwischen 4, 5 ″ - 4, 8 ″. Da die Gruppierung auf Zahlen basiert, werden diese Daten als numerische oder quantitative Daten bezeichnet.

Wenn die Messung einer Variablen oder von Daten auf einer Skala in geeigneten Einheiten möglich ist, werden sie als quantitative Daten bezeichnet. Bei solchen Daten variieren Objekte in Größe und Grad, und die Messungen zeigen eine solche Variation an. Beispiele für quantitative Daten sind: Alter, Größe, Einkommen und intellektuelle Fähigkeiten usw.

Hier ist Alter in Jahren oder Monaten messbar, Höhe in cm, Einkommen in Rupien und intellektuelle Fähigkeiten in Form von Bewertungen. Mit quantitativen Daten können Objekte in geordneten Klassen angeordnet werden, dh wir können sagen, dass eine Klasse in einem Kontinuum höher ist als die andere. Die beobachteten Personengewichte und das monatliche Einkommen, die Bewertungen von 50 Studierenden, die Anzahl der Räume in Häusern usw. sind nur einige Beispiele für solche Messungen.

Somit ergeben sich numerische oder quantitative Daten aus dem Zählen oder Messen. In Zeitungen, Anzeigen usw. stoßen wir häufig auf numerische Daten, die sich auf die Temperatur der Städte, die Durchschnittswerte der Kricket, die Einnahmen, die Ausgaben usw. beziehen.

Formular Nr. 2: Fortlaufende und diskrete Daten:

Numerische oder quantitative Daten können abhängig von der Art der beobachteten Elemente oder Objekte kontinuierlich oder diskret sein.

Betrachten wir die Tabelle 2.3, die die Höhen der Schüler einer Klasse darstellt:

Tabelle 2.3 enthält die Daten zu den Höhen der Schüler einer Klasse. Das beobachtete Element ist hier die Höhe der Schüler. Die Höhe variiert zwischen 4'8 "und 5'10". Die Höhe eines Individuums kann zwischen 4'8 "und 5'10" liegen. Zwei Schüler können um fast null Zoll variieren. Selbst wenn wir zwei benachbarte Punkte nehmen, beispielsweise 4'8.00 "und 4'8.01", können zwischen den beiden Punkten mehrere Werte sein.

Diese Daten werden als kontinuierliche Daten bezeichnet, da die Höhe kontinuierlich ist. Kontinuierliche Daten ergeben sich aus der Messung von kontinuierlichen Attributen oder Variablen, bei denen sich die einzelnen Beträge um Beträge unterscheiden können, die sich dem Nullpunkt nähern. Gewichte und Höhen von Kindern; Temperatur eines Körpers; Intelligenz und Leistungsniveau von Studenten usw. sind Beispiele für fortlaufende Daten.

Die Körpergröße eines Individuums kann nicht mit absoluter Genauigkeit gemessen werden. Daher können wir nicht die Anzahl der Personen mit einer Körpergröße von genau 16 cm zählen. Die tatsächliche Höhe kann um einen Hundertstel Zentimeter von dieser Zahl abweichen. In solchen Fällen werden die Daten daher in Bezug auf bestimmte Gruppen oder Klassenintervalle angegeben.

In fortlaufenden Serien ist die statistische Einheit teilungsfähig und kann in Bruchteilen beliebiger Größe gemessen werden, egal wie klein sie ist. In einfachen Worten bilden kontinuierliche Variablen fortlaufende Reihen. In solchen Serien werden Elemente mit gebrochenen Differenzen von Wert zu Wert weitergegeben.

Diskrete Daten sind durch Lücken in der Skala gekennzeichnet, für die niemals echte Werte gefunden werden können. Solche Daten werden normalerweise in ganzen Zahlen ausgedrückt. Die Größe einer Familie, die Einschreibung von Kindern, die Anzahl der Bücher usw. sind Beispiele für diskrete Daten. Im Allgemeinen sind Daten, die sich aus der Messung ergeben, kontinuierlich, während Daten, die durch Zählen oder willkürliche Klassifizierung entstehen, diskret sind.

Diskrete Daten können genau gemessen werden, und zwischen den Werten zweier aufeinanderfolgender Elemente sind eindeutige Brüche sichtbar. Statistische Einheiten können bei diskreten Daten nicht unterteilt werden und bleiben vollständig und unteilbar. Sie werden durch diskrete Tatsachen gebildet, z. B. ist die Anzahl der Arbeiter in Industriebetrieben oder die Anzahl der Häuser unterteilungsunfähig. Ebenso können Sohn, Ehefrau usw. nicht in Bruchteile unterteilt werden.

Die Leistungsbewertungen der Schüler, auch wenn sie in diskreter Form dargestellt werden, können als kontinuierliche Daten betrachtet werden, da eine Punktzahl von 24 jeden Punkt zwischen 23, 5 und 24, 5 darstellt. Tatsächlich ist Leistung ein kontinuierliches Attribut oder eine Variable.

Alle Messungen kontinuierlicher Attribute haben einen ungefähren Charakter und bieten daher keine Grundlage für die Unterscheidung zwischen kontinuierlichen und diskreten Daten. Die Unterscheidung erfolgt anhand der gemessenen Variablen. 'Height' ist eine stetige Variable, aber die Anzahl der Kinder würde diskrete Daten ergeben.

Formular Nr. 3: Primär- und Sekundärdaten:

Die Daten, die von oder im Auftrag der Person oder Personen erhoben werden, die diese Daten verwenden werden, beziehen sich auf Primärdaten. Zum Beispiel der Besuch von Kindern, das Ergebnis der von Ihnen durchgeführten Untersuchungen sind Primärdaten.

Wenn Sie sich mit den Eltern der Kinder in Verbindung setzen und nach ihren Bildungsabschlüssen fragen, um sie mit den Leistungen der Kinder in Verbindung zu bringen, erhalten Sie auch Primärdaten. Wenn eine Person persönlich Daten oder Informationen zu einem Ereignis, einem bestimmten Plan oder Entwurf erfasst, bezieht sie sich auf Primärdaten.

Manchmal werden bei einer Untersuchung Daten verwendet, die bereits von einer anderen Person erhoben wurden, wie z. B. der Schulbesuch von Kindern, die Leistung von Schülern in verschiedenen Fächern usw. für das Studium. Dann handelt es sich bei den Daten um Sekundärdaten.

Die Daten, die von einer anderen Person oder Personen als den Personen verwendet werden, von denen oder für die die Daten erhoben wurden, beziehen sich auf Sekundärdaten. Aus vielen Gründen müssen möglicherweise sekundäre Daten verwendet werden, die sorgfältig verwendet werden sollten, da die Daten möglicherweise zu einem anderen Zweck als der des Ermittlers erhoben wurden und möglicherweise einige Details verlieren oder nicht vollständig relevant sind.

Für die Verwendung von Sekundärdaten ist es immer nützlich zu wissen:

ich. Wie wurden die Daten gesammelt und verarbeitet?

ii. Die Genauigkeit der Daten

iii. Wie weit sind die Daten zusammengefasst?

iv. Wie vergleichbar sind die Daten mit anderen Tabellen.

v. Und wie die Daten zu interpretieren sind, insbesondere wenn zu einem bestimmten Zweck erfasste Zahlen zu einem anderen Zweck verwendet werden.