Grundgesamtheit und Stichprobe unterscheiden und untersuchen

Die Grundgesamtheit (auch Population) ist die gesamte Anzahl an Objekten, über die du Schlüsse ziehen möchtest.

Die Stichprobe ist eine Teilmenge der Grundgesamtheit.

Der Unterschied zwischen Stichprobe und Grundgesamtheit besteht darin, dass die Grundgesamtheit alle Objekte umfasst, über die du Erkenntnisse gewinnen willst. Die Stichprobe ist hingegen der Teil der Grundgesamtheit, den du untersuchst, um Schlüsse zu ziehen.

Beispiel: Grundgesamtheit und Stichprobe
Du möchtest das durchschnittliche Alter bestimmen, in dem Studierende in Deutschland ihr Masterstudium beginnen.

Grundgesamtheit: Alle Studierenden, die ihren Master in Deutschland begonnen haben.
Stichprobe: 500 Studierende, die du für deine Studie befragst.

Meist ist es aus Kosten- oder Zeitgründen nicht möglich, Daten der ganzen Grundgesamtheit zu erheben. Stattdessen wird repräsentativ für die Grundgesamtheit die Stichprobe untersucht.

Repräsentative Stichprobe

Eine repräsentative Stichprobe ist eine Stichprobe, die verschiedene Eigenschaften der Grundgesamtheit so widerspiegelt, dass von der Stichprobe auf die Grundgesamtheit geschlossen werden kann. Jede Stichprobe sollte repräsentativ sein.

Ob eine Stichprobe repräsentativ ist, hängt von diesen Punkten ab:

Stichprobenziehung

Durch die Art der Stichprobenziehung wird bestimmt, wie ausgewählt wird, welche statistischen Einheiten aus der Grundgesamtheit in die Stichprobe gelangen. Die Art der Stichprobenziehung nimmt auf die Repräsentativität Einfluss.

Die beste Art der Stichprobenziehung, um eine repräsentative Stichprobe zu erhalten, ist die probabilistische Stichprobe.

Probabilistische Stichproben werden zufällig aus der Grundgesamtheit gezogen. Jede statistische Einheit der Grundgesamtheit kann so mit gleicher Wahrscheinlichkeit in die Stichprobe gelangen. Dies lässt Generalisierungen im Hinblick auf die Grundgesamtheit zu.

Beispiel: Stichprobenziehung
Du möchtest das durchschnittliche Alter bestimmen, in dem Studierende in Deutschland ihr Masterstudium beginnen.

Probabilistische Stichprobe: Du hast Zugang zum Register aller Masterstudierenden in Deutschland. Aus diesem ziehst du zufällig deine Stichprobe.

Merkmale der Grundgesamtheit vertreten

Damit die Stichprobe repräsentativ ist, sollten unterschiedliche Merkmale der Grundgesamtheit möglichst gut in der Stichprobe abgebildet sein.

Beispiel: Merkmale der Grundgesamtheit vertreten
Du möchtest das durchschnittliche Alter bestimmen, in dem Studierende in Deutschland ihr Masterstudium beginnen.

Die unterschiedlichen Merkmale der Grundgesamtheit sollten in der Stichprobe vertreten sein. Es könnte zum Beispiel sein, dass Medizinstudierende aufgrund der Wartesemester durchschnittlich älter sind als Studierende anderer Studiengänge.

Wenn Medizinstudierende in der Stichprobe überrepräsentiert wären, könnte dies das Durchschnittliche Alter beeinflussen,

Deshalb legst du fest, dass Studierende aus unterschiedlichen Studiengängen gleichermaßen (proportional zur Größe des Studiengangs) in der Stichprobe vorkommen sollen. Innerhalb dieser Vorgabe werden die Studierenden zufällig ausgewählt.

So kannst du verhindern, dass durch Zufall sehr viele Studierende aus einem Studiengang in die Stichprobe gelangen und dies die Ergebnisse verändert.

Ist dies nicht der Fall, ist die Stichprobe nicht repräsentativ, sondern verzerrt. Dies bedeutet, dass die Eigenschaften in der Stichprobe anders als in der Grundgesamtheit vertreten sind. Das kann vorkommen, wenn die Stichprobe nicht zufällig gezogen wird.

Stichprobenumfang

Der Stichprobenumfang ist die Größe, also die Anzahl der statistischen Einheiten in der Stichprobe. Im Allgemeinen steigt die Repräsentativität einer Stichprobe mit ihrer Größe.

Eine Richtlinie in der wissenschaftlichen Forschung ist, dass die Stichprobengröße mindestens 30 sein sollte. Dies ist jedoch nur eine ungefähre Angabe und hängt von den statistischen Merkmalen der Studie ab.

Du kannst genau berechnen, wie groß deine Stichprobe sein sollte. Dazu benötigst du dein Konfidenzniveau, die Fehlergrenze (m) und die Verteilung der Merkmalsausprägungen der Grundgesamtheit (). So lässt sich bestimmen, wie groß deine Stichprobe (n) sein sollte.

Formel zum Berechnen der notwendigen Stichprobengröße:

    \begin{equation*}   \displaystyle n = {\frac{\hat{p}(1-\hat{p})z^2}{m^2}\left} \end{equation*}

n = Stichprobengröße
z = z-Wert, berechnet aus dem Konfidenzniveau
= Verteilung der Grundgesamtheit (da dies nicht bekannt ist, wird es geschätzt oder sicherheitshalber der Wert 0.5 genutzt)
m = Fehlergrenze

Beispiel: Notwendiger Stichprobenumfang
Du möchtest das durchschnittliche Alter bestimmen, in dem Studierende in Deutschland ihr Masterstudium beginnen.

Der Stichprobenumfang sollte möglichst groß sein, damit die Stichprobe repräsentativ ist. Die notwendige Stichprobengröße berechnest du anhand der oben genannten Formel.

Du wählst ein Konfidenzniveau von 95 %, was einem z-Wert von 1.96 (z) entspricht. Deine Fehlergrenze ist 5 % (m), und da du die Verteilung der Grundgesamtheit nicht genau kennst, nimmst du 0.5 ().

z = 1.96
= 0.5
m = 0.05

Ergebnis bei Anwendung der oben genannten Formel = 384.16 (aufrunden)

Dies bedeutet, dass deine Stichprobe mindestens aus n = 385 Studierenden bestehen sollte.

Von der Stichprobe auf die Grundgesamtheit schließen

Selbst eine repräsentative Stichprobe ist kleiner als die Grundgesamtheit. Deshalb sind die tatsächlichen Werte und Eigenschaften der Grundgesamtheit nicht bekannt. Darum wird herausgefunden, ob die Daten der Stichprobe auf die Grundgesamtheit übertragbar sind.

Dazu wird in der quantitativen Forschung meist per Hypothesentest berechnet, wie wahrscheinlich es ist, dass die Ergebnisse aus der Stichprobe von den wahren Werten der Grundgesamtheit, also deren Eigenschaften, abweichen.

Ein Wert, der darüber informiert, inwieweit man von der Stichprobe auf die Grundgesamtheit schließen kann, ist der Stichprobenfehler. Je ähnlicher die Stichprobe der Grundgesamtheit ist, desto geringer ist der Stichprobenfehler.

Stichprobenfehler

Der Stichprobenfehler (auch Standardfehler) ist eine Angabe, die beschreibt, wie sehr sich die Stichprobe von der Grundgesamtheit unterscheidet. Er ist beim Schlussfolgern über die Grundgesamtheit wichtig.

Der Stichprobenfehler ist demnach nicht immer ein ‚Fehler‘, sondern beschreibt lediglich, wie sehr der Mittelwert der Stichprobe vom Mittelwert der Grundgesamtheit abweicht.

Stichprobenfehler kommen selbst dann vor, wenn die Stichprobe zufällig aus der Grundgesamtheit gezogen wurde. Denn die Stichprobe ist nicht identisch mit der Grundgesamtheit.

Beispiel: Stichprobenfehler
Du möchtest das durchschnittliche Alter bestimmen, in dem Studierende in Deutschland ihr Masterstudium beginnen.

Grundgesamtheit: Alle Studierenden, die ihren Master in Deutschland begonnen haben.
Stichprobe: 500 Studierende, die du für deine Studie befragst.

Stichprobenfehler: Beschreibt, wie sehr der Mittelwert des Alters der Master Studierenden in deiner Stichprobe (z. B. M = 25.98 Jahre) von dem Mittelwert aller Master Studierenden (z. B. μ = 25.34 Jahre) abweicht.

Der wahre Mittelwert der Grundgesamtheit (hier μ = 25.34) ist in der Realität nicht bekannt.

Um den Stichprobenfehler zu verringern, kannst du beispielsweise eine größere Stichprobe auswählen. In den meisten Fällen gilt: Je größer der Stichprobenumfang, desto geringer der Stichprobenfehler.

Was ist dein Score?

Erfahre binnen 10 Minuten, ob du ungewollt ein Plagiat erzeugt hast.

  • 99,3 Milliarden Internetquellen
  • 8 Millionen Publikationen
  • Gesicherter Datenschutz

Zur Plagiatsprüfung

Unterschiede zwischen Grundgesamtheit und Stichprobe

Es ist nicht immer einfach, die Grundgesamtheit und die Stichprobe voneinander zu unterscheiden. Deshalb sind hier noch einmal ein paar Beispiele genannt und die Schreibweisen statistischer Symbole aufgelistet, die die Unterscheidung einfacher machen.

Statistische Werte haben unterschiedliche Schreibweisen, wenn es um die Grundgesamtheit oder die Stichprobe geht. Die Grundgesamtheit wird meist mit griechischen Buchstaben notiert, während für die Stichprobe lateinische Buchstaben genutzt werden.

Grundgesamtheit und Stichprobe unterscheiden
Grundgesamtheit Stichprobe
Beispiele
Alle Studierenden im Masterstudium in Deutschland Die 200 Studierenden, die an deiner Studie teilnehmen
Die Wahlberechtigten einer Wahl Diejenigen, die bei einer Wahlumfrage befragt werden, um eine Prognose zu erstellen
Alle Lieder des Eurovision Song Contests Auf Englisch gesungene Lieder, mit denen der Eurovision Song Contest gewonnen wurde
Schreibweise
Generell Griechische Buchstaben Lateinische Buchstaben
Umfang N (Gesamtanzahl der statistischen Einheiten in der Grundgesamtheit) n (Größe der Stichprobe)
Durchschnitt (auch Mittelwert oder arithmetisches Mittel) μ oder M
Standardabweichung σ s oder SD

Häufig gestellte Fragen

Was ist die Grundgesamtheit?

Die Grundgesamtheit (auch Population) ist die gesamte Anzahl an Objekten, über die du Schlüsse ziehen möchtest.

Was genau ist eine Stichprobe?

Anhand bestimmter Punkte wird eine Teilmenge aus der Grundgesamtheit entnommen und untersucht. Dies nennt sich Stichprobe.

Was sind Unterschiede zwischen Grundgesamtheit und Stichprobe?

Der Unterschied zwischen Grundgesamtheit und Stichproben besteht darin, dass die Grundgesamtheit alle Objekte umfasst, über die du Erkenntnisse gewinnen willst. Die Stichprobe ist hingegen der Teil der Grundgesamtheit, den du untersuchst, um Schlüsse zu ziehen.

Wie von der Stichprobe auf die Grundgesamtheit schließen?

Um Aussagen über die Grundgesamtheit treffen zu können, möchtest du von der Grundgesamtheit auf die Stichprobe schließen. Dazu sollte die Stichprobe repräsentativ sein. Dann wird berechnet, ob die Werte der Stichprobe von denen der Grundgesamtheit abweichen.

Was macht eine Stichprobe repräsentativ?

Eine Stichprobe ist repräsentativ für die Grundgesamtheit, wenn die Merkmale der Grundgesamtheit in ihr abgebildet sind. Dabei hilft es, wenn die probabilistische Stichprobenziehung verwendet wird und der Stichprobenumfang groß ist.

War dieser Artikel hilfreich?
Linda Hasselbusch

Linda ist gerade in den letzten Zügen ihres Bachelorstudiums in Psychologie an der Universität Amsterdam und interessiert sich besonders für Sozialpsychologie. Ihr Interesse an der Forschung möchte sie gerne mit euch teilen, sodass ihr vielleicht auch Spaß daran findet.