Die 5 Arten der Reliabilität einfach erklärt

Die Reliabilität ist ein wichtiges Gütekriterium einer wissenschaftlichen Arbeit und beschreibt, wie zuverlässig die Ergebnisse deiner Forschung sind.

Bei der Reliabilität dreht sich alles darum, wie genau deine Messungen sind und wie gut sie sich somit reproduzieren lassen.

Es gibt fünf Arten der Reliabilität, die du in deiner Forschung prüfen kannst:

Reliabilität Definition

Die Reliabilität bezieht sich auf die Zuverlässigkeit einer Messmethode.

Ist deine Forschung reliabel, bedeutet das, dass sie sich reproduzieren lässt. Wenn deine Messung unter gleichen Bedingungen wiederholt werden würde, kämen ähnliche Ergebnisse dabei heraus.

Reliabilität lässt konsistente Ergebnisse zu, die einen Mehrwert für die Wissenschaft haben. Ohne Reliabilität können wir gemessenen Ergebnissen nicht vertrauen.

Es gibt verschiedene Faktoren, die die Reliabilität beeinflussen können. Diese gilt es durch die Prüfung der Reliabilität zu eliminieren.

Reliabel: Du führst eine Umfrage mit einem standardisierten Fragebogen durch, sodass alle Antworten auf die gleiche Art und Weise ausgewertet werden können.
Nicht reliabel: Du führst eine Umfrage mit einem Fragebogen durch, der viele Freitext-Fragen enthält. Ohne eine Codierung mit genauen Vorgaben wirst du keine zuverlässigen Ergebnisse erhalten.

Die 5 Arten der Reliabilität

Um sicherzugehen, dass die Ergebnisse deiner Forschung reliabel sind, gibt es fünf verschiedene Arten, die Reliabilität deiner Arbeit zu prüfen.

Das sind die 5 Arten der Reliabilität:

  1. Interrater Reliabilität
  2. Retest Reliabilität
  3. Paralleltest Reliabilität
  4. Split Half Reliabilität
  5. Interne Konsistenz Reliabilität
Beachte
Je nach Art deiner wissenschaftlichen Untersuchung und Umfang deiner Arbeit ist es meist ausreichend, eine der 5 Arten von Reliabilität praktisch zu überprüfen. Die anderen Arten sollten jedoch in die theoretischen Überlegungen einbezogen werden.

Am häufigsten wird die Interne Konsistenz Reliabilität verwendet, denn hier sind keine weiteren Tests nötig.

Beispiel
Wenn du eine Untersuchung mit einem Merkmal durchführst, das sich über die Zeit nicht verändert, bietet sich eine Retest Reliabilität an. Es ist nicht nötig, die Reliabilität zusätzlich durch eine andere Art von Reliabilität sicherzustellen, es sei denn, deine betreuende Lehrperson wünscht es.

Möchtest du eine fehlerfreie Arbeit abgeben?

Mit einem Lektorat helfen wir dir, deine Abschlussarbeit zu perfektionieren.

Neugierig? Bewege den Regler von links nach rechts!

Zu deiner Korrektur

Interrater Reliabilität

Man spricht von Interrater Reliabilität, wenn mehrere Personen die gleichen Daten auswerten und dabei die gleichen Ergebnisse produzieren. Die Interrater Reliabilität misst die Übereinstimmungen zwischen den Ergebnissen.

Beispiel
Du wertest anhand einer Audio-Datei ein Experteninterview aus und notierst dir, wie oft du Hinweise auf ein bestimmtes Verhalten wahrnimmst. Dieses Verhalten wurde vorher genau definiert. Anhand dieser Definition führen noch zwei weitere Personen eine Auswertung der gleichen Audio-Datei durch. Die Ergebnisse werden verglichen.
Anwendung
Die Interrater Reliabilität ist eng mit der Objektivität verbunden und wird daher besonders bei den Forschungsprojekten wichtig, die kein standardisiertes Vorgehen verwenden und von Person zu Person unterschiedlich ausfallen könnten.

Retest Reliabilität

Die Retest Reliabilität lässt sich durch die wiederholte Messung der gleichen Daten bestimmen. Das bedeutet, du wiederholst deine Untersuchung ein zweites Mal unter den gleichen Bedingungen und vergleichst die Ergebnisse.

Beispiel
Du führst zu zwei unterschiedlichen Zeitpunkten das gleiche Experiment mit identischen Versuchspersonen durch. Die Korrelation zwischen diesen Ergebnissen ist die Retest Reliabilität.
Anwendung
Ein Retest wird nur dann durchgeführt, wenn du ein Merkmal untersuchst, das sich über die Zeit nicht verändert, und deine Versuchspersonen auch über einen längeren Zeitraum für Untersuchungen verfügbar sind.

Paralleltest Reliabilität

Bei einem Paralleltest werden zwei Versionen eines Messinstruments getestet, die dasselbe Merkmal messen. Die gleichen Personen müssen erst die eine und dann die andere Version durchlaufen. Die Ergebnisse sollten ähnlich sein, um eine hohe Reliabilität zu gewährleisten.

Beispiel
Du hast zwei Fragebogen erstellt, die ein Persönlichkeitsmerkmal bei einer Gruppe von Versuchspersonen testen sollen. Alle Versuchspersonen füllen beide Fragebogen aus und die Korrelation zwischen den Ergebnissen wird gemessen. So erhältst du präzise Ergebnisse.
Anwendung
Der Paralleltest eignet sich nur, wenn zwei gleichwertige Versionen eines Messinstruments vorhanden sind und sich das zu messende Merkmal über einen längeren Zeitraum nicht verändert.

Split Half Reliabilität

Die Split Half Reliabilität ist eine künstliche Halbierung deines Tests. Teile deinen Fragebogen bspw. in zwei gleich große Hälften und vergleiche die Ergebnisse.

Beispiel
Du hast eine Umfrage erstellt, die ein Persönlichkeitsmerkmal erfassen soll. Theoretisch sollte jede deiner Fragen darauf abzielen, dieses Merkmal zu ermitteln. Du teilst den Fragebogen also in zwei Hälften und wertest die Ergebnisse parallel aus. Sind die Ergebnisse nicht ähnlich, scheint die Umfrage nicht konsistent das gleiche Merkmal abzufragen.
Anwendung
Ist ein Retest oder ein Paralleltest nicht möglich und hast du genügend Teilnehmende befragt, kannst du mithilfe der Split Half Methode die Reliabilität deiner Forschung prüfen.

Interne Konsistenz Reliabilität

Bei der internen Konsistenz geht es darum, einzelne Fragen in einer Umfrage, einem Interview oder einer anderen Forschungsmethode miteinander zu vergleichen. Jede Frage in einer Umfrage wird bspw. als eigene Umfrage betrachtet. Die Ergebnisse werden jeweils miteinander korreliert.

Beispiel
Du hast eine Umfrage erstellt, um die Mathekenntnisse von Schülern zu messen. Wenn die Ergebnisse der einzelnen Aufgaben stark mit dem Gesamtergebnis der Umfrage korrelieren, sprechen wir von einer konsistenten Umfrage.
Anwendung
Die interne Konsistenz ist die häufigste Art von Reliabilität, die gemessen wird, denn es müssen keine weiteren Tests durchgeführt werden.

Um die interne Konsistenz anzugeben, wird Cronbachs Alpha verwendet. Bei Cronbachs Alpha handelt es sich um eine Messmethode aus der Statistik, die den Grad an Übereinstimmung zwischen mehreren Fragen eines Fragebogens misst.

Die 3 Reliabilitätstypen

Die fünf Arten der Reliabilität werden drei verschiedenen Reliabilitätstypen zugeordnet:

  1. Stabilität
  2. Konsistenz
  3. Äquivalenz
Beachte
Es ist in der Regel nicht nötig, jede Art von Reliabilität einzeln zu prüfen. Dies gibt bei einer Abschlussarbeit meist der zeitliche Aufwand nicht her.

Die Einteilung in die drei Reliabilitätstypen dient daher dazu, besser zu verstehen, welche Vorteile die 5 Arten von Reliabilität mit sich bringen: Sie verleihen deiner Forschung Stabilität, Konsistenz und Äquivalenz.

Die Zuordnung der fünf Arten von Reliabilität zu den drei Reliabilitätstypen haben wir dir in einem Schaubild veranschaulicht:

Zuordnung der 5 Arten von Reliabilität

reliabilität-scribbr

Stabilität

Die Stabilität bezieht sich auf die Ähnlichkeit der Messergebnisse zu verschiedenen Zeitpunkten.

Ein gängiges Verfahren zur Überprüfung der Stabilität deiner Forschung ist die Retest Reliabilität, bei der ein Test nach einer bestimmten Zeit wiederholt wird.

Konsistenz

Die Konsistenz beschreibt das Ausmaß, mit dem bestimmte Elemente deiner Forschung, die in einem Test ein identisches Merkmal messen sollen, auch tatsächlich dasselbe Merkmal messen. Ein solches Element könnten z. B. Fragen in einer Umfrage sein.

Die Split Half Reliabilität, bei der eine Umfrage z. B. in zwei Teile geteilt wird, dient dazu, die Konsistenz deiner Forschung zu überprüfen.

Auch die interne Konsistenz überprüft, wie der Name bereits sagt, die Konsistenz deiner Forschung.

Äquivalenz

Die allgemeine Gleichwertigkeit verschiedener Messungen fällt unter die Äquivalenz.

Zur Überprüfung der Äquivalenz können die Interrater Reliabilität und die Paralleltest Reliabilität herangezogen werden.

Du überprüfst, ob verschiedene Personen bzw. verschiedene Messinstrumente bei der Auswertung desselben Merkmals gleichwertige Ergebnisse erzielen.

Reliabilität vs. Validität

Die Gütekriterien Reliabilität und Validität dürfen nicht verwechselt werden. Wir zeigen dir den zentralen Unterschied in einer Tabelle:

Reliabilität und Validität im Vergleich
ReliabilitätValidität
Deine Forschung ist reliabel, wenn sie bei wiederholter Durchführung ähnliche und somit zuverlässige Ergebnisse liefert.Deine Forschung ist valide, wenn sie tatsächlich das misst, was sie messen soll und somit glaubwürdige Ergebnisse liefert.
Grundsätzlich gilt: Eine hohe Reliabilität ist Voraussetzung für eine hohe Validität. Nur wenn deine Forschung zuverlässige Ergebnisse liefert und somit reliabel ist, können auch die Ergebnisse gemessen werden, die gemessen werden sollen.

Häufig gestellte Fragen

Was ist Reliabilität?

Deine Forschung ist reliabel, wenn sie sich reproduzieren lässt. Würde die Messung also unter gleichen Bedingungen wiederholt werden, kämen ähnliche Ergebnisse dabei heraus.

Wie hängen Reliabilität und Validität zusammen?

Reliabilität und Validität sind Gütekriterien für empirische Forschung. Eine Messung ist valide, wenn sie tatsächlich das misst, was sie messen soll, und somit glaubwürdige Ergebnisse liefert. Die Reliabilität bezieht sich darauf, ob deine Forschung bei wiederholter Durchführung zuverlässige Ergebnisse liefert.

Wann ist die Reliabilität eingeschränkt?

Die Relialibilität ist eingeschränkt, wenn eine Messung bei Wiederholung unter gleichen Bedingungen andere Ergebnisse liefert.

War dieser Artikel hilfreich?
Franziska Pfeiffer

Franzi hat ihren Bachelor in Publizistik und Kommunikation in Berlin abgeschlossen und steht nun kurz vor den Masterabschluss. Sie kennt sich besonders gut mit den verschiedenen Forschungsmethoden aus und schreibt leidenschaftlich gerne Artikel, die anderen Studierenden zum Abschluss verhelfen.

2 Kommentare

Özeren
25. Dezember 2019 um 01:29

Hallo Frau Pfeiffer,

ich habe eine Frage bzgl. der Reliabilitätsanalyse: ich habe in meiner Studie einige Fragebögen, die nur zu einem bestimmten Zeitpunkt gegeben wurde. Dafür habe ich die interne Konsistenz nur berechnet. Ich habe auch wiederum Fragebögen, die zu zwei Zeitpunkten gegeben wurde. Soll ich dann getrennt für T1 und T2 die interne Konsistenz berechnen oder soll ich bei solchen Fragebögen den Retest- Reliabilität berechnen?

Antworten

Laura Draws
Laura Draws (Scribbr-Team)
2. Januar 2020 um 13:15

Hallo Özeren,
danke für deine Frage!
Ein Retest dient dazu, mit einer wiederholten Messung die gleichen Daten zu bestimmen. Ein Retest läge also vor, wenn du den gleichen Fragebogen zu zwei Zeitpunkten mit den gleichen Befragten verwendet hättest.
Wenn ich dich richtig verstehe, hast du den gleichen Fragebogen zwar zu zwei Zeitpunkten, aber mit unterschiedlichen Befragten verwendet, richtig?
Du solltest also auf die interne Konsistenz zurückgreifen.
Viel Erfolg!

Antworten

Hinterlasse einen Kommentar oder eine Frage

Please click the checkbox on the left to verify that you are a not a bot.