Likert-Skalen ­– Fünf Aspekte, die bei der Erstellung einer Likert-Frage berücksichtigt werden sollten

 

Einleitung 

Viele von Ihnen haben sicher schon einmal eine Umfrage mit Hilfe einer Ratingskala beantwortet. Es kann sich um eine Umfrage zu einer Lehrveranstaltung oder Fragen zu bestimmten Themengebieten gehandelt haben. Eine Ratingskala dient der Erfassung rangbasierter Aussagen. 
Im Gegensatz zu komparativen Skalen werden bei nicht komparativen Skalen die zu bewertenden Objekte isoliert voneinander betrachtet. Zu diesen nicht komparativen Skalen gehört auch die diskrete Ratingskala von Rensis Likert, die im Jahre 1932 erstmals vorgestellt wurde. Dieses Skalierungsverfahren gehört zu den meistverwendeten verbalen Ratingskalen.
Mit Likert-Skalen werden Konstrukte wie Einstellung, Wichtigkeit, Zufriedenheit, Kaufabsicht, Kaufhäufigkeit und Zustimmung gemessen.

Wollen Sie Meinungen oder Einstellungen erfassen, ist es sinnvoll, eine Likert-Skala mit den üblichen vier bis sieben Antwortkategorien zu verwenden. Antwortkategorien sind die zu wählenden Antwortmöglichkeiten innerhalb der Antwortskala. Diese müssen genauso viele positive (zustimmende) wie negative (ablehnende) Antwortmöglichkeiten enthalten.

Bei der Erstellung einer Antwortskala ist außerdem zu beachten, dass die zu untersuchende Frage oder Aussage (Item) der Antwortskala entspricht.

In diesem Artikel werden fünf Aspekte aufgelistet, die bei der Entwicklung einer Likert-Frage berücksichtigt werden sollten.

 

 

Die Anzahl der Antwortkategorien

Eine optimale Anzahl von Antwortkategorien gibt es nicht. Üblicherweise werden Ratingskalen mit fünf bis neun Antwortkategorien verwendet. Jedoch sollten bei der Auswahl der Anzahl drei Faktoren berücksichtigt werden.

Der erste wichtige Faktor ist die Formulierung der einzelnen Antwortkategorien. Anhand geeigneter Formulierungen können die Stufen eindeutiger voneinander abgegrenzt werden. Bei einer großen Anzahl von Antwortkategorien müssen einige der Befragten lange überlegen und geraten in Verwirrung. Diese Verwirrung entsteht durch die feine Unterscheidung der Antwortkategorien und die Unsicherheit, welcher der Kategorien die eigene Antwort entspricht. Bei mehr als sieben Antwortmöglichkeiten fällt das Formulieren der Kategorien tendenziell schwer. 

Zudem sollte beachtet werden, welche Form der Datenerhebung gewählt wird. Bei einer Telefoninterviewbefragung können die vielen Antwortkategorien unübersichtlich wirken. Aufgrund des Platzmangels kann es auch bei Brief- und Papierumfragen unvorteilhaft sein, eine Vielzahl an Antwortmöglichkeiten anzubieten. An der unten aufgeführten Darstellung lässt sich erkennen, dass bereits eine siebenstufige Likert-Skala vergleichsweise viel Platz benötigt.

Der dritte wichtige Faktor ist der Zweck für Verwendung der Daten. Eine Likert-Skala mit einer Vielzahl an Antwortkategorien ist zu wählen, wenn feinere Unterschiede in der Bewertung gewünscht sind. Für statistische Analysen wie korrelationsbasierte Verfahren wird eine differenziertere Antwortskala benötigt.

Wird die Wichtigkeit eines Einstellungsobjektes gemessen, so kann auch eine vierstufige Likert-Skala verwendet werden. 

Hier finden Sie ein Beispiel für eine siebenstufige Likert-Skala:

Die thematische Abfolge der behandelten Themenbereiche wirkt aufeinander abgestimmt.

Stimme überhaupt nicht zu Stimme nicht zu Stimme eher nicht zu Weder noch Stimme eher zu Stimme zu Stimme völlig zu

 

 

Balanciert vs. nicht balanciert

In Likert-Skalen werden Antwortkategorien mit verschiedenen Zustimmungsgraden (‚Stimme voll und ganz zu‘ – ‚Stimme überwiegend zu ‘– ‚Stimme teilweise zu‘ – ‚Stimme weniger zu‘ – ‚Stimme nicht zu‘) verwendet. Wichtig ist, dass die Antwortmöglichkeiten eine Rangreihe bilden und der Abstand zwischen den verschieden Zustimmungsgraden gleich ist. Bei einer balancierten Skala muss die Anzahl der positiven und negativen Antwortmöglichkeiten identisch sein.

Ein Beispiel für eine nicht balancierte Likert-Skala:

Stimme voll und ganz zu Stimme überwiegend zu Stimme teilweise zu Weder noch Stimme nicht zu

Wenn eine unterschiedliche Anzahl an Antwortmöglichkeiten vorliegt, kann dies zu einer Verzerrung der Daten führen. Die Unausgewogenheit der oben aufgeführten Skala kann die Befragten beeinflussen, so dass diese eine tendenziell positive Antwort anstatt einer negativen Antwort auswählen. Dies liegt daran, dass die Skala den Befragten das Gefühl vermittelt, die positiveren Antworten seien die ‚richtigen‘.

Zusätzlich sollte versucht werden, den Abstand zwischen den positiven und negativen Antwortmöglichkeiten gleichmäßig zu verteilen: ‚Stimme voll und ganz zu‘ – Stimme überwiegend zu‘ – ‚Weder noch‘ – ‚Stimme nicht zu‘ – ‚Stimme überhaupt nicht zu‘. 

In diesem Fall sind die Antwortmöglichkeiten ‚Stimme überwiegend zu‘ und ‚Stimme nicht zu‘ nicht gegensätzlich. Die Konsequenz, der nicht gleichmäßig verteilten Antwortmöglichkeiten ist, dass die Daten, wie bereits oben beschrieben, dadurch verzerrt werden. 

Außerdem gibt es keinen Unterschied zwischen den Aussagen ´Stimme nicht zu´ und ´Stimme überhaupt nicht zu´. In diesen Fällen werden die Daten bei der Auswertung verfälscht, da die Antwortmöglichkeit, im Sinn dieselbe ist und diese Kategorie dann ein erhöhtes Ergebnis bei der Auswertung erhält.

 

 

Gerade vs. ungerade Anzahl von Antwortkategorien

Es stellt sich die Frage, ob Sie eine gerade oder ungerade Anzahl von Antwortkategorien verwenden. Bei der Verwendung von Likert-Skalen ist sowohl eine gerade als auch eine ungerade Anzahl von Antworten möglich. 

Sicher haben auch Sie öfter fünf oder siebenstufige Likert-Fragen beantwortet. Bei diesen Varianten gibt es eine neutrale Mitte (‚Weder noch‘), was für die Beantwortung einer Frage und die Auswertung wichtig sein kann. 

Die Entscheidung, eine ungerade oder gerade Anzahl von Kategorien zu verwenden, hängt davon ab, ob es Befragte gibt, die möglicherweise eine neutrale Einstellung gegenüber der Aussage haben. 

Wenn eine neutrale oder indifferente Antwort zumindest von einem Teil der Befragten zu vermuten ist, sollte eine ungerade Anzahl von Kategorien verwendet werden. 

Durch eine gerade Zahl der Antwortkategorien kann eine Antwort erzwungen werden. Wenn der Auftraggeber der Umfrage eine Antwort erzwingen möchte, wählt er eine gerade Anzahl von Antwortkategorien. Dies ist der Fall, wenn davon ausgegangen wird, dass eine neutrale Antwort ergebnislos ist. Dass kann bei Aussagen, in denen eine Entscheidung erforderlich ist, wie zum Beispiel bei der Frage nach der Wichtigkeit, eintreten.

Mir ist die die gute Vorbereitung des Dozenten auf die Lehrveranstaltung wichtig.

Wichtig Eher wichtig Eher unwichtig Unwichtig

 

 

Obligatorische vs. nicht obligatorische Antwort

Wollen Sie eine Antwort von Ihren Probanden erzwingen, sollte keine Antwortkategorie wie ‚Weiß nicht‘ eingefügt werden. Denn damit geben Sie den Befragten die Möglichkeit, Ihrer Frage auszuweichen. Befragte, die schnell eine Antwort geben wollen, wählen oft diese Kategorie. Dies kann bei einer Vielzahl von Fällen zu einer Verzerrung der Daten führen, da der Befragte grundsätzlich die Antwort kennt, aber diese nicht angibt. 

Dennoch müssen Sie abwägen, inwiefern diese Kategorie für Ihre Untersuchung wichtig ist. Denn es gibt auch Themen, zu denen Ihr Proband möglicherweise keine Meinung hat. Es kann auch vorkommen, dass die Befragten keine Kenntnisse über den zu untersuchenden Sachverhalt haben. 

Wenn beispielsweise nach der Meinung eines Probanden zu einem Politiker gefragt wird und dieser keinen Einblick in die aktuellen politischen Geschehnisse hat, wird dieser einige Fragen nicht beantworten können. Hier macht es durchaus Sinn, die Kategorie ‚keine Meinung‘ einzufügen, da in diesem Fall eine erzwungene Antwort zu einer Verzerrung führen würde. 

Es können auch Befragungen zu Themen geben, in denen die Probanden keine Antwort geben möchten, da es für sie zu unangenehm oder privat ist. Dies können bei Fragen zur politischen Orientierung, dem sozialen Status oder zum psychologischen Zustand sein.

Die folgende Abbildung zeigt, wie eine entsprechende Likert-Skala aussehen könnte.

Die Dozentin/der Dozent war fachlich kompetent.

Stimme voll und ganz zu Stimme eher zu Stimme eher nicht zu Stimme überhaupt nicht zu Weiß nicht

 

 

Verbale Beschreibung

Es gibt Likert-Skalen, die vollkommen verbal beschrieben sind, nur teils beschrieben sind oder auch vollkommen nummeriert sind.

Wenn in Skalen jede Antwortkategorie verbal beschrieben wird, liegt die Anzahl der Antwortkategorien meist bei vier bis sieben Skalenpunkten. Andernfalls könnte das Benennen der Anker problematisch werden. Die verbale Benennung der Skalenpunkte hängt von der Art des zu beurteilenden Items ab. Bei Statements geht es um den Grad der Zustimmung oder Ablehnung. In diesem Fall ist eine vollständig verbale Skala zu empfehlen.

Der zeitliche Rahmen zur Bearbeitung der Übungsaufgaben ist für mich angemessen.

Trifft völlig zu

(1)

Trifft teilweise zu

(2)

Teils/Teils

(3)

Trifft teilweise nicht zu

(4)

Trifft nicht zu

(5)

Sie können auch, wie im obigen Beispiel, die Antwortmöglichkeiten für die spätere Auswertung nummerieren. Es gibt auch Likert-Skalen, in denen nur die Extrempunkte, aber nicht die mittleren Punkte, beschriftet werden. Hier finden Sie ein Beispiel für eine derartige Likert-Skala: 

Der Kurs war interessant und lebendig gestaltet.

Trifft völlig zu Trifft nicht zu

Ob alle oder nur einige Skalenpunkte beschriftet werden sollen, stellt sich zum größten Teil als reine Geschmacksache heraus. Die wissenschaftlichen Untersuchungen finden diesbezüglich keinen Unterschied im Hinblick auf den Antwortverhalten. Wichtig ist es jedoch, dass die äußere Alternativen beschriftet werden, sodass die Probanden wissen in welchem Bereich sie ihre Bewertungen abgeben. Die Beschriftung des mittleren Skalenpunktes ist dabei nicht unbedingt notwendig, hilft aber den Probanden noch schneller sich auf der Skala zu orientieren. 

 

 

Fazit

Abschließend kann festgehalten werden, dass einige Aspekte bei der Erstellung von Likert-Skalen berücksichtigt werden müssen. Es sollte vorab abgewogen werden, zu welchem Zweck die Befragung durchgeführt wird, wie sie ausgewertet und wie sie durchgeführt wird. Demnach können Sie festlegen, wie die bestmögliche Ratingskala zu entwerfen ist.

  

Autor:
Elif Aydogdu

 

 

Literaturverzeichnis

Baur, Nina, und Jörg Blasius, Hrsg. Handbuch Methoden der empirischen Sozialforschung. Wiesbaden: Springer Fachmedien Wiesbaden, 2014. https://doi.org/10.1007/978-3-531-18939-0.

Greving, Bert. „Messen und Skalieren von Sachverhalten“, o. J., 14.

Jacob, Rüdiger, Andreas Heinz, und Jean Philippe Décieux. Umfrage: Einführung in die Methoden der Umfrageforschung. De Gruyter Oldenbourg, 2019. https://doi.org/10.1515/9783110597387.

Malhotra, Naresh K., und David F. Birks. Marketing Research: An Applied Approach. Upd. 2. European ed. Harlow: Pearson Education, 2006.

Nürnberg, Volker. „Mitarbeiterbefragungen“, o. J., 145.

Schumann, Siegfried. Repräsentative Umfrage: praxisorientierte Einführung in empirische Methoden und statistische Analyseverfahren. 7., überarbeitete und ergänzte Auflage. Berlin/Boston: De Gruyter Oldenbourg, 2019.

Thielsch, Meinald T., Hrsg. Praxis der Wirtschaftspsychologie: Themen und Fallbeispiele für Studium und Anwendung. 2: Meinald T. Thielsch … (Hrsg.). MV Wissenschaft. Münster: Monsenstein und Vannerdat, 2012.

Weinreich, Uwe, und Eike von Lindern. Praxisbuch Kundenbefragungen: repräsentative Stichproben auswählen, relevante Fragen stellen, Ergebnisse richtig interpretieren. Werben & Verkaufen. München: mi-Fachverl, 2008.