Der t-Test
Irgendwie kommt es einem so bekannt vor, doch man weiß nicht so richtig was das ist – der t-Test.
Wenn man sich schon einmal mit statistischen Verfahren beschäftigt hat oder in Zukunft beschäftigen möchte, wird man dem Begriff des t-Tests hin und wieder über den Weg laufen.
Der t-Test ist ein Hypothesentest einer t-Verteilung und wird verwendet, um statistisch signifikante Unterschiede von Stichproben zu bestimmen.
In diesem Artikel zeige ich dir die verschieden Arten von t-Tests, wie man den Test durchführt und wie man das Ergebnis deuten kann.
Über den t-Test
Grundsätzlich prüft der t-Test, ob der Mittelwert eines Merkmals, der in einer Stichprobe ermittelt wurde, sich von einem theoretischen Wert dieses Merkmals abweicht (z.B. die reale Haltbarkeitsdauer eines Produkts von der gesetzlich vorgeschriebenen) oder ob die Mittelwerte zweier Gruppen sich voneinander unterscheiden (z.B. Präferenz für eine Automarke unter Männern und Frauen).
Diese beiden Herangehensweisen an die Prüfung des Mittelwertunterschiedes begründen zwei grundsätzliche Varianten vom t-Test: Einstichproben t-Test und Zweistichproben t-Test. Im Folgenden erläutere ich diese beiden Varianten in mehr Detail.
Einstichproben t-Test
Was ist das?
Der Einstichproben t-Test überprüft, ob der Mittelwert einer Stichprobe signifikant von einem bestimmten Erwartungswert abweicht.
So kann es z.B. geprüft werden, ob der Zuckergehalt eines Produktionsloses eines Erfrischungsgetränks im Mittel der von der Rezeptur vorgesehenen Menge entspricht. Hierzu wird aus der an einem Tag produzierten Menge eine Stichprobe von Flaschen zufällig gezogen und deren Zuckergehalt gemessen. Der Mittelwert von den gemessenen Zuckergehalte wird dann mit dem Wert aus dem Rezept verglichen. Weicht der gemessene Mittelwert vom Rezept ab, so kann der Produktionslos nicht ausgeliefert werden.
Wie führe ich den Test durch?
Der Einstichproben t-Test kann Linksseitig, Rechtsseitig oder Zweiseitig sein.
KURZ:
Linksseitig ist ein Testverfahren, wenn die Abweichung der getesteten Größte von dem erwarteten Wert nach unten geprüft wird.
Also lautet in unserem Beispiel die Hypothese, ob es in den entnommenen Flaschen weniger Zucker enthalten ist, als die Rezeptur es vorsieht.
Rechtsseitig ist die Teststatistik hingegen, wenn die Abweichung des uns interessierenden Wertes nach oben geprüft wird.
In unserem Beispiel heißt das, ob wir mehr Zucken in die Flaschen getan haben, als die Rezeptur es fordert.
Der zweiseitige t-Test testet hingegen in keine spezielle Richtung. Er weist nur eine Abweichung vom zu prüfenden Wert nach.
M.a.W. ist es uns nicht wichtig, in welche Richtung der Zuckergehalt abweicht – es ist uns nur wichtig, dass dem vorgeschriebenen Wert entspricht. Jede Abweichung – ob nach oben oder nach unten – ist für unseren Betrieb schädlich. In einem solchen Fall müssen wir eingreifen.
Betrachten wir nun die Durchführung des t-Tests anhand eines anderen Beispiels:
Du betreibst ein Beauty Unternehmen, welches Feuchtigkeitscremes herstellt.
Ein Glas der Feuchtigkeitscreme enthält 100ml. Deine Mitarbeiter machen dich jedoch darauf Aufmerksam, dass es sein könnte, dass die Abfüllmaschine weniger als die versprochenen 100ml abfüllt.
Dies sollte man als Unternehmensleiter natürlich überprüfen, da die Zufriedenheit der Kunden davon abhängen könnte. Dafür kannst du einen t-Test durchführen.
Es wird somit die Hypothese aufgestellt, dass die Füllung des Glases mit der Creme überdurchschnittlich oft unter dem 100 ml Inhalt liegt. Diese muss nun getestet werden.
Die Nullhypothese – so nennt man den Gegenteil der zu prüfenden Hypothese – würde lauten: Die Füllung des Glases der Creme weicht nicht von dem 100 ml Inhalt ab.
Um unsere Haupthypothese zu bestätigen, muss im laufe des t-Tests die Nullhypothese abgelehnt werden. Diese Ablehnung der Nullhypothese würde uns den statistischen Beweis dafür liefern, dass die Füllmenge des Cremes tatsächlich nicht eingehalten wird. In diesem Fall müssen wir eingreifen und die Einstellungen der Füllmaschine korrigieren.
Sobald wir die Hypothesen definiert haben, beginnt die Testphase:
Um den t-Test durchzuführen, müssen wir zunächst den sogenannten t-Wert ermitteln, der sich nach folgender Formel bestimmt wird:
Diese Formel setzt die durchschnittliche Abweichung zwischen dem ermittelten Mittelwert der zu prüfenden Größe (X̅ – durchschnittliche Menge der Creme pro Glas) und seinem theoretischen Wert (µ0 – Soll-Menge pro Glas) in Relation zur Varianz dieser Größe (s2) pro Glas (n).
Ist der Zähler gleich Null, so heißt es, es gibt keinen Unterschied zwischen der tatsächlichen und erwarteten Füllmenge. Unsere Gläser erfüllen demnach den Produktionsstandard. Der t-Wert ist in diesem Fall auch gleich Null.
Weicht der Zähler von Null ab, so heißt es, dass die tatsächlich gefüllte Menge von der erwarteten Menge (100ml) im Durchschnitt abweicht. Die Frage ist nun, wie stark diese Abweichung ist bzw. wie viel Abweichung zwischen der tatsächlichen und erwarteten Füllmenge wir pro Glas beobachten?
Um diese Frage zu beantworten, ziehen wie das Konzept der Varianz (s2) heran, die es zeigt, wie stark der gemessene Wert um den Mittelwert variiert. Da die Varianz jedoch sich auf alle Gläser bezieht und wir an der Abweichung pro Glas interessiert sind, müssen wir die Varianz durch die Anzahl von Gläsern (n) teilen.
Ist der Nenner (Varianz pro Glas) groß, sinkt die Teststatistik (t), da die Crememenge pro Glas stark zu variieren scheint. Ist die Varianz pro glas gering, so heißt es, dass die Crememenge pro Glas ziemlich stabil bleibt, die Teststatistik steigt demzufolge.
Als Daumenregel gilt es, dass die Abweichung von X̅ von µ0 dann als signifikant gilt, wenn der t-Wert über 2 ist. Das Vorzeichen ist dabei irrelevant.
Zuerst wird eine Stichprobe z.B. von 20 Gläsern Creme gezogen. Wir messen die Füllmenge jedes dieser Gläsern und bekommen so den Basis-Datensatz, der uns die Ausgangswerte für den t-Test liefert.
Tabelle 1: Füllmenge der Creme pro Glas
n | Füllmenge in ml | n | Füllmenge in ml | |
1 | 98 | 11 | 92 | |
2 | 101 | 12 | 100 | |
3 | 95 | 13 | 98 | |
4 | 92 | 14 | 100 | |
5 | 106 | 15 | 101 | |
6 | 99 | 16 | 96 | |
7 | 96 | 17 | 93 | |
8 | 101 | 18 | 88 | |
9 | 102 | 19 | 95 | |
10 | 98 | 20 | 102 |
Auf Grundlage dieser Werte kann nun der Mittelwert bestimmt werden. Dafür werden alle Füllmengen zusammenaddiert und anschließend durch die Anzahl der Gläser geteilt.
Summe der Füllmengen: 98 + 101 + 95 + ….. + 88 + 95 + 102 = 1.953
Mittelwert der Füllmengen: 1.953 / 20 = 97,65
Wenn man nun pro Glas die jeweiligen gemessenen Füllmengen von dem soeben ermittelten Mittelwert subtrahiert, bestimmt man die Abweichungen der Füllmenge Creme pro Glas von dem Mittelwert.
Dies bietet dann eine Grundlage für die Standardabweichung, die wir im weiteren Verlauf benötigen.
I X̅ – X I => 1: I 97,65 – 98 I = 0,35
Diese Rechenweise soll auf jeden Wert in der Tabelle angewendet werden.
Tabelle 2: Abweichungen vom Mittelwert
1 | 0,35 | 11 | 5,65 | |
2 | 3,35 | 12 | 2,35 | |
3 | 2,65 | 13 | 0,35 | |
4 | 5,65 | 14 | 2,35 | |
5 | 8,35 | 15 | 3,35 | |
6 | 1,35 | 16 | 1,65 | |
7 | 1,65 | 17 | 4,65 | |
8 | 3,35 | 18 | 9,65 | |
9 | 4,35 | 19 | 2,65 | |
10 | 0,35 | 20 | 4,35 |
Mit diesen Werten lässt sich nun die Varianz bestimmen. Um die Varianz zu berechnen nimmt man die Abweichungen zum Quadrat und addiert anschließend alle Werte miteinander. Zum Schluss teilt man das Ergebnis noch durch die Anzahl (n) der Werte.
0,35² + 3,35² + … + 2,65² + 4,35² = 352,55
352,55 / 20 = 17,6275
Nun kann auch die Standardabweichung bestimmt werden.
Hierfür zieht man die Wurzel aus der Varianz.
S = √17,6275 = 4,1985
Nun benötigt man Werte die man bereits hat.
Zum einen den Mittelwert zum anderen die Standardabweichung. Außerdem benötigt man die Vergleichsgröße
μ0 von 100 Millilitern und die Stichprobengröße n=20.
Mit folgender Formel erhältst du den t-Wert, welcher die Prüfgröße der Teststatistik bestimmt.
Nun setzen wir unsere gegebenen Werte in die oben genannte Formel ein.
(97,65 – 100) / (4,1985 / √20 ) = -2,5032
Jetzt haben wir also den T-Wert bestimmt.
Nun musst du den T-Wert mit dem kritischen Wert vergleichen.
Der kritische Wert muss nicht berechnet werden, sondern kann einfach aus der t-Verteilung Tabelle entnommen werden.
Die Tabelle zeigt Werte, die die kritischen Werte darstellen.
Um herauszufinden was unser kritischer Wert ist muss man den Freiheitsgrad und das Signifikanzniveau kennen.
Den Freiheitsgrad bekommst du ganz einfach, wenn du deinen Stichprobenumfang (n) mit 1 subtrahierst.
In unserem Fall wäre der Freiheitsgrad dann also
20 – 1 = 19
Das Signifikanzniveau ist ein vorher festgelegter Wert, in unserem Fall können wir als Beispiel 5% nehmen. Das heißt, dass Alpha gleich 0,05 entspricht.
Um nun das Signifikanzniveau aus der Tabelle abzulesen, musst du Alpha von 1 abziehen.
Den kritischen Wert, den du nun abliest, findest du unter 19 ; 0,95.
Nehmen wir an der kritische Wert liegt bei 1,3208.
Der kritische Wert aus der Tabelle ist jedoch nur bei rechtsseitigen Tests direkt ablesbar.
Um auf den Wert für einen linksseitigen Test ( hier ist das der Fall ) zu kommen, musst du einfach den Kehrwert des abgelesenen kritischen Werts bilden.
In unserem Fall wäre das dann -1,3208.
Nun wird der T-Wert mit dem kritischen Wert verglichen.
T-Wert -2,5032 < kritischer Wert -1,3208
Wie deute ich das Ergebnis?
Das heißt nun für uns, dass unser Ergebnis im kritischen Bereich liegt und unsere Nullhypothese abgelehnt wird.
Gleichzeitig heißt das auch, dass die Hypothese angenommen wird und weitere Maßnahmen getroffen werden müssen.
Zweistichproben t-Test
Was ist das?
Der Zweistichproben t-Test zeigt