t-Verteilung | Student’s t-Verteilung | MatheGuru.com (2024)

t-Verteilung | Student’s t-Verteilung | MatheGuru.com (1)Wenndie Standardabweichungσ der Grundgesamtheit unbekannt ist, benutzt man die t-Verteilung (anstatt der Normalverteilung), vorausgesetzt die nötigen Bedingungen sind erfüllt. Daσ unter reellen Bedingungen meistens nicht bekannt ist, sind die Informationen in diesem Artikel realitätsnah, da sie häufig genau so angewendet werden.

Die t-Verteilung ist die unterliegende Verteilungsfunktion des t-Tests.

Definition

Formell gesehen ist die t-Verteilung wie folgt definiert:

\( \large{ f(t) = \frac{\Gamma\!\left(\frac{\nu+1}{2}\right)} {\sqrt{\nu\pi}\cdot\Gamma\!\left(\frac{\nu}{2}\right)} \left(1+\frac{t^2}{\nu} \right)^{\displaystyle -\tfrac{\nu+1}{2}} } \)

Der einzige Parameter, den die t-Verteilung benötigt, ist v, die Freiheitsgrade.

Γ ist die Gammafunktion, welche eine Erweiterung der Fakultätsfunktion ist. Die Gammafunktion benötigt einen einzigen Parameter n und ist für natürlichen Zahlen wie folgt definiert: \( \Gamma(n) = (n-1)! \). Die Gammafunktion ist allerdings für alle positiven reellen Zahlen (außer 0) definiert: \( \Gamma(n) = \int_0^\infty x^{n-1} e^{-x}\,{\rm d}x \).

Reel betrachtet, müssen diese Definitionen allerdings nicht auswendig gelernt werden, da meistens Tabellenkalkulationsprogramme und andere statistische Software die Berechnungen im Hintergrund durchführen. Im weiteren Verlauf dieses Artikels werden wir uns nur noch mit den Eigenschaften der t-Verteilung beschäftigen, mit dessen Gleichung.

Kriterien für die Benutzung der t-Verteilung

Allgemein existieren drei Kriterien, die erfüllt sein müssen, damit die t-Verteilung zur Berechnung verwendet werden kann:

  • Die Standardabweichung und damit auch die Varianz der Grundgesamtheit sind nicht bekannt
  • Die Stichprobe muss zufällig entnommen sein
  • Die Grundgesamtheit der Daten, aus der die Stichprobe entnommen wurde, muss normalverteiltoder annähernd normalverteilt sein oderdieStichprobe muss mindestens 30 Messwerte umfassen

Allerdings ist eine Stichprobengröße von mehr als 30 kein absolutes Kriterium. Ist die unterliegende Verteilungsfunktion der Grundgesamtheit quasi normalverteilt, alsonur wenig von einer Normalverteilung entfernt, können auch Stichproben kleiner als 30 mit der t-Verteilung gerechnet werden.

Eigenschaften der t-Verteilung

EigenschaftWert
Parameter

\( v > 0 \;\;\text{Freiheitsgrade} \)

Wertebereich

\( x \in \left ( -\infty; \infty \right ) \)

Dichtefunktion

\( \frac{\Gamma\!\left(\frac{\nu+1}{2}\right)} {\sqrt{\nu\pi}\cdot\Gamma\!\left(\frac{\nu}{2}\right)} \left(1+\frac{t^2}{\nu} \right)^{\displaystyle -\tfrac{\nu+1}{2}} \)

Verteilungsfunktion

\( \begin{align}\int_{-\infty}^t f(x)\,\mathrm{d}x &=\tfrac{1}{2} + t\cdot \frac{\Gamma \left( \tfrac{1}{2}(\nu+1) \right)} {\sqrt{\pi\nu}\cdot \Gamma \left(\tfrac{\nu}{2}\right)} \cdot \\ & {\,}_2F_1 \left ( \tfrac{1}{2},\tfrac{1}{2}(\nu+1); \tfrac{3}{2}; -\tfrac{t^2}{\nu} \right)\end{align} \)

Mittelwert0, wenn v > 0, sonst nicht definiert
Median0
Modus0
Varianz

\( \frac{v}{v-2} \)

wenn v > 4,
∞ wenn 2 < v≤ 4,
ansonsten nicht definiert
Schiefe0, wenn v > 3, sonst nicht definiert

Um die t-Verteilung verwenden zu können, muss die Stichprobe zufällig sein und die Verteilungsfunktion der Grundgesamtheit normalverteilt bzw. annähernd normalverteilt sein, oder die Stichprobe muss mehr als 30 Datensätze umfassen.

Die folgenden Eigenschaften hat die t-Verteilung gemein mit der Standardnormalverteilung:

  • GlockenförmigesAussehen
  • Symmetrisch (um 0)
  • Der Median, Modus und Mittelwert sind 0 und befinden sich nahe des Zentrums der Verteilungsfunktion
  • Die Verteilungsfunktion konvergiert gegen 0, allerdings wird kein Wert von f(x) jemals 0
  • Die Fläche unter der Kurve ist immer 1

Folgende Eigenschaften unterscheiden die t-Verteilung von der Standardnormalverteilung:

  • Je größer der Parameter v wird, desto mehr nähert sich die t-Verteilung der Standardnormalverteilung, daher der Normalverteilung mit einem Erwartungswert von 0 und einer Standardabweichung von 1
  • Die Varianz ist größer als 1
  • Die t-Verteilung gehört zu einer Gruppe von Verteilungsfunktionen, welche Freiheitsgrade als Parameter verwenden. Die Freiheitsgrade beziehen sich dabei auf die Größe der Stichprobe.
  • Sie ist endlastiger (heavy-tailed) als die Normalverteilung. Das heißt, dass sie eher Werte hervorbringen wird, die weiter vom Mittelwert entfernt liegen.

Freiheitsgrade (Degrees of Freedom)

Viele statistische Verfahren verwenden ein Konzept namens Freiheitsgrade (englisch: degrees of freedom, DF). Jede Verteilungsfunktion hat eine andere Methode, um die Anzahl der Freiheitsgrade zu berechnen. Man kann sich die Freiheitsgrade als Anzahl an Möglichkeiten vorstellen, um von A nach B zu kommen.

Nehmen wir beispielsweise an, dass das arithmetische Mittel von drei Zahlen 10 ist. Wir wissen die Zahlen sind 5, 11 und eine weitere unbekannte Zahl. Um die unbekannte Zahl zu bestimmen, können wir einfach die folgende Gleichung lösen: \( \frac{5+11+x}{3} = 30 \). Auch wenn wir gesagt haben, dass die Zahl unbekannt sei, können wir sie mit bereits mit wenig Algebra berechnen (x = 14).

In einem zweiten Datensatz haben wir nun wieder drei Zahlen. Wir wissen, dass der Mittelwert 20 ist und dass eine der Zahlen 25 ist. Die anderen beiden Zahlen —wir nennen sie x und y —kennen wir nicht. Aus der Gleichung\( \frac{25+x+y}{3} = 20 \) können wir berechnen, dass x = 35 − y sein muss. Wir können allerdings keinen konkreten Wert für x berechnen, sondern nur einen Wert in Abhängigkeit einer anderen Variablen. Wir haben daher einen Freiheitsgrad.

In einer weiteren Stichprobe mit 1000 Messwerten wissen wir nun, dass der Mittelwert 15 ist. Wenn wir das wissen, allerdings nicht die konkreten Messwerte kennen, haben wir n − 1, also 999 Freiheitsgrade. Die Summe aller Messwerte muss 1000 · 15 = 15000 betragen. Wenn wir 999 Messwerte haben, ist der letzte fehlende Messwert bereits bestimmt, da es nur eine einzige Zahl gibt, die noch zu den anderen addiert 15000 ergibt.

Anwendungsbereiche

Die t-Verteilung wird dort eingesetzt, wo ein unbekannter Parameter (wie beispielsweise der Mittelwert) geschätzt werden soll, in einer Situation, in der die Beobachtungen durch additive Fehler konfundiert sind. (Additive Fehler sind Werte die zu dem eigentlichen Wert hinzuaddiert worden sind. Die Summe aus tatsächlichem Wert und Fehlerwert ergibt den Messwert. Das Modell der additiven Fehler ist das beliebteste in der Statistik.) In fast allen statistischen Untersuchungen ist die Standardabweichung der Grundgesamtheit dieser Fehler unbekannt und muss aus den Daten geschätzt werden. Die t-Verteilung wird dabei häufig verwendet, um diese Fehler zu kompensieren. Wäre allerdings die Standardabweichung der Fehler bekannt, so würde in der Regel die Normalverteilung statt der t-Verteilung verwendet werden.

Geschichte der t-Verteilung

t-Verteilung | Student’s t-Verteilung | MatheGuru.com (2)Die t-Verteilung wurde von William S. Gosset entdeckt. Er machte 1899 an der prestigereichen Oxford Universität Abschlüsse in den Fächern Mathematik und Chemie. Im gleichen Jahr wollte die Guinness Brauerei in Dublin, Irland zum ersten Mal in ihrer Geschichte das Bierbrauen wissenschaftlich untersuchen. Sie schrieben Stellen aus, und Gosset bekam eine Arbeitsstelle. In den kommenden Jahren beschäftigte sich Gosset mit Hopfen, Malz und Gerste.

Guinness wollte Bier konstant in einer hohen Qualität herstellen. Wissenschaftler wie Gosset sollten herausfinden, wie man die Qualität des Bieres dauerhaft erhöhen kann. Von besonderem Interesse war dabei die Ursache schlechter Chargen. Gosset untersuchte hauptsächlich den Einfluss der Gerste in diesem Prozess. Während ein Vollblutwissenschaftler Experimente durchführen würde, wollte ein wirtschaftlich orientiertes Unternehmen wie eine Brauerei kein Geld für großangelegte Forschung ausgeben, vor allem nicht solche, wo im Vorhinein schon feststehen würde, dass man das Bier wegschütten müsste. Gosset musste also aus nur wenigen Informationen und wenigen Experimenten statistisch herleiten, weshalb beispielsweise eine Sorte Gerste schlechtes Bier produziert.

Gosset war der Aufgabe allerdings gewachsen, auch wenn er von seinen Kollegen nur wenig Achtung bekam. Die anderen Mitarbeiter der Brauerei hielten ihn mehr für einen Professor der Mathematik als für einen echten Bierbrauer, während seine Kollegen im biometrischen Labor des University College London ihn mehr für einen Bierbrauer als für einen Wissenschaftler hielten.

Aus der Notwendigkeit nur mit kleinen Stichproben und einer unbekannten Grundgesamtheit zu arbeiten entwickelte Gosset die t-Verteilung und den t-Test— ein elegant einfaches Verfahren, im Vergleich zu anderen statistischen Methoden der damaligen Zeit. Allerdings erlaubte die Guinness Brauerei ihren Mitarbeitern nicht, Forschungsergebnisse zu publizieren, da ein Mitarbeiter bereits Firmengeheimnisse veröffentlicht hatte.

Noch heute wird die t-Verteilung meistens „Student’s t“ genannt(vor allem im englischsprachigen Raum), da Gosset seine Entdeckung unter dem Pseudonym Student dennoch veröffentlichte. Nur wenige seiner Kollegen wussten tatsächlich, wer „Student“ war. Erst mit seinem Tod erfuhr die Brauerei das Geheimnis um Gossets anonyme Publikation, und das auch nur, weil seine Kollegen ihn und seine Arbeit würdigen wollten.

t-Verteilung interaktiv

Neben der gängigen t-Verteilung, existiert noch eine weitere Verteilungsfunktion, die auf der Definition der t-Verteilung basiert. Sie hat einen weiteren Parameter, den Nonzentralitätsparamter. Er verschiebt die t-Verteilung nach rechts, verändert aber auch deren Form. Die t-Verteilung ist identisch mit dernichtzentralen t-Verteilung, wenn der Nonzentralitätsparameter Null ist. Die nichtzentrale t-Verteilung wird vor allem zur Berechnung desβ-Fehlers (Fehler 2. Art) bei t-verteilten Hypothesentests verwendet.{tVerteilung}

Rechnung für die t-Verteilung

{tRechner}

t-Verteilung | Student’s t-Verteilung | MatheGuru.com (2024)

References

Top Articles
Latest Posts
Article information

Author: Zonia Mosciski DO

Last Updated:

Views: 5917

Rating: 4 / 5 (71 voted)

Reviews: 86% of readers found this page helpful

Author information

Name: Zonia Mosciski DO

Birthday: 1996-05-16

Address: Suite 228 919 Deana Ford, Lake Meridithberg, NE 60017-4257

Phone: +2613987384138

Job: Chief Retail Officer

Hobby: Tai chi, Dowsing, Poi, Letterboxing, Watching movies, Video gaming, Singing

Introduction: My name is Zonia Mosciski DO, I am a enchanting, joyous, lovely, successful, hilarious, tender, outstanding person who loves writing and wants to share my knowledge and understanding with you.