📊 Statistik & Wahrscheinlichkeit

Zufallsvariablen & Streuung

Diskrete Variablen, Erwartungswerte und Streuungsmaße.

(a) Diskrete Wahrscheinlichkeitsfunktion (pmf)

x

(b) Stetige Dichtefunktion (pdf)

x

Diskrete Zufallsvariablen

Definition: Erwartungswert & Durchschnitt

Der Erwartungswert E(X)E(X) für eine diskrete Zufallsvariable ist die Summe der einzelnen Ereigniswerte multipliziert mit der Wahrscheinlichkeit für das Eintreten dieses Ereignisses. Das ist dann der Durchschnittswert μ\mu.

Bei einer diskreten Zufallsvariablen XX können wir jedem Ergebnis xix_i eine exakte Wahrscheinlichkeit zuweisen. Diese Wahrscheinlichkeit wird als Punktwahrscheinlichkeit bezeichnet: Pr(X=xi)Pr(X = x_i).

Beispiel: Fairer Münzwurf

Kopf (1)
Zahl (0)
E[X]=(10.5)+(00.5)=0.5E[X] = (1 \cdot 0.5) + (0 \cdot 0.5) = 0.5

Beispiel: Fairer Würfel

1
2
3
4
5
6
E[X]=xi16=3.5E[X] = \sum x_i \cdot \frac{1}{6} = 3.5

Erkennungsmerkmale von Verteilungen

1. Text-Kontext

Definition im Begleittext (z.B. „Würfel”).

2. Wertebereich

Menge der Ergebnisse {xi}\{x_i\}.

3. Tilde-Notation

Kurzschrift XVerteilungX \sim \text{Verteilung}.

Standardabweichung (σ\sigma)

Was sagt $\sigma$ eigentlich aus?

Während μ\mu sagt, wo die „Mitte” ist, beschreibt σ\sigma die Streuung. In der KI ist σ\sigma oft ein Maß für Unsicherheit oder Vielfalt.

Kleines σ\sigma

Die Daten liegen alle sehr nah am Durchschnitt. Ein Modell ist sich hier sehr „sicher”, da die Ergebnisse einheitlich sind.

Großes σ\sigma

Die Daten sind weit verstreut. Es gibt große Unterschiede oder hohe Unsicherheit bei der Vorhersage.

Schritt 1: Der Kern

Abstand jedes Wertes XX vom Mittelwert μ\mu: (Xμ)(X - \mu)

Schritt 2: Die Quadrierung

Verhindert Aufhebung und gewichtet Ausreißer: ()2(\dots)^2

Schritt 3: Der Operator E[]E[\dots] (Summe)

σ=i=1k(xiμ)2Quadrat-AbstandPr(X=xi)Gewichtung\sigma = \sqrt{\sum_{i=1}^{k} \underbrace{(x_i - \mu)^2}_{\text{Quadrat-Abstand}} \cdot \underbrace{Pr(X = x_i)}_{\text{Gewichtung}}}

Schritt 4: Die Korrektur

Die Wurzel \sqrt{\dots} bringt uns zurück auf die ursprüngliche Einheit.

Die vollständige Definition

σ=i=1k(xiμ)2Pr(X=xi)\sigma = \sqrt{\sum_{i=1}^{k} (x_i - \mu)^2 \cdot Pr(X = x_i)}

Standardabweichung = Wurzel aus dem Erwartungswert der quadrierten Abweichungen.

Zusammenfassung der Formeln

Erwartungswert
E[X]=i=1kxiPr(X=xi)E[X] = \sum_{i=1}^{k} x_i \cdot Pr(X = x_i)

Der gewichtete Durchschnittswert aller Realisierungen.

Varianz
Var(X)=E[(XE[X])2]Var(X) = E[(X - E[X])^2]

Ein Maß für die Streuung um den Erwartungswert.