Verallgemeinertes Skalarprodukt
Wie eine symmetrisch positiv definite Matrix A jedes Standard-Skalarprodukt zu einer ganzen Familie gültiger Skalarprodukte erweitert.
Allgemeine Form des Skalarprodukts
Ein Skalarprodukt auf dem lässt sich über eine symmetrisch positiv definite Matrix definieren:
Die verallgemeinerte Definition
Das Standard-Skalarprodukt (Punktprodukt) ist der Spezialfall (Einheitsmatrix): . Gleichung 3.19 wählt ein konkretes und liefert damit ein anderes, ebenso gültiges Skalarprodukt.
Gleichung 3.19 — das konkrete Beispiel
Die Matrix lautet:
Eingesetzt in ergibt sich die rechte Seite von 3.19:
Der Unterschied zum Punktprodukt ist der Mischterm . Die Matrix ist symmetrisch und positiv definit (Eigenwerte und ) — daher ist dies ein gültiges Skalarprodukt.
Schritt für Schritt: x⊤ A y
Dank der Assoziativität der Matrixmultiplikation gilt . Man kann die Klammern frei setzen — die Faktoren bleiben in ihrer Reihenfolge.
Schritt 1 — (Zeile × Matrix)
ist ein Zeilenvektor (), eine -Matrix. Das Ergebnis ist wieder ein Zeilenvektor ():
Schritt 2 — (Matrix × Spalte)
ist , ein Spaltenvektor (). Das Ergebnis ist wieder ein Spaltenvektor ():
Schritt 3 — finales Skalarprodukt
Der Zeilenvektor aus Schritt 1 wird mit dem Spaltenvektor aus Schritt 2 multipliziert. Das Ergebnis ist ein Skalar:
Dimensionen auf einen Blick
| Ausdruck | Format | Ergebnis |
|---|---|---|
| (Zeile) | – | |
| (Matrix) | – | |
| (Spalte) | – | |
| (Zeile) | ||
| (Skalar) | ||
| (Spalte) | ||
| (Skalar) |
Gleichung 3.20 — konkretes Zahlenbeispiel
Wir setzen den konkreten Vektor ein und vergleichen seine Länge unter beiden Skalarprodukten. Der einzige Unterschied ist der Mischterm aus 3.19.
Norm unter dem neuen Skalarprodukt (3.19)
Derselbe Vektor misst unter 3.19 die Länge statt — er ist also kürzer. Der Mischterm zählt hier und zieht das Quadrat der Norm von auf herunter.
Warum ist er kürzer?
Für setzt man :
Der Mischterm entscheidet, ob die Norm gegenüber dem Standard wächst oder schrumpft:
| Fall | Mischterm | Norm vs. Standard |
|---|---|---|
| (gleiches Vorzeichen) | wird subtrahiert | kleiner (kürzer) |
| (verschiedene Vorzeichen) | wird addiert | größer (länger) |
Schlüsselbegriffe
Die wichtigsten Begriffe
— die Klammerung ist frei wählbar, die Reihenfolge der Faktoren bleibt erhalten.
Gilt für Matrizen nicht: im Allgemeinen.
und sind per Konvention Spalten (). macht daraus eine Zeile ().
für alle — die Voraussetzung für ein gültiges Skalarprodukt.
Quelle: Deisenroth, Faisal & Ong — Mathematics for Machine Learning, Cambridge University Press 2020, Kapitel 3 (mml-book.com).