Parameter vs. Hyperparameter
Interne Variablen vs. externe Konfiguration eines Modells.
Parameter lernt das Modell während des Trainings selbst. Hyperparameter legst du vorher fest — sie ändern sich während des Trainings nicht.
Parameter ()
Die Variablen, die das Modell während des Trainings selbst lernt — z.B. Gewichte und Biases.
Hyperparameter ()
Die Einstellungen, die wir vor dem Training festlegen — z.B. die Lernrate.
Parameter ()
Die Variablen, die durch Optimierung (z.B. Gradient Descent) angepasst werden. Mathematisch oft als zusammengefasst: .
| Modell | Parameter |
|---|---|
| Lineare Regression | Gewichte und Bias |
| Logistische Regression | Wie oben, plus Sigmoid-Ausgabe |
| Neuronales Netz | Alle Gewichte und Biases jeder Schicht |
| Decision Tree | Split-Punkte und Schwellenwerte |
Trainingsziel
Finde die Parameter , die den Loss auf den Trainingsdaten minimieren.
Hyperparameter
Die Stellschrauben außerhalb des Modells — sie steuern, wie gelernt wird. Du wählst sie per Experiment, Heuristik oder automatisierter Suche (Grid Search, Random Search, Bayesian Optimization).
| Hyperparameter | Symbol | Wirkung |
|---|---|---|
| Lernrate | Wie groß sind die Update-Schritte beim Gradient Descent? | |
| Anzahl Epochen | — | Wie oft sieht das Modell die kompletten Trainingsdaten? |
| Batch-Size | — | Wie viele Beispiele werden pro Update verarbeitet? |
| Regularisierung | Wie stark werden große Gewichte bestraft? | |
| Layer-Anzahl | — | Wie tief ist das neuronale Netz? |
Warum die Unterscheidung wichtig ist
Parameter werden vom Optimizer geschätzt — ohne Trainingsdaten kann das Modell sie nicht lernen.
Hyperparameter wählst du per Experiment oder automatisierter Suche — Grid Search, Random Search oder Bayesian Optimization.
Eine gute Hyperparameter-Wahl kann den Unterschied zwischen einem Modell ausmachen, das gar nicht lernt, und einem, das State-of-the-Art ist — selbst wenn die Architektur identisch ist.