Grundlagen & Kernideen
Was ein neuronales Netz vom klassischen Algorithmus unterscheidet — und woher die Idee kommt.
Biologische Analogie
Künstliche neuronale Netze sind lose vom biologischen Neuron inspiriert. Auch wenn die Analogie auf Hardware-Ebene irreführend ist, hilft sie beim Verständnis der Grundstruktur:
Dendriten
Verzweigte Ausläufer, die elektrische Signale von anderen Neuronen aufnehmen — das Pendant zu den Inputs eines künstlichen Neurons.
Soma
Der Zellkern, der die eingehenden Signale aufsummiert und entscheidet, ob das Neuron „feuert” — die gewichtete Summe + Aktivierung.
Axon
Die lange Faser, die das Signal an die nächste Zelle weitergibt — der Output, der zum Input des nächsten Layers wird.
Repräsentationslernen
Die wahre Kraft tiefer Netze ist nicht die Approximation einer komplizierten Funktion — das könnten auch klassische Algorithmen. Es ist das Lernen von Repräsentationen: jede Schicht baut auf der vorigen auf und extrahiert komplexere Merkmale.
Niedrige Features
Bei Bildern: Kanten, Farbverläufe, einfache Texturen. Sehr lokale, allgemeine Merkmale, die jeder Datensatz teilt.
Hohe Features
Augen, Räder, Buchstabenformen — schließlich ganze Konzepte wie „Gesicht” oder „Hund”. Aufgaben-spezifisch, abstrakter.
Klassische ML: Du designst Features per Hand (z.B. HOG, SIFT für Bilder). Deep Learning: Das Netz findet die nützlichen Features selbst — vorausgesetzt, du hast genug Daten und Rechenleistung.
Schicht-Architektur
Ein neuronales Netz ist eine Verkettung von Schichten. Jede Schicht ist eine Sammlung von Neuronen, die parallel auf denselben Input zugreifen.
Input-Layer
Nimmt die Rohdaten entgegen (z.B. Pixelwerte, Wort-Embeddings). Keine Berechnung, nur Durchreichen.
Hidden Layers
Die eigentliche Verarbeitung. Anzahl und Größe sind Hyperparameter. Je tiefer, desto abstraktere Repräsentationen.
Output-Layer
Produziert die Vorhersage. Form hängt von der Aufgabe ab — eine Zahl bei Regression, Wahrscheinlichkeiten bei Klassifikation.