Das Perzeptron
Die Urzelle des neuronalen Netzes — gewichtete Summe + Aktivierung = ein einfacher Klassifikator.
Das einfachste Neuron
Ein Perzeptron ist die mathematische Modellierung eines einzelnen Neurons — vorgestellt 1958 von Frank Rosenblatt. Es nimmt Inputs entgegen, gewichtet sie, summiert und entscheidet binär.
Vollständige Definition
Mit der Step-Funktion: falls , sonst .
Die drei Komponenten
Gewichtete Summe
Jeder Input bekommt ein Gewicht , das seine Wichtigkeit ausdrückt. Plus ein Bias :
Aktivierung
Die Step-Funktion war die ursprüngliche Wahl, ist aber nicht differenzierbar. Heute nimmt man Sigmoid, ReLU oder Tanh — siehe nächste Sektion.
Lern-Update
Bei einem Fehler werden die Gewichte angepasst:
mit als Lernrate.
Was kann ein einzelnes Perzeptron?
Es kann linear separierbare Probleme lösen — z.B. das logische AND oder OR:
Linear separierbar
Funktioniert, weil die Eins-Ausgabe (1,1) sauber durch eine Gerade von den drei Null-Ausgaben getrennt werden kann.
Nicht linear separierbar
Ein einzelnes Perzeptron kann XOR nicht lernen — keine einzelne Gerade trennt die positiven von den negativen Beispielen. Dafür braucht es mindestens ein Hidden Layer — das ist der Übergang zum Multi-Layer-Perceptron (MLP), der Geburt von Deep Learning.
Diese Erkenntnis von Minsky & Papert (1969) hat das ganze Feld für 15 Jahre lahmgelegt — bis Backpropagation (1986) den Weg für mehrschichtige Netze frei machte.