Das Perzeptron


Das Perzeptron ist eine sehr frühe Netzsorte, die auf Rosenblatt zurückgeht. Das Photoperzeptron hat drei Schichten : Die binären Ausgaben der Retina (die Eingabeschicht) werden über Verbindungen mit konstanten Gewichten zur Assoziationsschicht geleitet. So kann die Eingabe durch den Netzwerkdesigner strukturiert werden. Die Verbindungen zwischen Assoziationsschicht und Ausgabeschicht werden in der Lernphase justiert. In der Trainingsphase werden dem Netz die zu lernenden Beispiele gezeigt und die Gewichte entsprechend der Lernregel geändert.Wenn das Lernen beendet ist, sollten die Trainingsbeispiele korrekte Ergebnisse liefern. Es besteht die Hoffnung, daß auch ähnliche Eingaben korrekt eingeordnet werden. Das Perzeptron arbeitet mit einer einfachen Schwellwertfunktion. Es gilt :
Arbeitsweise des Perzeptrons
Das Perzeptron-Lernverfahren
Die Lernformel
Dies ist also eine Art Delta-Regel, wenn man die Assoziationsschicht ignoriert. Dies ist auch möglich, da die Gewichte von der Eingabeschicht zur Assoziationsschicht konstant sind, d.h. nicht verändert werden und demnach die Ausgabe der Assoziationsschicht eindeutig durch die Eingabe bestimmt ist.
Das Perzeptron-Konvergenz-Theorem
Durch das Perzeptron können in endlicher zeit alle Probleme gelöst werden und jetzt kommts : die grundsätzlich durch das Perzeptron gelöst werden können. Dies klingt zwar sehr schön, jedoch ist der Anteil der Funktionen, die grundsätzlich mit dem Perzeptron gelöst werden können nicht sehr groß.
Die Berechnung zweistelliger boole'scher Funktionen :
Die AND-Funktion kann durch ein Perzeptron dargestellt werden :
Wähle z.B. als Eingangsgewichte jeweils 0,7 und als Schwellwert 1.

Die XOR-Funktion kann nicht durch ein einfaches Perzeptron dargestellt werden :
betrachtet man sämtliche Eingabe, so kann man eine Reihe von Ungleichungen aufstellen, die gelten müssen, damit das Perzeptron diese Funktion berechnet. Allerdings ist dieses Ungleichungssystem widerprüchlich :
die Ungleichungen
Das Relationszeichen ergibt sich jeweils aus der gewünschten Ausgabe. Da die Summe zweier positiver Zahlen nicht kleiner sein kann als die einzelnen Summanden, ergibt sich ein Widerspruch.

Funktionen, die mittels eines einfachen Perzeptrons berechnet werden können heißen linear separierbar. (Die Klassen können durch eine Gerade getrennt werden )