Das Perzeptron
Das Perzeptron ist eine sehr frühe Netzsorte, die auf Rosenblatt zurückgeht. Das
Photoperzeptron hat drei Schichten :
- Retina
- Assoziationsschicht
- Ausgabeschicht
Die binären Ausgaben der Retina (die Eingabeschicht) werden über Verbindungen mit
konstanten Gewichten zur Assoziationsschicht geleitet. So kann die Eingabe durch den
Netzwerkdesigner strukturiert werden. Die Verbindungen zwischen Assoziationsschicht
und Ausgabeschicht werden in der Lernphase justiert. In der Trainingsphase werden
dem Netz die zu lernenden Beispiele gezeigt und die Gewichte entsprechend der
Lernregel geändert.Wenn das Lernen beendet ist, sollten die Trainingsbeispiele
korrekte Ergebnisse liefern. Es besteht die Hoffnung, daß auch ähnliche Eingaben korrekt eingeordnet werden. Das Perzeptron arbeitet mit einer einfachen Schwellwertfunktion. Es gilt :
Das Perzeptron-Lernverfahren
Dies ist also eine Art Delta-Regel, wenn man die Assoziationsschicht ignoriert.
Dies ist auch möglich, da die Gewichte von der Eingabeschicht zur Assoziationsschicht konstant sind, d.h. nicht verändert werden und demnach die Ausgabe der Assoziationsschicht eindeutig durch die Eingabe bestimmt ist.
Das Perzeptron-Konvergenz-Theorem
Durch das Perzeptron können in endlicher zeit alle Probleme gelöst werden und jetzt kommts :
die grundsätzlich durch das Perzeptron gelöst werden können. Dies klingt zwar sehr schön, jedoch ist der Anteil der Funktionen, die grundsätzlich mit dem Perzeptron gelöst werden können nicht sehr groß.
Die Berechnung zweistelliger boole'scher Funktionen :
Die AND-Funktion kann durch ein Perzeptron dargestellt werden :
Wähle z.B. als Eingangsgewichte jeweils 0,7 und als Schwellwert 1.
Die XOR-Funktion kann nicht durch ein einfaches Perzeptron dargestellt werden :
betrachtet man sämtliche Eingabe, so kann man eine Reihe von Ungleichungen aufstellen, die
gelten müssen, damit das Perzeptron diese Funktion berechnet. Allerdings ist dieses
Ungleichungssystem widerprüchlich :
Das Relationszeichen ergibt sich jeweils aus der gewünschten Ausgabe. Da die Summe
zweier positiver Zahlen nicht kleiner sein kann als die einzelnen Summanden, ergibt sich ein Widerspruch.
Funktionen, die mittels eines einfachen Perzeptrons berechnet werden können heißen
linear separierbar. (Die Klassen können durch eine Gerade getrennt werden )