A12 | Künstliche neuronale Netze und Deep Learning

Nachdem du die drei Grundprinzipien des Lernens von KI (Überwacht, Unüberwacht, Bestärkend) kennengelernt hast , sehen wir uns jetzt ein Werkzeug an, das all diese Lernstrategien in die Tat umsetzt und eine wichtige Grundlage für moderne KI ist: künstliche neuronale Netze (engl. artificial neural networks).

Ein neuronales Netz ist eine Software-Architektur, die dem menschlichen Gehirn nachempfunden ist. Es besteht aus vielen miteinander verbundenen künstlichen Neuronen, die in Schichten angeordnet sind.

Analogie zwischen biologischen und künstlichen Neuronen

Quelle: https://www.heise.de/select/ct/2016/6/1458191210995647

Wie funktioniert ein einzelnes Neuron?

Ein Neuron ist der zentrale Baustein und funktioniert wie ein einfacher Entscheidungsfinder:

Eingaben und Gewichte (Inputs & Weights): Das Neuron erhält mehrere Eingaben (Zahlen) von den Neuronen der vorherigen Schicht. Jede Eingabe wird mit einem Gewicht (engl. weight) multipliziert. Gewichte sind Zahlen, die das Netz während des Trainings lernt. Sie bestimmen, wie wichtig eine bestimmte Eingabe für die Entscheidung ist.

Summe bilden: Alle gewichteten Eingaben werden addiert.

Aktivierung (Activation): Die Summe wird durch eine Aktivierungsfunktion geschickt. Diese Funktion entscheidet, ob das Neuron «feuert» (d.h. einen Wert weitergibt) oder nicht. Sie sorgt für die Nichtlinearität mit dem das Netz komplexe, nicht-geradlinige Muster lernen kann.

Ausgabe: Das Ergebnis wird als Eingabe an die Neuronen der nächsten Schicht weitergegeben.

Ein Neuron nimmt also gewichtete Signale auf, addiert sie und gibt nur dann ein Signal weiter, wenn die Summe einen bestimmten Schwellenwert überschreitet.

Die Schichten eines neuronalen Netzes

Das Netz teilt seine Arbeit in drei Hauptschichten auf:

1. Eingabeschicht (Input Layer): Hier werden die Daten eingespeist. Wenn das Netz zum Beispiel ein Bild oder einen Text analysiert, erhalten die Neuronen der Eingabeschicht deren vektorisierte und numerische Darstellung als Eingabe.

2. Versteckte Schichten (Hidden Layers): Hier findet die eigentliche Verarbeitung statt. Jedes Neuron in dieser Schicht erhält Informationen von den Neuronen der vorherigen Schicht, verarbeitet sie und leitet ein Ergebnis an die nächste Schicht weiter.

3. Ausgabeschicht (Output Layer): Diese Schicht liefert das Endergebnis oder die Vorhersage des Netzes.

Vereinfachte Darstellung eines künstlichen neuronalen Netzes

Quelle: https://www.heise.de/select/ct/2016/6/1458191210995647

Was ist Deep Learning?

Wenn ein neuronales Netz mehrere (typischerweise drei oder mehr) versteckte Schichten besitzt, spricht man von Deep Learning ( tiefes Lernen).

Der Vorteil tiefer Netze ist, dass jede Schicht abstraktere Merkmale der Eingabe lernen kann. Ein gutes Anwendungsbeispiel dafür ist die Bilderkennung: Die erste Schicht lernt vielleicht nur Kanten und Linien. Die zweite Schicht kombiniert diese zu Formen (Kreise, Ecken). Die dritte Schicht kombiniert die Formen zu Teilen (Augen, Ohren). Die letzte Schicht erkennt schliesslich das Gesamtobjekt (eine Katze oder ein Hund).

Deep Learning steckt in vielen Alltagsanwendungen: Gesichtserkennung, Foto-Sortierung, Sprachassistenten und Sprachmodelle wie ChatGPT. In all diesen Fällen lernen tiefe neuronale Netze schrittweise von einfachen bis hin zu komplexen Mustern.

Zurück

Weiter