Künstliche Neuronale Netze und Deep Learning

Nachdem du die drei Grundprinzipien des Lernens von KI (Überwacht, Unüberwacht, Bestärkend) kennengelernt hast , sehen wir uns jetzt ein Werkzeug an, das all diese Lernstrategien in die Tat umsetzt und eine wichtige Grundlage für moderne KI ist: künstliche neuronale Netze (engl. artificial neural networks).

Ein Neuronales Netz ist eine Software-Architektur, die grob dem menschlichen Gehirn nachempfunden ist. Es besteht aus vielen miteinander verbundenen künstlichen Neuronen, die in Schichten angeordnet sind.

Analogie zwischen biologischen und künstlichen Neuronen

Quelle: https://www.heise.de/select/ct/2016/6/1458191210995647

Wie funktioniert ein einzelnes Neuron?

Ein Neuron ist der zentrale Baustein und funktioniert wie ein einfacher Entscheidungsfinder:

Eingaben und Gewichte (Inputs & Weights): Das Neuron erhält mehrere Eingaben (Zahlen) von den Neuronen der vorherigen Schicht. Jede Eingabe wird mit einem Gewicht (engl. weight) multipliziert. Gewichte sind Zahlen, die das Netz während des Trainings lernt. Sie bestimmen, wie wichtig eine bestimmte Eingabe für die Entscheidung ist.

Summe bilden: Alle gewichteten Eingaben werden addiert.

Aktivierung (Activation): Die Summe wird durch eine Aktivierungsfunktion geschickt. Diese Funktion entscheidet, ob das Neuron «feuert» (d.h. einen Wert weitergibt) oder nicht. Sie sorgt für die Nichtlinearität mit dem das Netz komplexe, nicht-geradlinige Muster lernen kann.

Ausgabe: Das Ergebnis wird als Eingabe an die Neuronen der nächsten Schicht weitergegeben.

Ein Neuron nimmt also gewichtete Signale auf, addiert sie und gibt nur dann ein Signal weiter, wenn die Summe einen bestimmten Schwellenwert überschreitet.

Die Schichten eines Neuronalen Netzes

Das Netz teilt seine Arbeit in drei Hauptschichten auf:

1. Eingabeschicht (Input Layer): Hier werden die Daten eingespeist. Wenn das Netz zum Beispiel ein Bild oder einen Text analysiert, erhalten die Neuronen der Eingabeschicht deren vektorisierte und numerische Darstellung als Eingabe.

2. Versteckte Schichten (Hidden Layers): Hier findet die eigentliche Verarbeitung statt. Jedes Neuron in dieser Schicht erhält Informationen von den Neuronen der vorherigen Schicht, verarbeitet sie und leitet ein Ergebnis an die nächste Schicht weiter.

3. Ausgabeschicht (Output Layer): Diese Schicht liefert das Endergebnis oder die Vorhersage des Netzes.

Vereinfachte Darstellung eines künstlichen neuronalen Netzes

Quelle: https://www.heise.de/select/ct/2016/6/1458191210995647

Was ist Deep Learning?

Wenn ein Neuronales Netz mehrere (typischerweise drei oder mehr) Versteckte Schichten besitzt, spricht man von Deep Learning (Tiefes Lernen).

Der Vorteil tiefer Netze ist, dass jede Schicht abstraktere Merkmale der Eingabe lernen kann. Ein gutes Anwendungsbeispiel dafür ist die Bilderkennung: Die erste Schicht lernt vielleicht nur Kanten und Linien. Die zweite Schicht kombiniert diese zu Formen (Kreise, Ecken). Die dritte Schicht kombiniert die Formen zu Teilen (Augen, Ohren). Die letzte Schicht erkennt schliesslich das Gesamtobjekt (eine Katze oder ein Hund).

Deep Learning steckt in vielen Alltagsanwendungen: Gesichtserkennung, Foto-Sortierung, Sprachassistenten und Sprachmodelle wie ChatGPT. In all diesen Fällen lernen tiefe neuronale Netze schrittweise von einfachen bis hin zu komplexen Mustern.

Aktivität: Visualisieren von Deep Learning Modellen

Im Folgenden schauen wir uns die Funktionsweise eines Deep Learning Modells mal im Detail an. Dazu betrachten wir eine Architektur die besonders in der Bilderkennung beliebt ist: das Convolutional Neural Network (kurz CNN).

Gehe auf https://poloclub.github.io/cnn-explainer/
Wähle eines der Bilder in der oberen Leiste aus
Das Tool visualisiert dir wie die Inputs (die drei Farbkanäle des ausgewählten Bildes) über mehrere Schichten verarbeitet werden und so an der Ausgabeschicht eine Vorhersage getroffen wird was auf dem Bild ist.
Wenn du die verschiedenen Schichten anklickst, kannst du die mathematischen Operationen sehen welche durchgeführt werden.
Klicke dich durch die verschiedenen Schichten und versuche nachzuvollziehen, wie das Netz funktioniert und wie die oben erklärten Konzepte umgesetzt wurden.
Wenn du im Tool runterscrollst, findest du auch eine detaillierte Erklärung auf Englisch.
Versuche dann die untenstehenden Reflexionsfragen zu beantworten.

Reflexionsfragen

Was macht der Filter mit dem Bild (vereinfacht gesagt)?

Der Filter bewegt sich über das Bild und berechnet für jeden Bildbereich neue Werte. Dabei verstärkt er bestimmte Muster (z. B. Kanten) und schwächt andere Informationen ab. So entsteht ein neues Bild, das nur ausgewählte Merkmale hervorhebt.

Kurz gesagt: Der Filter sucht gezielt nach bestimmten Strukturen.

Welche Art von Merkmal erkennt das Netz besonders gut?

Je nach Filter zum Beispiel:

Strukturen in einer bestimmten Richtung
horizontale oder vertikale Kanten
Kontraste zwischen hell und dunkel
Linien oder Übergänge

Warum sind solche einfachen Merkmale für ein neuronales Netz hilfreich?

Komplexe Objekte bestehen aus vielen einfachen Strukturen. Wenn ein Netz zuerst einfache Muster erkennt, kann es diese später zu Formen, Teilen und ganzen Objekten kombinieren. Dadurch wird Lernen schrittweise aufgebaut.

Warum braucht ein Deep-Learning-Modell viele Schichten, um Objekte zu erkennen?

Jede Schicht erkennt ein höheres Abstraktionsniveau:

frühe Schichten → einfache Merkmale (Kanten, Linien)
mittlere Schichten → Formen oder Objektteile
späte Schichten → ganze Objekte

Komplexe Erkennung entsteht schrittweise über mehrere Ebenen.

Zurück

Weiter