Intelligenz kann allgemein als die Fähigkeit eines Individuums oder eines Systems verstanden werden, Informationen zu erfassen, zu verarbeiten und daraus zu lernen, Probleme zu lösen, Wissen zielgerichtet anzuwenden, Entscheidungen zu treffen sowie sich an neue und veränderte Situationen anzupassen (Jäncke, 2023).
Bei Anwendung dieses Intelligenzverständnisses auf ChatGPT, das wohl bekannteste Large Language Model (LLM), kann dieses gemäss der Definition als «intelligent» eingestuft werden.
Dennoch bestehen zwischen menschlicher und künstlicher Intelligenz grundlegende Unterschiede. Künstliche Intelligenz ist stets auf jene Aufgaben- und Wissensbereiche beschränkt, für die sie mit entsprechenden Daten trainiert wurde, während menschliche Intelligenz deutlich flexibler, kontextsensitiver und erfahrungsbasiert ist. Darüber hinaus unterscheiden sich die zugrunde liegenden Lernprozesse: Menschliches Lernen erfolgt durch Wahrnehmung, Erfahrung und bewusste Reflexion, während künstliches Lernen primär auf statistischen Mustern und algorithmischer Optimierung beruht.
In der nachfolgenden Tabelle werden zentrale Merkmale menschlicher und künstlicher Intelligenz vergleichend zusammengefasst.
| Merkmal | Künstliche Intelligenz | Menschliches Lernen |
| Grafische Darstellung | ||
| Ursprung | Künstliches Netzwerk von Wahrscheinlichkeitsknoten | Biologische neuronale Netzwerke |
| Energieverbrauch | Hoher Energieverbrauch, Viele GPUs | Extrem Energieeffizient (20W) |
| Lernprozess | Lernt durch Training mit grossen Datenmengen und statistischer Mustererkennung | Extrem Lerneffizient: Lernt durch Erfahrung, Wahrnehmung, Emotionen und soziale Interaktion |
| Wissensaneigung | Diskretes Lernen: Verarbeitung von Daten auf Anweisung | Kontinuierliches Lernen |
| Verständnis | Kein echtes Verständnis, sondern probabilistische Sprachverarbeitung | Tiefes semantisches und kontextuelles Verständnis |
| Kreativität | Kombinatorisch, basiert auf vorhandenen Datenmustern | Eigenständig, bewusst und erfahrungsbasiert |
| Fehlerverhalten | Kann aus Fehlern reflektiert lernen | Fehlerkorrektur nur indirekt über Nachtraining oder Nutzerfeedback |
KI-Begriffe im Venn-Diagramm
In der Auseinandersetzung mit KI fallen häufig Begriffe, welche oft fälschlicherweise gleichbedeutend verwendet werden.
Anhand eines kurzen Beispiels möchten wir die verschiedenen Bestandteile von Künstlicher Intelligenz (KI) erläutern.
Wir möchten ein Programm entwickeln, das Katzen auf Bildern erkennen kann (Künstliche Intelligenz). Anstatt Regeln wie «Katzen haben zwei Ohren, vier Beine und Schnurrhaare» festzulegen, zeigen wir dem System Tausende Bilder von Katzen und Nicht-Katzen.
Das System lernt selbst Muster aus den Daten (Maschinelles Lernen). Dazu werden sogenannte Neuronale Netze verwendet. Vereinfacht kann man sich diese als viele miteinander verbundene Rechenknoten vorstellen, die Wahrscheinlichkeiten berechnen und dadurch Muster in den Daten erkennen.
Besteht ein neuronales Netz aus besonders vielen hintereinanderliegenden Schichten solcher Rechenknoten, spricht man von Deep Learning. Eine erste Schicht erkennt beispielsweise Linien und Kanten, eine zweite Augen und Ohren und spätere Schichten schliesslich die gesamte Katze.
Werden die gelernten Muster genutzt, um neue Katzenbilder zu erzeugen, spricht man von Generativer KI.
Das folgende Venn-Diagramm stellt die wichtigsten Begriffe, welche in diesem Modul verwendet werden, nochmals übersichtlich dar.

- Künstliche Intelligenz: Der Ansatz, menschliche Intelligenz mittels Maschinen nachzuahmen.
- Maschinelles Lernen: (Statistische) Methoden, um mittels Daten und Algorithmen Muster und Gesetzmässigkeiten zu ermitteln.
- Neuronale Netze: Eine vom menschlichen Gehirn inspirierte Methode, um Maschinelles Lernen umzusetzen (siehe Künstliche Neuronale Netze und Deep Learning)
- Deep Learning: Eine spezielle Architektur von Neuronalen Netzen, welche häufig bei grossen Datenmengen eingesetzt wird.
- Generative KI: Methoden mittels welcher automatisiert neue Inhalte wie Bilder, Texte, Audio und Video erstellt werden.
- LLMs: Ursprünglich die Subgruppe von Generativer KI, welche mit Textverarbeitung und -Generierung zu tun hat. Die neusten Modelle sind aber auch multimodal und können Bild, Video und Audio verarbeiten.
- ChatGPT: Das erste LLM, welches eine grössere Masse erreicht hat. Heute existieren viele andere wie Gemini, Claude, Perplexity, Mistral, Apertus, etc.
Diese Darstellung findet man häufig so oder in abgeänderter Form in der Literatur. Dies ist jedoch nicht die «einzige richtige» Darstellung; es gibt für viele dieser Begriffe keine klar abgrenzenden Definitionen. Auch sei angemerkt, dass dies eine vereinfachte Darstellung ist, in der viele Begriffe und Konzepte wie Natural Language Processing (NLP), Transformer, Computer Vision, Robotik, etc. nicht aufgeführt wurden, da sie für unser Modul nicht relevant sind.