Zum Hauptinhalt springen

A2 | Künstliche Intelligenz vs menschliche Intelligenz

Intelligenz kann allgemein als die Fähigkeit eines Individuums oder eines Systems verstanden werden, Informationen zu erfassen, zu verarbeiten und daraus zu lernen, Probleme zu lösen, Wissen zielgerichtet anzuwenden, Entscheidungen zu treffen sowie sich an neue und veränderte Situationen anzupassen (Jäncke, 2023). 

Bei Anwendung dieses Intelligenzverständnisses auf ChatGPT, das wohl bekannteste Large Language Model (LLM), kann dieses gemäss der Definition als «intelligent» eingestuft werden. 

Dennoch bestehen zwischen menschlicher und künstlicher Intelligenz grundlegende Unterschiede. Künstliche Intelligenz ist stets auf jene Aufgaben- und Wissensbereiche beschränkt, für die sie mit entsprechenden Daten trainiert wurde, während menschliche Intelligenz deutlich flexibler, kontextsensitiver und erfahrungsbasiert ist. Darüber hinaus unterscheiden sich die zugrunde liegenden Lernprozesse: Menschliches Lernen erfolgt durch Wahrnehmung, Erfahrung und bewusste Reflexion, während künstliches Lernen primär auf statistischen Mustern und algorithmischer Optimierung beruht. 

In der nachfolgenden Tabelle werden zentrale Merkmale menschlicher und künstlicher Intelligenz vergleichend zusammengefasst. 

MerkmalKünstliche Intelligenz Menschliches Lernen 
Grafische Darstellung
Ursprung Künstliches Netzwerk von Wahrscheinlichkeitsknoten Biologische neuronale Netzwerke 
Energieverbrauch Hoher Energieverbrauch, Viele GPUs Extrem Energieeffizient (20W) 
Lernprozess Lernt durch Training mit grossen Datenmengen und statistischer Mustererkennung Extrem Lerneffizient: Lernt durch Erfahrung, Wahrnehmung, Emotionen und soziale Interaktion 
Wissensaneigung Diskretes Lernen: Verarbeitung von Daten auf Anweisung Kontinuierliches Lernen 
Verständnis Kein echtes Verständnis, sondern probabilistische Sprachverarbeitung Tiefes semantisches und kontextuelles Verständnis 
Kreativität Kombinatorisch, basiert auf vorhandenen Datenmustern Eigenständig, bewusst und erfahrungsbasiert 
FehlerverhaltenKann aus Fehlern reflektiert lernenFehlerkorrektur nur indirekt über Nachtraining oder Nutzerfeedback 

KI-Begriffe im Venn-Diagramm

In der Auseinandersetzung mit KI fallen häufig Begriffe, welche oft fälschlicherweise gleichbedeutend verwendet werden.

Anhand eines kurzen Beispiels möchten wir die verschiedenen Bestandteile von Künstlicher Intelligenz (KI) erläutern.

Wir möchten ein Programm entwickeln, das Katzen auf Bildern erkennen kann (Künstliche Intelligenz). Anstatt Regeln wie «Katzen haben zwei Ohren, vier Beine und Schnurrhaare» festzulegen, zeigen wir dem System Tausende Bilder von Katzen und Nicht-Katzen.

Das System lernt selbst Muster aus den Daten (Maschinelles Lernen). Dazu werden sogenannte Neuronale Netze verwendet. Vereinfacht kann man sich diese als viele miteinander verbundene Rechenknoten vorstellen, die Wahrscheinlichkeiten berechnen und dadurch Muster in den Daten erkennen.

Besteht ein neuronales Netz aus besonders vielen hintereinanderliegenden Schichten solcher Rechenknoten, spricht man von Deep Learning. Eine erste Schicht erkennt beispielsweise Linien und Kanten, eine zweite Augen und Ohren und spätere Schichten schliesslich die gesamte Katze.

Werden die gelernten Muster genutzt, um neue Katzenbilder zu erzeugen, spricht man von Generativer KI.

Das folgende Venn-Diagramm stellt die wichtigsten Begriffe, welche in diesem Modul verwendet werden, nochmals übersichtlich dar.

  • Künstliche Intelligenz: Der Ansatz, menschliche Intelligenz mittels Maschinen nachzuahmen.
  • Maschinelles Lernen: (Statistische) Methoden, um mittels Daten und Algorithmen Muster und Gesetzmässigkeiten zu ermitteln.
  • Neuronale Netze: Eine vom menschlichen Gehirn inspirierte Methode, um Maschinelles Lernen umzusetzen (siehe Künstliche Neuronale Netze und Deep Learning)
  • Deep Learning: Eine spezielle Architektur von Neuronalen Netzen, welche häufig bei grossen Datenmengen eingesetzt wird.
  • Generative KI: Methoden mittels welcher automatisiert neue Inhalte wie Bilder, Texte, Audio und Video erstellt werden.
  • LLMs: Ursprünglich die Subgruppe von Generativer KI, welche mit Textverarbeitung und -Generierung zu tun hat. Die neusten Modelle sind aber auch multimodal und können Bild, Video und Audio verarbeiten.
  • ChatGPT: Das erste LLM, welches eine grössere Masse erreicht hat. Heute existieren viele andere wie Gemini, Claude, Perplexity, Mistral, Apertus, etc.

Diese Darstellung findet man häufig so oder in abgeänderter Form in der Literatur. Dies ist jedoch nicht die «einzige richtige» Darstellung; es gibt für viele dieser Begriffe keine klar abgrenzenden Definitionen. Auch sei angemerkt, dass dies eine vereinfachte Darstellung ist, in der viele Begriffe und Konzepte wie Natural Language Processing (NLP), Transformer, Computer Vision, Robotik, etc. nicht aufgeführt wurden, da sie für unser Modul nicht relevant sind.