
Quelle: https://computingeducation.de/proj-ml-uebersicht/
Beim bestärkenden Lernen (engl. Reinforcement Learning oder kurz RL) lernt die KI durch Ausprobieren (Trial and Error) in einer Umgebung, ähnlich einem Hund, der Tricks lernt. Die KI führt eine Aktion aus und erhält entweder eine Belohnung (Reward) für eine gute Aktion oder eine Bestrafung (Penalty) für eine schlechte. Das Bestärkende Lernen ist ein sehr beliebter Ansatz in moderner KI, vor allem in der Robotik. Wir können uns das ganze fast wie einen «Agenten» (engl. agent) vorstellen, der selbstständig ein Videospiel spielt und dabei lernt besser zu werden:
- Der Agent (KI): Spielt ein Videospiel
- Die Umgebung: Das Spielfeld
- Belohnung: Punkte sammeln
- Bestrafung: Verlieren eines «Lebens»
- Ziel: Eine Strategie (Policy) finden, um die maximale Belohnung zu erhalten
In der nächsten Aktivität werden wir mit einer Praxisimplementierung von bestärkendem Lernen experimentieren.