KI-Labor: Die hungrige Maus mit der Bellmann-Gleichung 🐭→🧀
VALUE-MAP V(s)
LERN-STABILITÄT (AVG SUCCESS)