- Einführung
Terminologie, 4-Phasen-Modell, Agenten, rationale Verhalten, Ziele, Nützlichkeitsmaße, PEAS, Umgebungstypen
- Gegenerische Agentenkooperation
Agenten mit vollständigem Zugriff auf den Zustand der Umgebung, Spiele, Minimax-Algorithmus, Alpha-beta-Beschneidung, Zufallselemente
- Unsicherheit
Motivation: Agenten ohne direktem Zugriff auf den Zustand der Umgebung, Wahrscheinlichkeiten, Bedingte Wahrscheinlichkeiten, Produktregel, Bayessche-Regel, Verbundwahrscheinlichkeit, Randwahrscheinlichkeit, Summationsprinzip, naive Anfragebeantwortung, Komplexität, Unabhängigkeitsannahmen, Naiver-Bayes-Klassifikator, Bedingte Unabhängigkeitsannahmen
- Bayessche Netze
Syntax und Sematik von Bayesschen Netzen, Effizientere Anfragebeantwortung (Inferenz durch Aufzählung), Komplexität im typischen Fall, Pragmatik: Schlussfolgern vom Effekt (der vom Agenten wahrgenommen wird) zur Ursache (die nicht direkt wahrgenommen werden kann)
- Probabilistisches Schließen über die Zeit (1)
Motivation: Zustand der Umgebung kann sich ohne Zutun der Agenten ändern, dynamischen Bayessche Netze, Markov-Annahme, Übergangsmodell, Sensormodell, Inferenzprobleme: Filterung, Vorhersage, Verwaschung, Wahrscheinlichste Ereignissequenz (Viterbi)
- Probabilistisches Schließen über die Zeit (2)
Spezialfälle: Versteckte Markovmodelle (Hidden Markov Models), Kalman-Filter, Exakte Inferenze vs. Approximierungen
- Entscheidungsfindung unter Unsicherheit (1): Einfache Entscheidungen
Theorie der Nützlichkeitsmaße, multivariate Nützlichkeitsmaße, Dominanzprinzip, Entscheidungsnetzwerke, Wert der Information
- Entscheidungsfindung unter Unsicherheit (2): Komplexe Entscheidungen
Sequentielle Entscheidungsfindung, Werteiteration, Policy-Iteration, MDPs
- Entscheidungsfindung unter Unsicherheit (3): Entscheidungstheoretischen Agenten
POMDPS, Reduktion auf multidimensionale kontinuierliche MDPs, Dynamische Entscheidungsnetzwerke
- Spieltheorie
Entscheidungen mit multiple Agenten, Nash-Gleichgewicht, Bayes-Nash-Gleichgewicht
- Soziale Wahltheorie
Wahlprotokolle, Präferenzen, Paradoxien, Theorem von Arrow,
- Mechanismus-Design
Einführung, Dominanzstrategie, Umhüllungsprinzip, Gibbard-Satterthwaite Unmöglichkeitstheorem, Direkte Mechanismen, Anreiz-Kompatibilität, Strategie-Gestütztheit, Vickrey-Groves-Clarke-Mechanismen, Mitgliedschafts-Einschränkungen, individuelle rationales Verhalten, Budget-Ausgeglichenheit, bilaterale Abkommen, Myerson-Satterthwaite-Theorem
- Empfehlungsgenerierungssysteme
Inhaltsbasierte Empfehlung, Kolloaboratives Filtern, hybride Techniken