Learning in autonomous systems

Docente: Luca Iocchi
Pagina web dell'insegnamento:www.diag.uniroma1.it/~iocchi/Didattica/LAS/index.html
Crediti: 6
Codice Infostud: 1044393

Obiettivi formativi

L’obiettivo del corso è fornire tecniche e strumenti per l’apprendimento automatico in sistemi dinamici complessi e agenti autonomi. In particolare, vengono presentati modelli probabilistici per la rappresentazione di sistemi dinamici e di agenti autonomi, tecniche di apprendimento per rinforzo, tecniche di apprendimento di modelli grafici, tecniche di stima dello stato. Si presentano anche molteplici esempi di impiego efficace delle tecniche mostrate in diversi scenari applicativi. Al termine del corso lo studente sarà in grado di usare le tecniche e gli strumenti acquisiti per la modellazione e soluzione di problemi di apprendimento per sistemi dinamici complessi. Gli studenti avranno la capacità di risolvere problemi, partendo da una corretta formulazione degli stessi, effettuando opportune scelte progettuali e implementative, e sapendo condurre un’analisi sperimentale per valutare i risultati ottenuti.

Modalità d'esame: Prova scritta, Valutazione progetto

Programma

  • Introduzione Problematiche tipiche di applicazioni robotiche. Richiami di probabilità e algebra lineare.
  • Modellazione dei sistemi dinamici Concetti generali dei modelli. Tassonomia dei modelli. Markov Decision Processes. Hidden Markov Models (forward, backward). Dynamic Bayesian Networks. Partially Observable Markov Decision Processes. Probabilistic Graphical Models.
  • Apprendimento per rinforzo Algoritmo Q-Learning. Apprendimento in sistemi non deterministici. Apprendimento per rinforzo inverso. RL nel plan space.
  • Filtri di Bayes nelle DBN Filtri discreti (forward). Filtri particellari.
  • Apprendimento di Modelli Grafici Probabilistici Apprendimento nelle HMM (Baum-Welch). Apprendimento nelle DBN: stima delle CPD da data set supervisionati.
  • Apprendimento Multi-Agente Multi-source multi-object tracking. Multi-agent learning.

Testi di riferimento

  • Slides e dispense del docente.