Popis:
Dynamické programování je klasický způsob řešení rozhodovacích úloh, ve kterých zvolené rozhodnutí ovlivní systém na dlouhou dobu. Řešení těchto úloh spočívá v rekurzivním výpočtu tzv. Bellmanovy funkce. Tento výpočet je pro mnoho úloh příliš komplikovaný a je nutné hledat přibližné metody. V přednášce bude shrnuta podstata problému, a představeny aktuální metody pro přibližné řešení.
Tento problém se řeší téměř nezávisle ve dvou komunitách, a to v teorii řízení a v umělé inteligenci. Asi nejaktivnější skupinou je komunita neuronových sítí. Metody známé jako reinforcement learning a Q-learning je možné interpretovat jako metody dynamického programování. Cílem přednášky je srovnat metody z různých oborů, identifikovat jejich silné a slabé stránky a případně nastínit možnosti jejich kombinace pro další vývoj těchto metod.