Založeno v roce 2005 s podporou MŠMT ČR (projekt 1M0572)

Přednášky

Přibližné metody dynamického programování.

Přednášející:
Od:
Apr. 18 2006 2:00PM
Do:
Apr. 18 2006 3:00PM
Místo:
místnost 474, ÚTIA AV ČR
Popis:
Dynamické programování je klasický způsob řešení rozhodovacích úloh, ve kterých zvolené rozhodnutí ovlivní systém na dlouhou dobu. Řešení těchto úloh spočívá v rekurzivním výpočtu tzv. Bellmanovy funkce. Tento výpočet je pro mnoho úloh příliš komplikovaný a je nutné hledat přibližné metody. V přednášce bude shrnuta podstata problému, a představeny aktuální metody pro přibližné řešení.
Tento problém se řeší téměř nezávisle ve dvou komunitách, a to v teorii řízení a v umělé inteligenci. Asi nejaktivnější skupinou je komunita neuronových sítí. Metody známé jako reinforcement learning a Q-learning je možné interpretovat jako metody dynamického programování. Cílem přednášky je srovnat metody z různých oborů, identifikovat jejich silné a slabé stránky a případně nastínit možnosti jejich kombinace pro další vývoj těchto metod.
 
Copyright 2005 DAR XHTML CSS