Web projektu DAR

Výzkumné centrum
Data - Algoritmy - Rozhodování

Založeno v roce 2005 s podporou MŠMT ČR (projekt 1M0572)

Přednášky

Přibližné metody dynamického programování.

Přednášející:

Václav Šmídl

Od:

Apr. 18 2006 2:00PM

Do:

Apr. 18 2006 3:00PM

Místo:

místnost 474, ÚTIA AV ČR

Popis:

Dynamické programování je klasický způsob řešení rozhodovacích úloh, ve kterých zvolené rozhodnutí ovlivní systém na dlouhou dobu. Řešení těchto úloh spočívá v rekurzivním výpočtu tzv. Bellmanovy funkce. Tento výpočet je pro mnoho úloh příliš komplikovaný a je nutné hledat přibližné metody. V přednášce bude shrnuta podstata problému, a představeny aktuální metody pro přibližné řešení.
Tento problém se řeší téměř nezávisle ve dvou komunitách, a to v teorii řízení a v umělé inteligenci. Asi nejaktivnější skupinou je komunita neuronových sítí. Metody známé jako reinforcement learning a Q-learning je možné interpretovat jako metody dynamického programování. Cílem přednášky je srovnat metody z různých oborů, identifikovat jejich silné a slabé stránky a případně nastínit možnosti jejich kombinace pro další vývoj těchto metod.

Kontaktní osoba:

Miroslav Kárný (ÚTIA - Oddělení adaptivních systémů)

V rámci akce:

Pravidelný seminář Rozhodování a řízení za neurčitosti. (Kontaktní osoba: Miroslav Kárný)