Web projektu DAR

Research Centre
Data - Algorithms - Decision Making

Established in 2005 under support of MŠMT ČR (project 1M0572)

Lectures and Presetations

Přibližné metody dynamického programování.

Lecturer:

Václav Šmídl

From:

Apr. 18 2006 2:00PM

To:

Apr. 18 2006 3:00PM

Place:

místnost 474, ÚTIA AV ČR

Description:

Dynamické programování je klasický způsob řešení rozhodovacích úloh, ve kterých zvolené rozhodnutí ovlivní systém na dlouhou dobu. Řešení těchto úloh spočívá v rekurzivním výpočtu tzv. Bellmanovy funkce. Tento výpočet je pro mnoho úloh příliš komplikovaný a je nutné hledat přibližné metody. V přednášce bude shrnuta podstata problému, a představeny aktuální metody pro přibližné řešení.
Tento problém se řeší téměř nezávisle ve dvou komunitách, a to v teorii řízení a v umělé inteligenci. Asi nejaktivnější skupinou je komunita neuronových sítí. Metody známé jako reinforcement learning a Q-learning je možné interpretovat jako metody dynamického programování. Cílem přednášky je srovnat metody z různých oborů, identifikovat jejich silné a slabé stránky a případně nastínit možnosti jejich kombinace pro další vývoj těchto metod.

Contact person:

Miroslav Kárný (ÚTIA - Oddělení adaptivních systémů)

Within the event:

Pravidelný seminář Rozhodování a řízení za neurčitosti. (Contact person: Miroslav Kárný)