Established in 2005 under support of MŠMT ČR (project 1M0572)

Lectures and Presetations

Přibližné metody dynamického programování.

From:
Apr. 18 2006 2:00PM
To:
Apr. 18 2006 3:00PM
Place:
místnost 474, ÚTIA AV ČR
Description:
Dynamické programování je klasický způsob řešení rozhodovacích úloh, ve kterých zvolené rozhodnutí ovlivní systém na dlouhou dobu. Řešení těchto úloh spočívá v rekurzivním výpočtu tzv. Bellmanovy funkce. Tento výpočet je pro mnoho úloh příliš komplikovaný a je nutné hledat přibližné metody. V přednášce bude shrnuta podstata problému, a představeny aktuální metody pro přibližné řešení.
Tento problém se řeší téměř nezávisle ve dvou komunitách, a to v teorii řízení a v umělé inteligenci. Asi nejaktivnější skupinou je komunita neuronových sítí. Metody známé jako reinforcement learning a Q-learning je možné interpretovat jako metody dynamického programování. Cílem přednášky je srovnat metody z různých oborů, identifikovat jejich silné a slabé stránky a případně nastínit možnosti jejich kombinace pro další vývoj těchto metod.
 
Copyright 2005 DAR XHTML CSS