bibtype C - Conference Paper (international conference)
ARLID 0106254
utime 20240103173128.9
mtime 20050324235959.9
title (primary) (eng) On the set of optimal policies in variance penalized Markov decision chains
specification
page_count 8 s.
serial
title Operations Research Proceedings 2003
page_num 395-402
ISBN 3-540-21445-3
publisher
place Heidelberg
name Springer
year 2004
title (cze) O třídě optimálních řízení markovských rozhodovacích procesů s penalizací rozptylem
keyword Markov decision chains
keyword mean-variance optimality
keyword policy iterations
author (primary)
ARLID cav_un_auth*0101196
name1 Sladký
name2 Karel
institution UTIA-B
full_dept Department of Econometrics
fullinstit Ústav teorie informace a automatizace AV ČR, v. v. i.
author
ARLID cav_un_auth*0101193
name1 Sitař
name2 Milan
institution UTIA-B
fullinstit Ústav teorie informace a automatizace AV ČR, v. v. i.
COSATI 12B
cas_special
project
project_id GA402/02/1015
agency GA ČR
ARLID cav_un_auth*0000527
project
project_id GA402/01/0539
agency GA ČR
ARLID cav_un_auth*0008959
research CEZ:AV0Z1075907
abstract (eng) In this note we present a policy iteration algorithm for constructing a set of efficient stationary policies containing optimal policies with respect to various criteria used for the mean variance tradeoff. This algorithm works both for the unichain and multichain models. We show that the obtained policies are optimal also in the class of Markovian (memoryless) policies.
abstract (cze) V práci je navržen algoritmický postup, založený na iteracích v prostoru stacionárních řízení, pro nalezení eficientních stacionárních řízení s ohledem na různá kritéria optimality typu průměrný výnos a jeho rozptyl. Navržený algoritmický postup je možno využít i pro případ markovských řetězců s větším počtem tříd rekurentních stavů. Je rovněž ukázáno, že takto nalezená řízení jsou optimální i ve třídě všech markovských řízení
action
ARLID cav_un_auth*0129861
name OR 2003. International Conference on Operations Research
place Heidelberg
dates 03.09.2003-05.09.2003
country DE
reportyear 2005
RIV BB
permalink http://hdl.handle.net/11104/0013436
ID_orig UTIA-B 20040065
arlyear 2004
mrcbU63 Operations Research Proceedings 2003 3-540-21445-3 395 402 Heidelberg Springer 2004
mrcbU67 Ahr D. 340
mrcbU67 Fahrion R. 340
mrcbU67 Oswald M. 340
mrcbU67 Reinelt G. 340