bibtype C - Conference Paper (international conference)
ARLID 0040936
utime 20240103182718.2
mtime 20060907235959.9
title (primary) (eng) Algorithmic procedures for mean variance optimality in Markov decision chains
specification
page_count 6 s.
serial
ARLID cav_un_epca*0076748
ISBN 3-540-32537-9
title Operation Research Proceedings 2005
page_num 799-804
publisher
place Berlin
name Springer
year 2006
editor
name1 Haasis
name2 H. D.
editor
name1 Kopfer
name2 H.
editor
name1 Schonberger
name2 J.
title (cze) Algoritmické postupy pro optimalitu typu střední hodnota-rozptyl v markovských rozhodovaních řetězcích.
keyword Markov decision chains
keyword mean-variance optimality
keyword algorithmic procedures
author (primary)
ARLID cav_un_auth*0101196
name1 Sladký
name2 Karel
institution UTIA-B
full_dept Department of Econometrics
fullinstit Ústav teorie informace a automatizace AV ČR, v. v. i.
author
ARLID cav_un_auth*0101193
name1 Sitař
name2 Milan
institution UTIA-B
fullinstit Ústav teorie informace a automatizace AV ČR, v. v. i.
COSATI 12B
cas_special
project
project_id GA402/05/0115
agency GA ČR
ARLID cav_un_auth*0001811
project
project_id GA402/04/1294
agency GA ČR
ARLID cav_un_auth*0001810
research CEZ:AV0Z10750506
abstract (eng) In this note we discussed some algorithmic procedures for finding optimal policies of Markov decision chains with respect to various mean variance optimality criteria. To this end, we present formulas for the growth rate and asymptotic behavior of the variance of total cumulative reward. Finally, algorithmic procedures of policy internation type for finding efficient policies with respect to various mean variance optimality criteria along with computational experience are discussed.
abstract (cze) V práci se diskutují algoritmické postupy pro nalezení optimálního řízení markovských rozhodovancích procesů vzhledem k různým typům průměrné časové optimality. Nejprve se uvádí vztahy pro míru růstu a asymptotické chování variance celkového kumulovaného výnosu. Dále jsou uvedeny algorithmické postupy typu "iterace v prostoru řízení" pro nalezení eficientních řízení pro různá kriteria optimality typu střední hodnota-rozptyl.
action
ARLID cav_un_auth*0216458
name Operations Research 2006
place Bremen
dates 06.09.2005-08.09.2005
country DE
reportyear 2007
RIV BB
permalink http://hdl.handle.net/11104/0134544
arlyear 2006
mrcbU63 cav_un_epca*0076748 Operation Research Proceedings 2005 3-540-32537-9 799 804 Berlin Springer 2006
mrcbU67 Haasis H. D. 340
mrcbU67 Kopfer H. 340
mrcbU67 Schonberger J. 340