bibtype J - Journal Article
ARLID 0309471
utime 20240903170618.5
mtime 20090325235959.9
WOS 000257062200006
title (primary) (eng) Growth Rates and Average Optimality in Risk-Sensitive Markov Decision Chains
specification
page_count 22 s.
serial
ARLID cav_un_epca*0297163
ISSN 0023-5954
title Kybernetika
volume_id 44
volume 2 (2008)
page_num 205-226
publisher
name Ústav teorie informace a automatizace AV ČR, v. v. i.
title (cze) Míry růstu a optimality v průměru v rizikových markovských rozhodovacích řetězcích
keyword risk-sensitive Markov decision chains
keyword average optimal policies
keyword optimal growth rates
author (primary)
ARLID cav_un_auth*0101196
name1 Sladký
name2 Karel
institution UTIA-B
full_dept Department of Econometrics
fullinstit Ústav teorie informace a automatizace AV ČR, v. v. i.
cas_special
project
project_id GA402/08/0107
agency GA ČR
country CZ
ARLID cav_un_auth*0240545
project
project_id GA402/07/1113
agency GA ČR
ARLID cav_un_auth*0228801
research CEZ:AV0Z10750506
abstract (eng) In this note we focus attention on characterization of policies maximizing growth rate of expected utility, along with average of the associated certainty equivalent, in risk-sensitive Markov decision chains with finite state and action spaces. In contrast to existing literature, the problem is handled by methods of stochastic dynamic programming on condition that the transition probabilities are replaced by general nonnegative matrices. Using the block-triangular decomposition of a collection of nonnegative matrices we establish necessary and sufficient condition guaranteeing independence of optimal values on starting state along with partition of the state space into subsets with constant optimal values. Finally for models with growth rate independent of the starting state we show how the method work if we minimize growth rate or average of the certainty equivalent.
abstract (cze) V práci je charakterizována třída řízení, která maximalizuje míru růstu i průměrný růst přidruženého ekvivalentu za jistoty v rizikových markovských rozhodovacích řetězcích. Na rozdíl od literatury úloha je řešena metodami stochastického dynamického programování, kde matrice pravděpodobností přechodů jsou nahrazeny obecnými nezápornými maticemi. Využitím blokově trojúhelníkového rozkladu třídy nezáproných matic jsou nalezeny nutné a postačujících podmínky pro nezávislost optimálních hodnot na počátečním stavu, jakož i rozklad stavového prostoru na třídy s konstatními optimálními hodnotami. Pro modely, kde je míra růstu nezávislá na počátečním stavu, je v zhávěru práce ikázáno, jak lze výše uvedené metody modifikovat při hledání minimální míry růstu nebo odpovídajícího průměrného ekvivalentu za jistoty.
reportyear 2009
RIV BC
mrcbC52 4 O 4o 20231122133725.3
permalink http://hdl.handle.net/11104/0161594
mrcbT16-f 0.457
mrcbT16-g 0.033
mrcbT16-h >10.0
mrcbT16-i 0.0012
mrcbT16-j 0.202
mrcbT16-k 375
mrcbT16-l 60
mrcbT16-q 21
mrcbT16-s 0.616
mrcbT16-y 17.66
mrcbT16-x 0.43
arlyear 2008
mrcbTft \nSoubory v repozitáři: 0309471.pdf
mrcbU34 000257062200006 WOS
mrcbU63 cav_un_epca*0297163 Kybernetika 0023-5954 Roč. 44 č. 2 2008 205 226 Ústav teorie informace a automatizace AV ČR, v. v. i.