UTIA - Library

bibtype

C - Conference Paper (international conference)

ARLID

0040936

utime

20240103182718.2

mtime

20060907235959.9

title (primary) (eng)

Algorithmic procedures for mean variance optimality in Markov decision chains

specification

page_count	6 s.

serial

ARLID

cav_un_epca*0076748

ISBN

3-540-32537-9

title

Operation Research Proceedings 2005

page_num

799-804

publisher

place	Berlin
name	Springer
year	2006

editor

name1	Haasis
name2	H. D.

editor

name1	Kopfer
name2	H.

editor

name1	Schonberger
name2	J.

title (cze)

Algoritmické postupy pro optimalitu typu střední hodnota-rozptyl v markovských rozhodovaních řetězcích.

keyword

Markov decision chains

keyword

mean-variance optimality

keyword

algorithmic procedures

author (primary)

ARLID	cav_un_auth*0101196
name1	Sladký
name2	Karel
institution	UTIA-B
full_dept	Department of Econometrics
fullinstit	Ústav teorie informace a automatizace AV ČR, v. v. i.

author

ARLID	cav_un_auth*0101193
name1	Sitař
name2	Milan
institution	UTIA-B
fullinstit	Ústav teorie informace a automatizace AV ČR, v. v. i.

COSATI

12B

cas_special

project

project_id	GA402/05/0115
agency	GA ČR
ARLID	cav_un_auth*0001811

project

project_id	GA402/04/1294
agency	GA ČR
ARLID	cav_un_auth*0001810

research

CEZ:AV0Z10750506

abstract (eng)

In this note we discussed some algorithmic procedures for finding optimal policies of Markov decision chains with respect to various mean variance optimality criteria. To this end, we present formulas for the growth rate and asymptotic behavior of the variance of total cumulative reward. Finally, algorithmic procedures of policy internation type for finding efficient policies with respect to various mean variance optimality criteria along with computational experience are discussed.

abstract (cze)

V práci se diskutují algoritmické postupy pro nalezení optimálního řízení markovských rozhodovancích procesů vzhledem k různým typům průměrné časové optimality. Nejprve se uvádí vztahy pro míru růstu a asymptotické chování variance celkového kumulovaného výnosu. Dále jsou uvedeny algorithmické postupy typu "iterace v prostoru řízení" pro nalezení eficientních řízení pro různá kriteria optimality typu střední hodnota-rozptyl.

action

ARLID	cav_un_auth*0216458
name	Operations Research 2006
place	Bremen
dates	06.09.2005-08.09.2005
country	DE

reportyear

2007

RIV

permalink

http://hdl.handle.net/11104/0134544

arlyear

2006

mrcbU63

cav_un_epca*0076748 Operation Research Proceedings 2005 3-540-32537-9 799 804 Berlin Springer 2006

mrcbU67

Haasis H. D. 340

mrcbU67

Kopfer H. 340

mrcbU67

Schonberger J. 340