bibtype |
J -
Journal Article
|
ARLID |
0328586 |
utime |
20240903204408.9 |
mtime |
20090915235959.9 |
title
(primary) (cze) |
Interaktivní statistický model dat ze sčítání lidu v České republice v r. 2001 |
specification |
page_count |
15 s. |
media_type |
www |
|
serial |
ARLID |
cav_un_epca*0290598 |
ISSN |
0322-788X |
title
|
Statistika: Statistics and Economy Journal |
volume_id |
89 |
volume |
4 (2009) |
page_num |
285-299 |
publisher |
name |
Český Statistický Úřad |
|
|
title
(eng) |
Statistical Model of the 2001 Czech Census for Interactive Presentation |
keyword |
interactive statistical model |
keyword |
EM algorithm |
keyword |
data modelling |
keyword |
data mining |
keyword |
census data presentation |
author
(primary) |
ARLID |
cav_un_auth*0101091 |
name1 |
Grim |
name2 |
Jiří |
institution |
UTIA-B |
full_dept |
Department of Pattern Recognition |
fullinstit |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
author
|
ARLID |
cav_un_auth*0021091 |
name1 |
Hora |
name2 |
J. |
country |
CZ |
|
author
|
ARLID |
cav_un_auth*0101197 |
name1 |
Somol |
name2 |
Petr |
institution |
UTIA-B |
full_dept |
Department of Pattern Recognition |
fullinstit |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
author
|
ARLID |
cav_un_auth*0101069 |
name1 |
Boček |
name2 |
Pavel |
institution |
UTIA-B |
full_dept |
Department of Stochastic Informatics |
fullinstit |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
author
|
ARLID |
cav_un_auth*0021092 |
name1 |
Pudil |
name2 |
P. |
country |
CZ |
|
source |
|
cas_special |
project |
project_id |
1M0572 |
agency |
GA MŠk |
ARLID |
cav_un_auth*0001814 |
|
project |
project_id |
2C06019 |
agency |
GA MŠk |
country |
CZ |
ARLID |
cav_un_auth*0216518 |
|
project |
project_id |
GA102/07/1594 |
agency |
GA ČR |
ARLID |
cav_un_auth*0228611 |
|
research |
CEZ:AV0Z10750506 |
abstract
(cze) |
Dostupnost výsledků sčítání lidu je přes extrémní náklady (v České republice např. 2.3 miliardy Kč) silně omezena platnými předpisy o ochraně dat. Navrhované řešení nabízí v této souvislosti novou, uživatelsky pohodlnou metodu presentace výsledků sčítání lidu, založenou na pravděpodobnostním modelu původních mikrodat. Pravděpodobnostní model ve formě konečné distribuční směsi popisuje výsledky sčítání lidu ve vysoce komprimované podobě a může být použit jako báze znalostí interaktivního pravděpodobnostního expertního systému. Výsledný softwarový produkt odvozuje libovolnou statistickou informaci z odhadnutého modelu bez přístupu k původnímu souboru individuálních dotazníků. |
abstract
(eng) |
This paper describes the application of a recently developed method of interactive statistical database presentation to the 2001 Czech Census. The method is based on estimating the multivariate probability distribution of the original microdata. The estimated statistical model in the form of a distribution mixture of product components can be used as a knowledge base of a probabilistic expert system. In this way we can derive the statistical properties of data interactively without any further access to the source database. The statistical model does not contain the original data and therefore can be distributed without any confidentiality concerns. The accuracy achievable by the statistical model is comparable with that of the anonymised subsets of microdata. |
reportyear |
2010 |
RIV |
IN |
num_of_auth |
5 |
permalink |
http://hdl.handle.net/11104/0174875 |
arlyear |
2009 |
mrcbU56 |
pdf |
mrcbU63 |
cav_un_epca*0290598 Statistika: Statistics and Economy Journal 0322-788X 1804-8765 Roč. 89 č. 4 2009 285 299 Český Statistický Úřad |
|