| bibtype |
J -
Journal Article
|
| ARLID |
0106330 |
| utime |
20240903170603.2 |
| mtime |
20050324235959.9 |
| title
(primary) (eng) |
Text document classification based on mixture models |
| specification |
|
| serial |
| ARLID |
cav_un_epca*0297163 |
| ISSN |
0023-5954 |
| title
|
Kybernetika |
| volume_id |
40 |
| volume |
3 (2004) |
| page_num |
293-304 |
| publisher |
| name |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
|
| title
(cze) |
Klasifikace textových dokumentů použitím směsových modelů |
| keyword |
text classification |
| keyword |
text categorization |
| keyword |
multinomial mixture model |
| author
(primary) |
| ARLID |
cav_un_auth*0101171 |
| name1 |
Novovičová |
| name2 |
Jana |
| institution |
UTIA-B |
| fullinstit |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
| author
|
| ARLID |
cav_un_auth*0101155 |
| name1 |
Malík |
| name2 |
Antonín |
| institution |
UTIA-B |
| fullinstit |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
| COSATI |
09K |
| COSATI |
12B |
| cas_special |
| project |
| project_id |
IAA2075302 |
| agency |
GA AV ČR |
| ARLID |
cav_un_auth*0001801 |
|
| project |
| project_id |
GA102/03/0049 |
| agency |
GA ČR |
| ARLID |
cav_un_auth*0001805 |
|
| project |
| project_id |
KSK1019101 |
| agency |
GA AV ČR |
| ARLID |
cav_un_auth*0000219 |
|
| research |
CEZ:AV0Z1075907 |
| abstract
(eng) |
Finite mixture modelling of class-conditional distributions is a standard method in a statistical pattern recognition. This paper, using bag-of-words vector document representation, explores the use of the mixture of multinomial distributions as a model for class-conditional distribution for multiclass text document classification task. Experimental comparison of the proposed models was performed using Reuters-21578 and Newsgroups data sets. |
| abstract
(cze) |
Použití směsi multinomických rozdělení jako modelu pro podmíněná rozdělení pravděpodobností pro Bayesův klasifikátor je uvedeno. Výsledky experimentů s použitím Reuters 21578 a Newsgroups datových souborů indikují efektivnost použitého multinomického směsového modelu v otázkách klasifikace textových dokumentů. Bylo ukázáno, že přesnost Bayesova klasifikátoru může být zvýšena při použití navrženého modelu v porovnání s Bayesovým klasifikátorem založeným jednak na standardních modelech (vícerozměrný Bernoulliho model, multinomický model), jednak na směsovém Bernoulliho modelu |
| reportyear |
2005 |
| RIV |
BB |
| mrcbC52 |
4 O 4o 20231122133034.8 |
| permalink |
http://hdl.handle.net/11104/0013512 |
| ID_orig |
UTIA-B 20040142 |
| arlyear |
2004 |
| mrcbTft |
\nSoubory v repozitáři: 0106330.pdf |
| mrcbU63 |
cav_un_epca*0297163 Kybernetika 0023-5954 Roč. 40 č. 3 2004 293 304 Ústav teorie informace a automatizace AV ČR, v. v. i. |
|