project |
project_id |
IAA2075302 |
agency |
GA AV ČR |
ARLID |
cav_un_auth*0001801 |
|
project |
project_id |
GA102/03/0049 |
agency |
GA ČR |
ARLID |
cav_un_auth*0001805 |
|
project |
project_id |
KSK1019101 |
agency |
GA AV ČR |
ARLID |
cav_un_auth*0000219 |
|
project |
project_id |
1M0572 |
agency |
GA MŠk |
ARLID |
cav_un_auth*0001814 |
|
research |
CEZ:AV0Z10750506 |
abstract
(eng) |
Four new algorithms for feature/word selection for the purpose of text classification are presented. Sequential forward selection method based on improved mutual information criterion functions is used. The performance of the proposed criteria compared to the information gain which evaluate features individually is discussed. Experimental results using naive Bayes classifier based on multinomial model, linear support vector machine and k-nearest neighbor classifiers on the Reuters data are analyzed. |
abstract
(cze) |
Byly navrženy nové algoritmy pro výběr příznaků/slov pro řešení problému klasifikace textových dokumentů. Byl použit sekvenční "dopředný" algoritmus založený na několika modifikacích kriteria vzájemné informace. Účinnost navržených kriterií byla porovnána s nejčastěji používanými kriterii pro výběr slov (vzájemná informace, chí-kvadrát statistika, odds ratio) při použití Bayesova klasifikátoru, lineárního support vector machine a k-nejbližších sousedů na Reuters-21578 datových souborech. |
action |
ARLID |
cav_un_auth*0213222 |
name |
International Joint Conference on Neural Networks |
place |
Montreal |
country |
CA |
dates |
31.07.2005-04.08.2005 |
|
RIV |
BB |
reportyear |
2010 |
department |
RO |
permalink |
http://hdl.handle.net/11104/0131462 |
arlyear |
2005 |
mrcbU12 |
0-7803-9049-0 |
mrcbU63 |
Proceedings of the International Joint Conference on Neural Networks 0-7803-9048-2 3272 3277 Los Alamitos IEEE Computational Intelligence Society 2005 |