bibtype C - Conference Paper (international conference)
ARLID 0411380
utime 20240103182323.0
mtime 20060210235959.9
ISBN 0-7803-9049-0
title (primary) (eng) Information-theoretic feature selection algorithms for text classification
specification
page_count 6 s.
serial
title Proceedings of the International Joint Conference on Neural Networks
page_num 3272-3277
ISBN 0-7803-9048-2
publisher
place Los Alamitos
name IEEE Computational Intelligence Society
year 2005
title (cze) Algoritmy pro výběr příznaků pro klasifikaci textů založené na kriteriu vzájemné informace
keyword text classification
keyword feature selection
keyword mutual information
author (primary)
ARLID cav_un_auth*0101171
name1 Novovičová
name2 Jana
institution UTIA-B
fullinstit Ústav teorie informace a automatizace AV ČR, v. v. i.
author
ARLID cav_un_auth*0101155
name1 Malík
name2 Antonín
institution UTIA-B
fullinstit Ústav teorie informace a automatizace AV ČR, v. v. i.
COSATI 09K
COSATI 09J
COSATI 12B
cas_special
project
project_id IAA2075302
agency GA AV ČR
ARLID cav_un_auth*0001801
project
project_id GA102/03/0049
agency GA ČR
ARLID cav_un_auth*0001805
project
project_id KSK1019101
agency GA AV ČR
ARLID cav_un_auth*0000219
project
project_id 1M0572
agency GA MŠk
ARLID cav_un_auth*0001814
research CEZ:AV0Z10750506
abstract (eng) Four new algorithms for feature/word selection for the purpose of text classification are presented. Sequential forward selection method based on improved mutual information criterion functions is used. The performance of the proposed criteria compared to the information gain which evaluate features individually is discussed. Experimental results using naive Bayes classifier based on multinomial model, linear support vector machine and k-nearest neighbor classifiers on the Reuters data are analyzed.
abstract (cze) Byly navrženy nové algoritmy pro výběr příznaků/slov pro řešení problému klasifikace textových dokumentů. Byl použit sekvenční "dopředný" algoritmus založený na několika modifikacích kriteria vzájemné informace. Účinnost navržených kriterií byla porovnána s nejčastěji používanými kriterii pro výběr slov (vzájemná informace, chí-kvadrát statistika, odds ratio) při použití Bayesova klasifikátoru, lineárního support vector machine a k-nejbližších sousedů na Reuters-21578 datových souborech.
action
ARLID cav_un_auth*0213222
name International Joint Conference on Neural Networks
place Montreal
country CA
dates 31.07.2005-04.08.2005
RIV BB
reportyear 2010
department RO
permalink http://hdl.handle.net/11104/0131462
arlyear 2005
mrcbU12 0-7803-9049-0
mrcbU63 Proceedings of the International Joint Conference on Neural Networks 0-7803-9048-2 3272 3277 Los Alamitos IEEE Computational Intelligence Society 2005