bibtype C - Conference Paper (international conference)
ARLID 0106302
utime 20240103173133.4
mtime 20050324235959.9
title (primary) (eng) Feature selection using improved mutual information for text classification
specification
page_count 8 s.
serial
title Structural, Syntactic, and Statistical Pattern Recognition. Joint IAPR International Workshops SSPR 2004 and SPR 2004. Proceedings
page_num 1010-1017
ISBN 3-540-22570-6
publisher
place Berlin
name Springer
year 2004
title (cze) Použití modifikovaného kriteria vzájemné informace pro výběr příznaků v klasifikaci textových dokumentů
keyword text classification
keyword text categorization
keyword feature selection
author (primary)
ARLID cav_un_auth*0101171
name1 Novovičová
name2 Jana
institution UTIA-B
fullinstit Ústav teorie informace a automatizace AV ČR, v. v. i.
author
ARLID cav_un_auth*0101155
name1 Malík
name2 Antonín
institution UTIA-B
fullinstit Ústav teorie informace a automatizace AV ČR, v. v. i.
author
ARLID cav_un_auth*0101182
name1 Pudil
name2 Pavel
institution UTIA-B
full_dept Department of Pattern Recognition
fullinstit Ústav teorie informace a automatizace AV ČR, v. v. i.
COSATI 09K
COSATI 12B
cas_special
project
project_id IAA2075302
agency GA AV ČR
ARLID cav_un_auth*0001801
project
project_id KSK1019101
agency GA AV ČR
ARLID cav_un_auth*0000219
research CEZ:AV0Z1075907
abstract (eng) Two algorithms for feature (word) selection for the purpose of text classification are proposed. The algorithms use the feature evaluation functions based on improved mutual information that takes into consideration how features work together. The performance of these evaluation functions compared to the information gain which evaluate features individually is discussed. Experimental results from various perspectives(F1-measure, precision and recall) are analyzed.
abstract (cze) Navržena dvě nová kriteria pro výběr příznaků/slov pro řešení problému klasifikace textových dokumentů. Obě kriteria jsou modifikace v této oblasti používaného kriteria vzájemné informace. Účinnost navržených kriteriálních funkcí byla porovnána s kriteriem vzájemné informace použitím multinomického modelu proreprezentaci dokumentů, naivního Bayesova klasifikátoru a Reuters-21578 datových souborů. Experimentální výsledky (analyzované pomocí F1- míry, precision a recall měr) indikují efektivitu navržených algoritmů pro výběr příznaků
action
ARLID cav_un_auth*0129879
name Joint IAPR International Workshops SSPR 2004 and SPR 2004
place Lisbon
dates 18.08.2004-20.08.2004
country PT
reportyear 2005
RIV BB
permalink http://hdl.handle.net/11104/0013484
ID_orig UTIA-B 20040114
arlyear 2004
mrcbU63 Structural, Syntactic, and Statistical Pattern Recognition. Joint IAPR International Workshops SSPR 2004 and SPR 2004. Proceedings 3-540-22570-6 1010 1017 Berlin Springer 2004 Lecture Notes in Computer Science. 3138
mrcbU67 Fred A. 340
mrcbU67 Caelli T. 340
mrcbU67 Duin R. P. W. 340