bibtype |
C -
Conference Paper (international conference)
|
ARLID |
0106302 |
utime |
20240103173133.4 |
mtime |
20050324235959.9 |
title
(primary) (eng) |
Feature selection using improved mutual information for text classification |
specification |
|
serial |
title
|
Structural, Syntactic, and Statistical Pattern Recognition. Joint IAPR International Workshops SSPR 2004 and SPR 2004. Proceedings |
page_num |
1010-1017 |
ISBN |
3-540-22570-6 |
publisher |
place |
Berlin |
name |
Springer |
year |
2004 |
|
|
title
(cze) |
Použití modifikovaného kriteria vzájemné informace pro výběr příznaků v klasifikaci textových dokumentů |
keyword |
text classification |
keyword |
text categorization |
keyword |
feature selection |
author
(primary) |
ARLID |
cav_un_auth*0101171 |
name1 |
Novovičová |
name2 |
Jana |
institution |
UTIA-B |
fullinstit |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
author
|
ARLID |
cav_un_auth*0101155 |
name1 |
Malík |
name2 |
Antonín |
institution |
UTIA-B |
fullinstit |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
author
|
ARLID |
cav_un_auth*0101182 |
name1 |
Pudil |
name2 |
Pavel |
institution |
UTIA-B |
full_dept |
Department of Pattern Recognition |
fullinstit |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
COSATI |
09K |
COSATI |
12B |
cas_special |
project |
project_id |
IAA2075302 |
agency |
GA AV ČR |
ARLID |
cav_un_auth*0001801 |
|
project |
project_id |
KSK1019101 |
agency |
GA AV ČR |
ARLID |
cav_un_auth*0000219 |
|
research |
CEZ:AV0Z1075907 |
abstract
(eng) |
Two algorithms for feature (word) selection for the purpose of text classification are proposed. The algorithms use the feature evaluation functions based on improved mutual information that takes into consideration how features work together. The performance of these evaluation functions compared to the information gain which evaluate features individually is discussed. Experimental results from various perspectives(F1-measure, precision and recall) are analyzed. |
abstract
(cze) |
Navržena dvě nová kriteria pro výběr příznaků/slov pro řešení problému klasifikace textových dokumentů. Obě kriteria jsou modifikace v této oblasti používaného kriteria vzájemné informace. Účinnost navržených kriteriálních funkcí byla porovnána s kriteriem vzájemné informace použitím multinomického modelu proreprezentaci dokumentů, naivního Bayesova klasifikátoru a Reuters-21578 datových souborů. Experimentální výsledky (analyzované pomocí F1- míry, precision a recall měr) indikují efektivitu navržených algoritmů pro výběr příznaků |
action |
ARLID |
cav_un_auth*0129879 |
name |
Joint IAPR International Workshops SSPR 2004 and SPR 2004 |
place |
Lisbon |
dates |
18.08.2004-20.08.2004 |
country |
PT |
|
reportyear |
2005 |
RIV |
BB |
permalink |
http://hdl.handle.net/11104/0013484 |
ID_orig |
UTIA-B 20040114 |
arlyear |
2004 |
mrcbU63 |
Structural, Syntactic, and Statistical Pattern Recognition. Joint IAPR International Workshops SSPR 2004 and SPR 2004. Proceedings 3-540-22570-6 1010 1017 Berlin Springer 2004 Lecture Notes in Computer Science. 3138 |
mrcbU67 |
Fred A. 340 |
mrcbU67 |
Caelli T. 340 |
mrcbU67 |
Duin R. P. W. 340 |
|