bibtype |
J -
Journal Article
|
ARLID |
0085611 |
utime |
20240103184422.1 |
mtime |
20070913235959.9 |
title
(primary) (eng) |
Conditional Mutual Information Based Feature Selection for Classification Task |
specification |
|
serial |
ARLID |
cav_un_epca*0258518 |
ISSN |
0302-9743 |
title
|
Lecture Notes in Computer Science |
volume_id |
45 |
volume |
4756 (2007) |
page_num |
417-426 |
|
title
(cze) |
Výběr příznaků pro klasifikaci založený na podmíněné vzájemné informaci |
keyword |
Pattern classification |
keyword |
feature selection |
keyword |
conditional mutual information |
keyword |
text categorization |
author
(primary) |
ARLID |
cav_un_auth*0101171 |
name1 |
Novovičová |
name2 |
Jana |
institution |
UTIA-B |
fullinstit |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
author
|
ARLID |
cav_un_auth*0101197 |
name1 |
Somol |
name2 |
Petr |
institution |
UTIA-B |
full_dept |
Department of Pattern Recognition |
fullinstit |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
author
|
ARLID |
cav_un_auth*0101093 |
name1 |
Haindl |
name2 |
Michal |
institution |
UTIA-B |
full_dept |
Department of Pattern Recognition |
fullinstit |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
author
|
ARLID |
cav_un_auth*0101182 |
name1 |
Pudil |
name2 |
Pavel |
institution |
UTIA-B |
full_dept |
Department of Pattern Recognition |
fullinstit |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
cas_special |
project |
project_id |
507752 |
country |
XE |
agency |
EC |
ARLID |
cav_un_auth*0200689 |
|
project |
project_id |
2C06019 |
agency |
GA MŠk |
country |
CZ |
ARLID |
cav_un_auth*0216518 |
|
project |
project_id |
1M0572 |
agency |
GA MŠk |
ARLID |
cav_un_auth*0001814 |
|
project |
project_id |
IAA2075302 |
agency |
GA AV ČR |
ARLID |
cav_un_auth*0001801 |
|
research |
CEZ:AV0Z10750506 |
abstract
(eng) |
We propose a sequential forward feature selection method to find a subset of features that are most relevant to the classification task. Our approach uses novel estimation of the conditional mutual information between candidate feature and classes, given a subset of already selected features which is utilized as a classifier independent criterion for evaluation of feature subsets. The proposed mMIFS-U algorithm is applied to text classification problem and compared with MIFS method and MIFS-U method proposed by Battiti and Kwak and Choi, respectively. Our feature selection algorithm outperforms MIFS method and MIFS-U in experiments on high dimensional Reuters textual data. |
abstract
(cze) |
Byl navržen mMIFS-U algoritmus pro výběr příznaků, založený na novém odhadu kriteria podmíněné vzájemné informace. Algoritmus byl aplikován na problém klasifikace textových dokumentů a porovnán s dříve navrženými algoritmy MIFS a MIFS-U. Účinnost navrženého kriteria byla porovnána při použití naivního Bayesova klasifikátoru pro multinomický model textového dokumentu, lineárního support vektor machine klasifikátoru a k-nejbližších sousedů na Reuters-21578 textových souborech s vysokou dimensionalitou. Klasifikační metody při použití příznaků vybraných pomocí navrženého algoritmu mMIFS-U vykazuje vyšší přesnost klasifikace oproti výše zmíněným algoritmům. |
reportyear |
2008 |
RIV |
BB |
permalink |
http://hdl.handle.net/11104/0148084 |
arlyear |
2007 |
mrcbU63 |
cav_un_epca*0258518 Lecture Notes in Computer Science 0302-9743 Roč. 45 č. 4756 2007 417 426 |
|