| bibtype |
J -
Journal Article
|
| ARLID |
0085611 |
| utime |
20240103184422.1 |
| mtime |
20070913235959.9 |
| title
(primary) (eng) |
Conditional Mutual Information Based Feature Selection for Classification Task |
| specification |
|
| serial |
| ARLID |
cav_un_epca*0258518 |
| ISSN |
0302-9743 |
| title
|
Lecture Notes in Computer Science |
| volume_id |
45 |
| volume |
4756 (2007) |
| page_num |
417-426 |
|
| title
(cze) |
Výběr příznaků pro klasifikaci založený na podmíněné vzájemné informaci |
| keyword |
Pattern classification |
| keyword |
feature selection |
| keyword |
conditional mutual information |
| keyword |
text categorization |
| author
(primary) |
| ARLID |
cav_un_auth*0101171 |
| name1 |
Novovičová |
| name2 |
Jana |
| institution |
UTIA-B |
| fullinstit |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
| author
|
| ARLID |
cav_un_auth*0101197 |
| name1 |
Somol |
| name2 |
Petr |
| institution |
UTIA-B |
| full_dept |
Department of Pattern Recognition |
| fullinstit |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
| author
|
| ARLID |
cav_un_auth*0101093 |
| name1 |
Haindl |
| name2 |
Michal |
| institution |
UTIA-B |
| full_dept |
Department of Pattern Recognition |
| fullinstit |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
| author
|
| ARLID |
cav_un_auth*0101182 |
| name1 |
Pudil |
| name2 |
Pavel |
| institution |
UTIA-B |
| full_dept |
Department of Pattern Recognition |
| fullinstit |
Ústav teorie informace a automatizace AV ČR, v. v. i. |
|
| cas_special |
| project |
| project_id |
507752 |
| country |
XE |
| agency |
EC |
| ARLID |
cav_un_auth*0200689 |
|
| project |
| project_id |
2C06019 |
| agency |
GA MŠk |
| country |
CZ |
| ARLID |
cav_un_auth*0216518 |
|
| project |
| project_id |
1M0572 |
| agency |
GA MŠk |
| ARLID |
cav_un_auth*0001814 |
|
| project |
| project_id |
IAA2075302 |
| agency |
GA AV ČR |
| ARLID |
cav_un_auth*0001801 |
|
| research |
CEZ:AV0Z10750506 |
| abstract
(eng) |
We propose a sequential forward feature selection method to find a subset of features that are most relevant to the classification task. Our approach uses novel estimation of the conditional mutual information between candidate feature and classes, given a subset of already selected features which is utilized as a classifier independent criterion for evaluation of feature subsets. The proposed mMIFS-U algorithm is applied to text classification problem and compared with MIFS method and MIFS-U method proposed by Battiti and Kwak and Choi, respectively. Our feature selection algorithm outperforms MIFS method and MIFS-U in experiments on high dimensional Reuters textual data. |
| abstract
(cze) |
Byl navržen mMIFS-U algoritmus pro výběr příznaků, založený na novém odhadu kriteria podmíněné vzájemné informace. Algoritmus byl aplikován na problém klasifikace textových dokumentů a porovnán s dříve navrženými algoritmy MIFS a MIFS-U. Účinnost navrženého kriteria byla porovnána při použití naivního Bayesova klasifikátoru pro multinomický model textového dokumentu, lineárního support vektor machine klasifikátoru a k-nejbližších sousedů na Reuters-21578 textových souborech s vysokou dimensionalitou. Klasifikační metody při použití příznaků vybraných pomocí navrženého algoritmu mMIFS-U vykazuje vyšší přesnost klasifikace oproti výše zmíněným algoritmům. |
| reportyear |
2008 |
| RIV |
BB |
| permalink |
http://hdl.handle.net/11104/0148084 |
| arlyear |
2007 |
| mrcbU63 |
cav_un_epca*0258518 Lecture Notes in Computer Science 0302-9743 Roč. 45 č. 4756 2007 417 426 |
|