bibtype J - Journal Article
ARLID 0085611
utime 20240103184422.1
mtime 20070913235959.9
title (primary) (eng) Conditional Mutual Information Based Feature Selection for Classification Task
specification
page_count 10 s.
serial
ARLID cav_un_epca*0258518
ISSN 0302-9743
title Lecture Notes in Computer Science
volume_id 45
volume 4756 (2007)
page_num 417-426
title (cze) Výběr příznaků pro klasifikaci založený na podmíněné vzájemné informaci
keyword Pattern classification
keyword feature selection
keyword conditional mutual information
keyword text categorization
author (primary)
ARLID cav_un_auth*0101171
name1 Novovičová
name2 Jana
institution UTIA-B
fullinstit Ústav teorie informace a automatizace AV ČR, v. v. i.
author
ARLID cav_un_auth*0101197
name1 Somol
name2 Petr
institution UTIA-B
full_dept Department of Pattern Recognition
fullinstit Ústav teorie informace a automatizace AV ČR, v. v. i.
author
ARLID cav_un_auth*0101093
name1 Haindl
name2 Michal
institution UTIA-B
full_dept Department of Pattern Recognition
fullinstit Ústav teorie informace a automatizace AV ČR, v. v. i.
author
ARLID cav_un_auth*0101182
name1 Pudil
name2 Pavel
institution UTIA-B
full_dept Department of Pattern Recognition
fullinstit Ústav teorie informace a automatizace AV ČR, v. v. i.
cas_special
project
project_id 507752
country XE
agency EC
ARLID cav_un_auth*0200689
project
project_id 2C06019
agency GA MŠk
country CZ
ARLID cav_un_auth*0216518
project
project_id 1M0572
agency GA MŠk
ARLID cav_un_auth*0001814
project
project_id IAA2075302
agency GA AV ČR
ARLID cav_un_auth*0001801
research CEZ:AV0Z10750506
abstract (eng) We propose a sequential forward feature selection method to find a subset of features that are most relevant to the classification task. Our approach uses novel estimation of the conditional mutual information between candidate feature and classes, given a subset of already selected features which is utilized as a classifier independent criterion for evaluation of feature subsets. The proposed mMIFS-U algorithm is applied to text classification problem and compared with MIFS method and MIFS-U method proposed by Battiti and Kwak and Choi, respectively. Our feature selection algorithm outperforms MIFS method and MIFS-U in experiments on high dimensional Reuters textual data.
abstract (cze) Byl navržen mMIFS-U algoritmus pro výběr příznaků, založený na novém odhadu kriteria podmíněné vzájemné informace. Algoritmus byl aplikován na problém klasifikace textových dokumentů a porovnán s dříve navrženými algoritmy MIFS a MIFS-U. Účinnost navrženého kriteria byla porovnána při použití naivního Bayesova klasifikátoru pro multinomický model textového dokumentu, lineárního support vektor machine klasifikátoru a k-nejbližších sousedů na Reuters-21578 textových souborech s vysokou dimensionalitou. Klasifikační metody při použití příznaků vybraných pomocí navrženého algoritmu mMIFS-U vykazuje vyšší přesnost klasifikace oproti výše zmíněným algoritmům.
reportyear 2008
RIV BB
permalink http://hdl.handle.net/11104/0148084
arlyear 2007
mrcbU63 cav_un_epca*0258518 Lecture Notes in Computer Science 0302-9743 Roč. 45 č. 4756 2007 417 426