<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type="text/xsl" href="style/detail_T.xsl"?>
<bibitem type="K">   <ARLID>0098540</ARLID> <utime>20240103185625.2</utime><mtime>20080124235959.9</mtime>         <title language="eng" primary="1">Informational Cathegorical Data Clustering</title>  <specification> <page_count>10 s.</page_count> </specification>    <serial><ARLID>cav_un_epca*0089863</ARLID><ISBN>978-80-01-03913-7</ISBN><title>Doktorandské dny 2007</title><part_num/><part_title/><page_num>57-66</page_num><publisher><place>Praha</place><name>Česká technika ČVUT</name><year>2007</year></publisher></serial>   <title language="cze" primary="0">Informační shlukování kategoriálních dat</title>    <keyword>EM algorithm</keyword>   <keyword>distribution mixtures</keyword>   <keyword>cluster analysis</keyword>   <keyword>cathegorial data</keyword>    <author primary="1"> <ARLID>cav_un_auth*0230019</ARLID> <name1>Hora</name1> <name2>Jan</name2> <institution>UTIA-B</institution>  <fullinstit>Ústav teorie informace a automatizace AV ČR, v. v. i.</fullinstit> </author>        <cas_special> <project> <project_id>GA102/07/1594</project_id> <agency>GA ČR</agency> <ARLID>cav_un_auth*0228611</ARLID> </project> <project> <project_id>1M0572</project_id> <agency>GA MŠk</agency> <ARLID>cav_un_auth*0001814</ARLID> </project> <project> <project_id>2C06019</project_id> <agency>GA MŠk</agency> <country>CZ</country> <ARLID>cav_un_auth*0216518</ARLID> </project> <research> <research_id>CEZ:AV0Z10750506</research_id> </research>  <abstract language="eng" primary="1">The EM algorithm has been used repeatedly to identify latent classes in categorical data by estimating finite distribution mixtures of product  components. Unfortunately, the underlying mixtures are not uniquely identifiable and, moreover, the estimated mixture parameters are  starting-point dependent. For this reason we use the latent class model only to define a set of ``elementary'' classes by estimating a mixture  of a large number components. As such a mixture we use also an optimally smoothed kernel estimate. We propose a hierarchical ``bottom up'' cluster analysis based on unifying the elementary latent classes  sequentially. The clustering procedure is controlled by minimum information loss criterion.</abstract> <abstract language="cze" primary="0">Shlukování kategoriálních dat je často řešeno hledáním tzv. latentních tříd pomocí EM algoritmu. Tento přístup ovšem závisí na počátečním řešení a naráží na problém neidentifikovatelosti směsi. Popisovaná metoda vyhledává shluky nikoliv jako jednotlivé komponenty směsi jako v případě latentních tříd, ale jako podsměsi vzniklé sloučením několika jednoduchých tříd z odhadnuté distribuční směsi s vyšším počtem komponent. Extrémní variantou takové směsi může být jádrový odhad, jehož optimální vyhlazení je v práci popsáno. V práci je dále představena metoda hierarchického shlukování s kritériem nejmenší informační ztráty.</abstract>  <action target="CST"> <ARLID>cav_un_auth*0232814</ARLID> <name>Doktorandské dny 2007</name> <place>Praha</place> <dates>16.11.2007</dates>  <country>CZ</country> </action>    <reportyear>2008</reportyear>  <RIV>BB</RIV>      <permalink>http://hdl.handle.net/11104/0157420</permalink>       <arlyear>2007</arlyear>       <unknown tag="mrcbU63"> cav_un_epca*0089863 Doktorandské dny 2007 978-80-01-03913-7 57 66 Praha Česká technika ČVUT 2007 </unknown> </cas_special> </bibitem>