Description:
První část přednášky se bude zabývat obecnými vlastnostmi EM algoritmu pro výpočet maximálně věrohodných odhadů parametrů distribučních směsí. Úvodem ukážeme ilustrativní příklad aproximace dvourozměrné směsi normálních hustot, naznačíme význam volby počtu komponent a počátečních parametrů a důsledky existence lokální řešení.
Důležitou vlastností EM algoritmu je monotonie posloupnosti hodnot maximalizované věrohodnostní funkce. Důkaz této vlastnosti představuje návod na využití EM algoritmu v obecnějším rámci. V této souvislosti připomeneme některé údaje z historie řešení problému odhadování směsí.
Po obecném úvodu se omezíme na speciální případ distribučních směsí s komponentami součinového typu, které mají řadu praktických výhod. Umožňují mj. zpracování neúplných dat, sekvenční řešení rozhodovacích problémů a statisticky korektní podprostorový přístup. Zvláštní pozornost bude věnována realizaci EM algoritmu při řešení problémů s velkou dimenzí s příklady kódu v C++.
Předmětem druhé části přednášky (předběžný termín 2.11.2010) budou příklady praktických aplikací součinových distribučních směsí v oblasti rozpoznávání, modelování textur, forenzní analýzy obrazových dat, analýzy mamogramů a statistického modelování dat.