bibtype C - Conference Paper (international conference)
ARLID 0307438
utime 20240111140701.1
mtime 20080513235959.9
title (primary) (eng) Time-domain Blind Audio Source Separation Using Advanced Component Clustering and Reconstruction
specification
page_count 4 s.
media_type CD-ROM
serial
ARLID cav_un_epca*0307437
ISBN 978-1-4244-2337-8
ISBN 978-1-4244-2338-5
title 2008 Hands-free Speech Communication and Microphone Arrays
page_num 216-219
publisher
place Trento
name IEEE
year 2008
title (cze) Slepá separace audio signálů za použití pokročilého klastrování komponent a zpětné rekonstrukce
keyword blind source separation
keyword audio signals
author (primary)
ARLID cav_un_auth*0108100
name1 Koldovský
name2 Zbyněk
institution UTIA-B
full_dept Department of Stochastic Informatics
fullinstit Ústav teorie informace a automatizace AV ČR, v. v. i.
author
ARLID cav_un_auth*0101212
name1 Tichavský
name2 Petr
institution UTIA-B
full_dept Department of Stochastic Informatics
fullinstit Ústav teorie informace a automatizace AV ČR, v. v. i.
source
source_type textový dokument
source_size 405kB
cas_special
project
project_id 1M0572
agency GA MŠk
ARLID cav_un_auth*0001814
project
project_id GP102/07/P384
agency GA ČR
country CZ
ARLID cav_un_auth*0227962
research CEZ:AV0Z10750506
abstract (eng) We present a novel time-domain method for blind separation of convolutive mixture of audio sources (the cocktail party problem). The method allows efficient separation with good signal-to-interference ratio (SIR) and signal-to-distortion ratio (SDR) using short data segments only. In practice, we are able to separate 2-4 speakers from audio recording of the length less than 6000 samples, which is less than 1-s in the 8-kHz sampling. The average time needed to process the data with filter of the length 20 was 2.2 seconds in Matlab v.-7.2 on an ordinary PC with 3GHz processor.
abstract (cze) V práci je prezentována nová metoda slepé separace konvolutorních směsí audio signálů, pracující v časové oblasti. Metoda umožňuje efektivní separaci (měřeno pomocí poměru signálu vůči šumu a signálu vůči zkreslení) za použití pouze krátkých úseků dat. V praxi umožňuje separovat promluvy dvou až čtyř současně hovořících řečníků z audionahrávek získaných stejným počtem mikrofonů o délce 6000 vzorků, což při vzorkovací frekvenci 8kHz představuje méně než 1s. Výpočetní čas pro inverzní filtr délky 20 je 2.2s v Matlabu na běžném PC s 3GHz procesorem.
action
ARLID cav_un_auth*0239497
name Hands-free Speech Communication and Microphone Arrays 2008
place Trento
dates 06.05.2008-08.05.2008
country IT
reportyear 2010
RIV BI
permalink http://hdl.handle.net/11104/0004593
arlyear 2008
mrcbU56 textový dokument 405kB
mrcbU63 cav_un_epca*0307437 2008 Hands-free Speech Communication and Microphone Arrays 978-1-4244-2337-8 216 219 Trento IEEE 2008