UTIA - Library

bibtype

C - Conference Paper (international conference)

ARLID

0307438

utime

20240111140701.1

mtime

20080513235959.9

title (primary) (eng)

Time-domain Blind Audio Source Separation Using Advanced Component Clustering and Reconstruction

specification

page_count	4 s.
media_type	CD-ROM

serial

ARLID

cav_un_epca*0307437

ISBN

978-1-4244-2337-8

ISBN

978-1-4244-2338-5

title

2008 Hands-free Speech Communication and Microphone Arrays

page_num

216-219

publisher

place	Trento
name	IEEE
year	2008

title (cze)

Slepá separace audio signálů za použití pokročilého klastrování komponent a zpětné rekonstrukce

keyword

blind source separation

keyword

audio signals

author (primary)

ARLID	cav_un_auth*0108100
name1	Koldovský
name2	Zbyněk
institution	UTIA-B
full_dept	Department of Stochastic Informatics
fullinstit	Ústav teorie informace a automatizace AV ČR, v. v. i.

author

ARLID	cav_un_auth*0101212
name1	Tichavský
name2	Petr
institution	UTIA-B
full_dept	Department of Stochastic Informatics
fullinstit	Ústav teorie informace a automatizace AV ČR, v. v. i.

source

source_type	textový dokument
source_size	405kB

cas_special

project

project_id	1M0572
agency	GA MŠk
ARLID	cav_un_auth*0001814

project

project_id	GP102/07/P384
agency	GA ČR
country	CZ
ARLID	cav_un_auth*0227962

research

CEZ:AV0Z10750506

abstract (eng)

We present a novel time-domain method for blind separation of convolutive mixture of audio sources (the cocktail party problem). The method allows efficient separation with good signal-to-interference ratio (SIR) and signal-to-distortion ratio (SDR) using short data segments only. In practice, we are able to separate 2-4 speakers from audio recording of the length less than 6000 samples, which is less than 1-s in the 8-kHz sampling. The average time needed to process the data with filter of the length 20 was 2.2 seconds in Matlab v.-7.2 on an ordinary PC with 3GHz processor.

abstract (cze)

V práci je prezentována nová metoda slepé separace konvolutorních směsí audio signálů, pracující v časové oblasti. Metoda umožňuje efektivní separaci (měřeno pomocí poměru signálu vůči šumu a signálu vůči zkreslení) za použití pouze krátkých úseků dat. V praxi umožňuje separovat promluvy dvou až čtyř současně hovořících řečníků z audionahrávek získaných stejným počtem mikrofonů o délce 6000 vzorků, což při vzorkovací frekvenci 8kHz představuje méně než 1s. Výpočetní čas pro inverzní filtr délky 20 je 2.2s v Matlabu na běžném PC s 3GHz procesorem.

action

ARLID	cav_un_auth*0239497
name	Hands-free Speech Communication and Microphone Arrays 2008
place	Trento
dates	06.05.2008-08.05.2008
country	IT

reportyear

2010

RIV

permalink

http://hdl.handle.net/11104/0004593

arlyear

2008

mrcbU56

textový dokument 405kB

mrcbU63

cav_un_epca*0307437 2008 Hands-free Speech Communication and Microphone Arrays 978-1-4244-2337-8 216 219 Trento IEEE 2008