UNetGAN: A Robust Speech Enhancement Approach in Time Domain forExtremely Low Signal-to-noise Ratio Condition 논문 정리
Abstract - signal-to-noise ratio(SNR) 조건이 매우 낮은 speech enhancement은 매우 어려운 문제이고, 이전 연구에서 거의 조사되지 않았다. - 본 논문은 이 문제를 처리하기 위한 U-Net 및 생성적 적대적 학습(generative adversarial learning)에 기반한 강력한 음성 향상(speech enhancement) 접근법(UNetGAN)을 제안한다. - 이 접근법은 시간 영역에서 직접 작동하는 generative 네트워크와 discriminator 네트워크로 구성된다. - Generator 네트워크는 U-Net과 유사한 구조를 채택하고 병목 현상에 확장 컨볼루션(convolution)을 채택한다. - 우리는 공개 벤치마크에서 낮은 SNR 조건(..
2021.02.16