본문으로 건너뛰기
Tech Blog

Tech Blog

How to survive in the world of Artificial Intelligence.

[DeepLearning] 메타코드 강의 리뷰
메타코드의 딥러닝 입문 + Pytorch 실습 부트캠프 강의 리뷰
ACCDOA와 Multi-ACCDOA

ACCDOA의 개념과 도입 배경

SELD(Sound Event Localization and Detection)는 ‘어떤 소리 이벤트가 언제 발생했고(SED)’, ‘어디서 나는가(DOA)’를 동시에 예측해야 합니다. 기존에는 두 가지 목표를 동시에 해결하기 위해 다중 출력(branch) 혹은 다단계 구조를 사용했습니다. 예를 들어 SELDnet과 같은 two-branch 방식은 하나의 신경망에 SED 분류 출력과 DOA 회귀 출력을 별도로 두고, 두 손실 함수를 가중합하여 최적화했습니다. 이러한 접근은 두 과제를 균형 있게 학습시키기 위한 가중치 튜닝이 필요하고, 잘못 조율되면 한쪽 성능이 희생되는 문제가 있었습니다. 한편 두 과제를 완전히 분리해 별도 네트워크로 훈련하면 멀티모델로 인한 시스템 복잡도와 파라미터 수 증가 문제가 있습니다. 이러한 한계를 해결하기 위해 Activity-Coupled Cartesian DOA, 즉 ACCDOA가 제안되었습니다.


LEGGO1분 미만SELDACCDOAMulti-ACCDOA