논문 : https://arxiv.org/pdf/2104.13586.pdf 최근 행동 인식 분야에서 C3D 계열 모델이 높은 성능을 보여서 간단하게 정리를 해보려고 합니다. 논문에서는 행동 인식 분야에서 높은 성능을 보였던 Graph Convolution 기반이 아닌 관절 히트맵을 대상으로 3D Convolution을 진행하여 행동을 인식한다. 논문에서 제안하는 프레임워크의 구조는 다음과 같다. 입력받은 이미지에서 사람을 검출하고, 검출된 영역에 대해서 각 관절의 히트맵을 뽑는다. 각 프레임별로 추출된 히트맵을 쌓아 3D Heatmap Volume을 만들고 Convolution layers를 통과시켜 행동을 분류한다. 3D Heatmap Volume 논문의 핵심이 되는 3D Volume Heatmap은 ..