기술-IT-인터넷 동향

기계를 위한 비디오 부호화 표준화 동향

지구빵집 2020. 10. 19. 12:10
반응형

 

기계를 위한 비디오 부호화 표준화 동향  

KEYWORDS: 비디오 부호화, 기계 시각, 기계를 위한 비디오 코딩 

사물인터넷, 스마트 시티, 자율 주행 차 등 다양한 응용 환경에서 수집되는 비디오 데이터의 양은 기하급수적으로 증가하고 있으며, 이를 기반으로 비디오의 객체나 이벤트를 인식하고 이를 분석하여 활용하는 서비스 요구 역시 지속적으로 증대되고 있다.

이에 덧붙여 방대한 비디오 데이터를 사람이 직접 감시 및 분석하는 것이 한계에 달함에 따라 사람 대신 기계가 비디오 내의 영상 정보를 분석하여 다음에 발생할 상황을 예측하여 사람에게 알려주거나 직접 능동적으로 대처하는 지능화, 자동화 요구사항이 점진적으로 증대되고 있다.

한편, 비디오를 수집하는 영상 획득 장치와 이를 분석, 활용하는 임무 수행하는 장치가 분리된 경우, 통상적으로 비디오 코덱을 사용하여 부호화하여 전송하고 이를 수신한 장치는 복호화한 비디오를 다양한 임무에 활용하는 방법을 취한다. 하지만, 비디오 데이터의 압축률을 높이면 영상 정보의 손실이 늘어나 임무 수행 성능이 떨어지게 된다.

특히 기존 비디오 코덱의 경우 HVS(Human Visual System) 특성을 고려하여 설계되었기 때문에 기계의 임무 수행에 필요한 영상 정보가 아님에도 인간 시각 인지에 중요한 특성 정보는 유지하는 비효율성이 존재한다.

따라서 기계에 임무 수행 성능을 유지하면서 비디오 데이터를 효율적으로 압축하기 위해서는 기계의 임무 수행에 초점을 맞춘 비디오 부호화 기술이 필요하다. 기존 영상 부호화 기술과 같이 사람을 위한 부호화와 새롭게 표준화가 진행되는 기계를 위한 부호화의 비교는 표 1과 같다 

 

표 1 사람을 위한 영상 부호화와 기계를 위한 영상 부호화 비교

비교항목 사람을 위한 영상 부호화  기계를 위한 영상 부호화
영상신호의 목적 사람에게 영상을 통한 정보전달 기계의 임무수행을 위한 정보전달
영상부호화 목표 인지화질을 유지하며 압축성능을 최대화 임무성능을 유지하며 압축성능을 최대화
영상부호화 복잡도와 전력소모량 압축성능 향상이 목표이므로 상대적으로 중요하지 않음 기계 간 실시간 연동을 위해 매우 중요
스마트시티 등을 위한 중앙집중처리 높은 복잡도로 인해 부적합 고압축률/저복잡도 구현이 가능하므로 적합

 

임무 수행 성능을 유지하며 다중 임무 수행을 위한 비디오 또는 비디오로부터 추출된 특징(Feature)의 압축 비트스트림의 기술표준 제정을 목표로 ISO/IEC JTC1 SC29 WG11(MPEG)에서는 2019년 7월 VCM(Video Coding for Machine) AHG이 결성되었다. 본 고에서는 이러한 MPEG VCM 기술에 대한 표준화 추진 현황 및 주요 이슈들에 대해 기술하고자 한다.

자세한 정보는 기계를 위한 비디오 부호화 표준화 동향 (기술동향자료)를 참고하시기 바랍니다. 

 

[전문가 강좌] 미디어 부호화 기술의 현재와 미래 http://www.itdaily.kr/news/articleView.html?idxno=100504

 

용어해설

기계 시각: 기계에 인간이 가지고 있는 시각과 판단 기능을 부여한 것으로 사람이 인지하고 판단하는 기능을 하드웨어와 소프트 웨어의 시스템이 대신 처리하는 기술

MPEG(Moving Picture Experts Group): 1988년에 설립되어 350여 명의 다양한 산업 및 학계 전문가가 참여하고 있는 멀티미디어 표준화 전문 그룹

VCM(Video Coding for Machine): MPEG Requirements 서브그룹 산하 AHG으로 기계를 위한 비디오 부호화 표준화를 목표로 다양한 표준화 준비 작업을 진행하고 있으며, 현재 2020년 10월 CfE 발간 예정임. 이를 통해 VVC 대비 성능 개선되는 다양한 기술 제안을 모집하여 표준화 진행 충분한지 확인하고자 함  

정보 출처: 기계를 위한 비디오 부호화 표준화 동향 Standardization Trends in Video Coding for Machines, DOI: https://doi.org/10.22648/ETRI.2020.J.350509 

 

 

 

반응형