한국전자통신연구원(ETRI)이 인공지능(AI)으로 미디어를 정밀하게 분석하고 자동으로 생성하는 핵심기술을 선보였다.
ETRI는 17일(현지시각) 미국 라스베이거스 컨벤션센터에서 열린 세계 최대 방송장비 전시회 ‘NAB 2026’에서 미디어 지능화 기술 3종을 공개했다.
이번에 선보인 기술은 특수효과(VFX) 자동 제작과 3차원 자산(3D 에셋) 변환 등 제작 공정 효율을 획기적으로 높이는 데 중점을 뒀다.
ETRI 연구진이 공개한 '범용 장면 기술규격(USD) 기반 미디어 트랜스포메이션'은 기존 2D 영상에서 객체와 배경을 분리해 3D 에셋으로 자동 변환하는 기술이다.
이는 텍스트와 이미지 등 다양한 형태 데이터를 함께 처리하는 멀티모달 AI가 미디어 구성요소를 인식한 뒤 2D 좌표를 3D로 전환해 메타버스 공간에서 실제와 같은 환경을 손쉽게 재현한다.
'생성형 AI 기반 VFX 자동 생성 및 합성·편집 기술‘은 창작 효율을 극대화할 수 있다.
사용자가 텍스트나 이미지로 된 멀티모달 프롬프트(지시입력)를 입력하면 AI가 시공간 구성요소를 분석해 고품질 특수효과를 만든다.
이는 영화나 드라마 제작 시 막대한 시간과 비용이 드는 VFX 공정을 돕기 위해 기존 편집 소프트웨어에 추가하는 확장 모듈(플러그인) 형태로 제공한다.
아울러 장애인과 노약자 등 정보 취약계층의 디지털 접근성을 높이는 'AI 기반 사용자 환경/경험(UI/UX) 접근성 분석 및 대화형 문제해설 에이전트'도 선보였다.
이 기술은 모바일 앱 내 불편한 지점을 AI가 스스로 수집하고 분석, 대화형 에이전트가 개발자에게 구체적인 개선 방안을 제안해 앱 이용 장벽을 낮춘다.
커티스 레게이트 NAB 회장은 "ETRI가 선보인 기술은 글로벌 방송 산업이 직면한 디지털 전환의 해법을 제시한다"고 평가했다.
이태진 ETRI 미디어연구본부장은 “이번 대회에서 ETRI 디지털 미디어 이노베이션 기술 우수성을 널리 알리고 국내 미디어 기업의 세계 시장 진출을 선도하겠다”고 밝혔다.
이번 연구는 과학기술정보통신부의 'USD 기반 미디어 트랜스포메이션 기술 개발' 과제와 방송통신위원회의 '생성형 AI 기반 VFX 자동 생성 및 합성·편집 기술 개발' 과제의 지원을 받아 수행했다.















































