NHK TECH EXPO 2026에서는 전국 방송 현장과 지역국에서 탄생한 실용적인 기술 11건이 소개되었다. 드라마 제작의 음성 검색, 8K 촬영의 포커스 어시스트, 스포츠 영상 편집 AI, 수어 통역 지원 시스템, 심해 촬영 시스템 등 현장 과제 해결에 초점을 맞춘 기술들이 공개되었다.
💡 핵심 요약
- 드라마 제작의 음성 소재 검색 시간을 단축하는 AI 기반 시스템이 소개되었다.
- 8K 촬영 시 정확한 초점 맞추기를 돕는 LiDAR 및 AI 기반 포커스 어시스트 시스템이 공개되었다.
- 스포츠 영상 편집 효율을 높이는 AI 태그 시스템 ‘TORCH’와 다국어 번역 기능이 시연되었다.
- 수어 통역사를 위한 전자 큐 시스템 ‘Sign Cue’와 심해 생물 촬영을 위한 8K 시스템이 전시되었다.
NHK 기술연구소 공개와 NHK TECH EXPO 2026이 처음으로 같은 장소에서 개최되었다. 최첨단 연구 성과를 선보이는 기술연구소 공개와 달리, NHK TECH EXPO 2026에서는 ‘연결되는 지혜, 퍼져나가는 기술’을 주제로 전국 방송 현장 및 지역국에서 탄생한 실용적인 기술들이 소개되었다.
전시된 것은 본부와 지역국이 협력하여 개발한 11건의 노력이다. 프로그램 제작, 스포츠 중계, 접근성, 심해 촬영 등 장르는 다양하지만, 그 근간에는 현장이 안고 있는 과제를 기술로 해결한다는 공통된 발상이 자리 잡고 있다. 본 기사에서는 그중에서도 특히 인상 깊었던 5가지 전시를 소개한다.

드라마 제작의 ‘찾는 시간’을 줄이는 음성 검색 시스템
가장 먼저 소개할 것은 오사카 방송국이 개발한 ‘드라마 음성 포스트 프로덕션 소재 검색 시스템’이다.
드라마 제작 현장에서는 같은 장면을 여러 카메라와 화각으로 반복해서 촬영한다. 따라서 영상 편집이나 음성 마무리 단계에서 다른 테이크의 음성으로 교체하는 작업이 빈번하게 발생한다. 예를 들어 넓은 화각으로 녹화한 영상에서는 배우의 목소리가 충분히 녹음되지 않은 경우가 있다. 이럴 때는 별도로 녹음된 깨끗한 음성을 찾아 교체해야 한다.
하지만 기존에는 종이 대본에 적힌 메모에 의존하여 방대한 녹화 소재 중에서 목적의 음성을 찾아야 했다. 소재량이 많은 드라마 제작에서는 이 작업만으로도 큰 부담이 되었다.
이에 개발된 것이 3가지 종류의 AI를 조합한 검색 시스템이다.
먼저 OpenAI의 음성 인식 모델 ‘Whisper’가 녹화 소재를 빠르게 문자화한다. 이어서 다른 AI가 대본 데이터와 대조하여 인식 결과를 보정한다. 마지막으로 벡터 검색 기술을 이용하여 의미적으로 가까운 대사를 검색할 수 있는 시스템을 구현했다.
배우는 감정 표현에 따라 대본과 다른 표현을 할 수 있다. 기존의 키워드 검색으로는 찾을 수 없었던 대사도 이 시스템에서는 의미의 유사성을 바탕으로 후보로 추출할 수 있다.
예를 들어 ‘사과하다’라고 검색하면 ‘죄송합니다’와 같은 다른 표현을 포함한 테이크도 검색 결과로 표시된다. 화면상에서는 문자화된 결과를 확인하면서 즉석에서 음성 재생도 가능하므로, 목적의 소재에 단시간에 도달할 수 있다.
현재는 프로토타입으로 시험 운영 단계이지만, 소재를 찾는 시간을 줄여 음성 연출이나 품질 확인에 더 많은 시간을 할애할 수 있을 것으로 기대된다.
8K 시대의 초점 맞추기를 지원하는 포커스 어시스트 시스템
영상 제작 현장에서 과제가 되고 있는 것은 고해상도화에 따른 초점 관리이다.
센다이 방송국/미디어 기술국이 개발한 ‘포커스 어시스트 시스템’은 4K 및 8K 촬영 시 초점 맞추기를 지원하는 기술이다.
8K 영상에서는 파인더 상에서 맞춘 것처럼 보였던 초점이 대형 모니터로 확인하면 배경으로 빠져버리는 경우가 드물다. 해상도가 높아질수록 미세한 초점의 틀어짐도 영상 품질에 큰 영향을 미친다.
이 시스템은 LiDAR 센서를 이용한 거리 측정과 AI를 이용한 피사체 인식을 결합하고 있다.
화면상에서는 초점 위치를 빨간색, 그 주변을 녹색으로 표시하여 피사계 심도를 시각적으로 확인할 수 있다.
더불어 AI가 얼굴 등의 피사체를 인식하고 LiDAR로 측정한 거리 정보와 연동한다.
카메라맨이 대략적인 초점을 맞춘 후 어시스트 버튼을 누르면, 시스템이 정확한 거리 정보를 바탕으로 초점 링을 제어하는 방식이다.
렌즈별 특성은 사전에 데이터화되어 있어 다양한 방송용 렌즈에 대한 대응도 가능하다고 한다.
현실적으로는 GPU 처리 부하 관계로 초당 7~8프레임 정도의 처리 속도를 보이며, 빠르게 움직이는 피사체 추종에는 과제가 남아 있다. 그럼에도 불구하고 정지된 피사체나 완만한 움직임에는 충분한 효과를 발휘하고 있으며, 고정밀 영상 시대의 촬영 지원 기술로서 향후 발전에 기대가 모인다.
스포츠 영상 제작을 바꾸는 AI 편집 지원 도구 ‘TORCH’
영상 소재의 정리 및 검색이라는 과제는 스포츠 중계 현장에서도 공통적으로 나타난다.
이에 소개된 것이 스포츠 영상 편집을 AI로 효율화하는 앱 ‘TORCH’이다. 스포츠 중계 영상을 분석하여 ‘언제, 누가, 무엇을 했는지’를 자동으로 태그하는 시스템이다.
대규모 스포츠 이벤트에서 실증 운영도 진행되고 있으며, 영상 제작 현장에 즉시 적용 가능한 기능들이 다수 포함되어 있다.
실제 데모에서는 화면상의 선수 이름을 클릭하는 것만으로 해당 장면이 즉시 추출되었다. 방대한 소재 중에서 목적의 장면을 찾는 작업은 스포츠 편집에서 큰 부담이 되지만, 이 시스템을 통해 검색 작업을 대폭 효율화할 수 있다.
시스템은 자막 및 캐스터 음성을 분석하여 자동으로 태그를 지정한다. 따라서 사전에 선수 데이터베이스를 준비하지 않아도 영상 내 인물이나 플레이 내용을 높은 정확도로 정리할 수 있다.
더불어 현재 개발 중인 AI 채팅 기능에서는 ‘일본인 선수 중심의 3분 하이라이트 제작’과 같은 자연어 지시에도 대응한다. AI가 영상을 분석하면서 구성안을 작성하고 편집 작업을 지원하는 방식이다. 이용자는 대화 형식으로 내용을 수정할 수 있어, 기존보다 직관적인 편집 환경이 구현된다.
또한, 다국어 번역 기능도 탑재되어 있다. 해외 선수 인터뷰 영상에 대해서도 중국어, 이탈리아어 등을 일본어로 변환하면서 내용을 파악할 수 있어, 통역사를 거치지 않고 편집 작업을 진행할 수 있다.
작업 중인 프로젝트는 Adobe Premiere로 원클릭으로 인계 가능하며, 본격적인 마무리 작업으로도 원활하게 전환할 수 있다.
2026년 대규모 스포츠 이벤트에서의 테스트 운영을 거쳐 2028년 본격 운영을 목표로 하고 있다. AI에 의한 영상 분석과 편집 지원을 결합하여 스포츠 영상 제작 워크플로우를 크게 변화시킬 잠재력을 지닌 시스템이다.
수어 통역을 지원하는 전자 큐 시스템 ‘Sign Cue’
방송 현장의 효율화뿐만 아니라 접근성 향상을 목적으로 한 전시도 인상 깊었다.
Eテレ 등에서 볼 수 있는 수어 통역을 지원하는 시스템으로 전시된 것이 ‘Sign Cue’이다.
이것은 귀가 들리지 않는 농인 수어 통역사에게 아나운서나 사회자가 말하는 내용을 실시간으로 전달하기 위한 전자 큐 시스템이다.
특히 올림픽이나 패럴림픽 개폐회식과 같은 장시간 프로그램에서는 원어민 수준의 표현이 가능한 농인 통역사가 중요한 역할을 담당한다. 한편, 프로그램 진행은 반드시 대본대로 진행되지 않기 때문에 기존의 종이 큐 운영으로는 대응이 어려운 장면도 적지 않았다고 한다.
기존에는 대량의 종이 자료를 스태프가 관리하며 필요한 페이지를 찾아야 했지만, 진행 변경이 발생하면 목적의 정보에 도달하기까지 시간이 소요되었다.
Sign Cue에서는 Word, Excel, PDF 등 다양한 형식으로 전달되는 자료에서 자동으로 전자 큐용 데이터를 생성한다. 본방송 직전의 자료 수정에도 유연하게 대응할 수 있어 준비 작업의 부담을 대폭 줄일 수 있다고 한다.
운영은 정보 제시를 담당하는 메인 담당자와 검색을 담당하는 보조 담당자의 2인 체제로 이루어진다.
시스템은 방송 음성을 분석하여 키워드를 추출하는 외에도, 영상 내 인물의 얼굴 인식에도 대응한다. 예를 들어 입장 행진 순서가 변경된 경우에도 보조 담당자가 키워드나 인물 이름을 선택하는 것만으로 관련 큐를 호출하여 즉시 공유할 수 있다.
또한, 메인 담당자는 아나운서가 읽고 있는 위치를 화면상에서 확인할 수 있으므로, 농인 통역사는 어떤 정보를 우선적으로 전달해야 할지 파악하기 쉬워진다.
밀라노-코르티나 2026 동계 올림픽에서의 운영 실적을 바탕으로 개선이 거듭되어 왔으며, 방송 내용을 보다 정확하고 신속하게 전달하는 환경 구축이 진행되고 있다. 음성 인식 및 얼굴 인식과 같은 기술을 접근성 향상으로 직접 연결시킨 실용적인 노력이다.
심해라는 극한 환경에 도전하는 8K 심해 촬영 시스템
이번 전시 중에서 유독 존재감을 뽐냈던 것은 미디어 기술국에 의한 ‘8K 심해 촬영 시스템’이다.
전시장에는 NHK가 살아있는 실러캔스를 8K 촬영하는 데 사용된 실물이 전시되었다.

이 시스템은 유인 잠수정 외부에 설치된 8K 카메라를 잠수정 내부에서 완전 원격으로 조작하기 위해 개발된 것이다. 잠수정 내부에서는 카메라맨이 실제 모니터를 확인하면서 지상과 동일한 감각으로 촬영을 진행할 수 있다.

기술적인 특징은 방수 하우징과 잠수정을 연결하는 단 하나의 광케이블에 있다.

일반적으로는 영상 신호, 렌즈 제어, 카메라 제어 등 여러 배선이 필요하다. 하지만 이 시스템에서는 자체 개발한 광변환 장치를 통해 이들을 다중화하여 단 하나의 케이블로 전송하는 시스템을 구현했다.

이를 통해 심해라는 특수한 환경에서도 줌과 초점을 자유롭게 조작할 수 있다. 또한 녹화 장치를 잠수정 내부에 배치함으로써 기록 매체 교체나 장비 트러블에도 신속하게 대응할 수 있다.

더불어 수심 1000미터급 고수압에 견디기 위한 노력도 기울여졌다.
하우징 전면에는 압력을 균등하게 받는 반구형 돔 포트를 채택했지만, 그대로는 영상에 큰 왜곡이 발생한다. 이에 기존 렌즈 앞에 자체 설계한 보정 렌즈를 추가하여 왜곡을 상쇄함으로써 8K 화질을 유지하고 있다.

이 시스템은 NHK 스페셜 ‘딥 오션’ 시리즈 등에서 실제로 운영되고 있다. 생물과의 거리를 약 5미터로 상정하여 설계되었으며, 심해 생물의 모습을 고정밀 영상으로 기록할 수 있다.
잠수정이라는 제한된 공간 속에서 지상과 다르지 않은 촬영 환경을 구현하기 위한 노력이 곳곳에 담겨 있었다. 방송 기술의 최전선이 미지의 심해 세계 기록에도 활용되고 있음을 보여주는 전시였다.
현장 과제에서 탄생하는 방송 기술의 진화
NHK TECH EXPO 2026에서 소개된 기술에 공통적으로 나타난 것은 최첨단 기술 그 자체를 보여주는 것이 아니라, 현장이 안고 있는 과제를 어떻게 해결할 것인가라는 시점이다.
드라마 제작에서의 소재 검색, 8K 촬영 시 초점 관리, 스포츠 영상 편집, 수어 통역 지원, 그리고 심해 촬영. 각각 대상 분야는 다르지만, 모두 실제 운영 현장에서 발생한 과제에 대한 구체적인 해결책이었다.
NHK 기술연구소 공개가 미래 방송 기술을 보여주는 장이라면, NHK TECH EXPO 2026은 그 기술이 어떻게 현장에 침투하여 프로그램 제작 및 방송 서비스를 지원하고 있는지를 보여주는 장이었다. 연구 개발과 현장 운영 양쪽을 조망할 수 있었던 이번 동시 개최는 방송 기술이 현장 과제 해결과 함께 진화하고 있음을 강하게 인상시키는 계기가 되었다.
관련 글
- Blackmagic URSA Cine 17K 65, 인디 영화 ‘Bedlam’ 촬영 현장
- Boris FX, 영화적 질감 극대화한 Sapphire 2026.5 출시
- DJI RS 4 Pro 콤보(2026) 출시: 플래그십 짐벌과 SDR 영상 전송 결합
원문: 「NHK TECH EXPO 2026」レポート。放送現場の「困った」が技術に変わる。地域局と本部が共創した11の解法[Report NOW!]
