본문 바로가기
미디어 트렌드

음성인식 기반 자동 자막 사용

by 위안소프트 2020. 6. 11.

영상 자막

끝없이 진화하는 카메라를 장착한 스마트폰의 보급과 유튜브와 같은 온라인 비디오 플랫폼의 증가로 우리는 매일 점점 더 많은 동영상을 생산하고 소비하고 있습니다. 이렇게 많은 동영상이 생산됨으로 인해 액세스 문제가 새롭게 제기되고 있습니다.

- 복잡한 세상에서 원하는 동영상을 어떻게 찾을까요?

- 청각장애가 있다면 새로운 동영상을 어떻게 볼까요?

- 자신에게 익숙하지 않은 언어로 제작된 동영상을 어떻게 이용할까요?

 

이러한 액세스 문제를 해결할 수 가장 좋은 방법은 자막입니다.

 

일반적으로 검색 엔진은 동영상의 내용을 알 수 없습니다. 최근 영상을 해석할 수 있는 알고리즘의 등장으로 서서히 바뀌고는 있지만, 기본적으로 검색 엔진은 텍스트만을 읽고 해석하도록 만들어졌습니다. 동영상에 무슨 내용이 들어 있는 지 세상 사람들에게 알릴 수 있는 가장 좋은 방법은 동영상을 텍스트로 설명하는 것입니다.

 

미국인의 15%가 청각 장애를 가지고 있다고 합니다. 발표자가 말하는 내용을 영상과 함께 제공하는 자막은 접근성을 위한 중요한 도구입니다. 모든 종류의 동영상에서 접근성은 필수적이지만, 동영상을 활용하여 가르치거나 배우는 분야에서는 특히 중요합니다.

 

자막은 한 언어에서 다른 언어로 언어간 번역 시 사용될 수 있는 좋은 방법입니다. 번역된 자막은 다양한 언어 시청자들이 동영상을 더욱 쉽게 접할 수 있게 해줍니다.

 

위에서 보듯이 동영상 콘텐트에 자막을 추가하면 접근성과 검색엔진 최적화(SEO) 측면에서 시청자와 제작자 모두에게 많은 이점을 제공하지만, 자막을 만드는 과정이 쉬운 것은 아닙니다. 그래서 많은 동영상 서비스 제공업체들은 자신들의 서비스에 음성인식 기반 자동 자막 생성 기능을 탑재하여 지속적으로 발전시키고 있습니다.

 

유튜브의 자동 자막

자막은 시청자가 콘텐츠를 쉽게 이용할 수 있도록 하는 효과적인 수단입니다. 유튜브는 음성 인식 기술을 사용하여 자동으로 동영상의 자막을 만들 수 있는 자동 자막을 지원합니다.

유튜브의 자막

일반적으로 자동 자막은 기계 학습 알고리즘에 의해 생성되므로 동영상마다 자막 품질이 다를 수 있습니다. 유튜브에서는 음성 인식 기술을 지속적으로 개선하고 있습니다만, 발음, 액센트, 사투리 또는 배경 소음으로 인해 자동 자막에서 음성을 잘못 표현할 수도 있습니다. 항상 자동 자막으로 생성된 자막을 검토하여 제대로 번역되지 않은 부분은 편집하거나 제거해야 합니다.

 

유튜브에서 VOD의 자동 자막은 한국어, 영어, 네덜란드어, 프랑스어, 독일어, 이탈리아어, 일본어, 포르투갈어, 러시아어 및 스페인어로 제공됩니다.

 

우선 크리에이터들이 제공하는 전문적인 수동 자막이 먼저 추천됩니다. 그렇지 않고 자동 자막을 사용할 수 있는 경우에는 이 자막이 동영상과 함께 자동 게시됩니다. 다만 동영상을 업로드한 시점에 자동 자막이 아직 준비되지 않을 수도 있습니다. 왜냐하면 자동 자막은 오디오의 복잡함에 따라 처리 시간이 달라집니다.

 

또한 시청자가 대신 콘텐츠 자막을 추가하고 번역할 수 있도록 동영상의 커뮤니티 자막 제공 기능을 사용 설정할 수도 있습니다.

 

동영상에 자동 자막이 생성되지 않을 경우 다음과 같은 이유 때문일 수 있습니다.

- 동영상의 복잡한 오디오를 처리 중이므로 아직 자막이 제공되지 않았습니다.

- 동영상에 사용된 언어로는 아직 자동 자막이 지원되지 않습니다.

- 동영상이 너무 깁니다.

- 동영상의 음질이 좋지 않거나 유튜브에서 인식하지 못하는 음성이 있습니다.

- 동영상의 시작 부분에 무음 상태로 길게 지속되는 구간이 있습니다.

- 여러 화자의 음성이 중복됩니다.

 

유튜브에서 라이브 스트림의 자동 자막은 영어로만 제공됩니다.

 

라이브 스트림의 자동 자막은 현재 구독자 1,000명 이상의 영어 채널을 대상으로 전문 자막이 제공되지 않는 기본 지연시간의 스트리밍 환경에서 제공됩니다. 크리에이터가 먼저 전문 자막을 제공하는 것이 좋습니다.

 

라이브 스트림이 끝나면 라이브 자동 자막은 없어지고 VOD 프로세스에 따라 자동 자막이 생성됩니다.

 

라이브 스트림에 자동 자막이 표시되지 않는 경우 다음과 같은 이유 때문일 수 있습니다.

- 구독자 1,000명 이상의 채널을 대상으로 점차 제공되는 기능이므로 채널에서 아직 사용할 수 없습니다.

- 채널이 모바일 라이브 스트림과 같이 초저 지연시간 또는 저 지연시간 환경에서 스트리밍을 하고 있는 경우, 라이브 자동 자막은 기본 지연시간 스트리밍 환경에서만 사용할 수 있습니다.

- 동영상에 사용된 언어로는 아직 자동 자막이 지원되지 않습니다.

- 동영상의 음질이 좋지 않거나 유튜브에서 인식하지 못하는 음성이 있습니다.

- 여러 화자의 음성이 중복되거나 여러 언어가 동시에 나옵니다

 

위안미디어의 자동 자막

위안미디어의 자동 자막

위안미디어는 비디오 스트리밍 플랫폼 구축 소프트웨어로 자동 자막 솔루션을 제공하고 있습니다. 위안미디어를 기반으로 구축된 미디어서버에 동영상이 업로드되면, 이 자동 자막 솔루션은 음성 텍스트 변환(STT) 기능을 이용해 동영상에 자막을 자동으로 추가합니다.

 

동영상에 자막이 포함되면 더 많은 사람들이 동영상에 액세스할 뿐만 아니라, 사람들의 동영상 시청 시간도 늘릴 수 있습니다. 자막이 있는 동영상의 경우 평균 12% 시청 시간이 늘어납니다.

 

동영상 자막을 사용하면 오디오를 사용하지 않고도 동영상 콘텐트를 이용할 수 있습니다. 도서관, 대중 교통, 시끄러운 식당 등 오디오가 부적절한 환경에서 사용자는 동영상을 보고 이해할 수 있습니다.

 

동영상 자막은 접근성을 개선하여 더 많은 사람들이 콘텐트를 이용할 수 있도록 합니다. 청각 장애가 있거나 난청이 있는 사람들에 이러한 자막은 대단히 반가운 일이며, 국가적인 장애인차별금지법 적용을 받는 기관에게는 꼭 필요한 기능이 될 수 있습니다.

 


※ 문의: (주)위안소프트, 02-793-8797, http://www.weandsoft.com