同期された文字起こしテキストをHTML5ビデオに追加する

ビデオのない最新のウェブを想像することはすでに非常に困難ですが、そのようなプレゼンテーションでスピーチを直接知覚することはしばしば困難です。たとえば、聴覚障害のあるユーザー、ライブスピーチの聞き取りに不安がある人などの場合、HTML5はコンテンツの可用性を確保するのに役立ちます。字幕をメディアファイルにトランスクリプションで追加する機能、つまり音声のテキスト録音機能を提供します。



字幕はVTT形式のドキュメントによって設定され、<track>タグで元のビデオに追加されます。



<video class="span12 readable" poster="avas.jpg" controls tabindex="0" title=""> <source src="avas.m4v" type='video/mp4; codecs="avc1.42E01E, mp4a.40.2"' /> <source src="avas.ogg" type='application/ogg' /> <source src="avas.webm" type='video/webm' /> <track src="avas-transcript.vtt" label=" " kind="subtitles" srclang="ru" default /> </video>
      
      







VTTファイルは、特別にフォーマットされたドキュメントです。 番号付きのキュー、開始/終了時刻、テキスト自体が含まれています。 文字起こしテキストには、音声の録音だけでなく、話者の名前も含めることをお勧めします。 VTTのテキスト自体は、<i>や<b>などのいくつかの基本タグでフォーマットできます。

ドキュメントはWEBVTT宣言で始まります。



 WEBVTT 1 00:00:02.000 --> 00:00:07.000 <i>  :</i>   ? 2 00:00:09.000 --> 00:00:11.000 <i>  :</i> . 3 00:00:13.000 --> 00:00:18.000 <i>:</i>    ? 4 00:00:20.000 --> 00:00:21.000 <i>:</i> . 5 00:00:22.000 --> 00:00:27.000 <i>:</i>   ,  ? 6 00:00:29.000 --> 00:00:30.000 <i>:</i> ! 7 00:00:31.000 --> 00:00:34.000 <i>:</i>   ,  ?! 8 00:00:37.000 --> 00:00:38.000 <i>:</i> !!!
      
      







VTTファイルに加えて、TTML(Time Text Markup Language)も使用できます。TTML(Time Text Markup Language)は、Flashおよびその他の一般的なテクノロジでもサポートされている通常のXMLです。 したがって、FlashからHTML5に移行する場合は、既存のドキュメントをトランスクリプションで使用できるため、これが最良のオプションになる可能性があります。



 <tt xmlns="http://www.w3.org/ns/ttml" xml:lang="ru"> <body> <div> <p begin="00:00:2.00" end="00:00:7.00">   :   ? </p> <p begin="00:00:9:00" end="00:00:11:00">   : . </p> <!--   . --> </div> </body> </tt>
      
      







したがって、ビデオのサウンドを復号化し、マークアップされた文字起こしファイルを準備して、それを<video>タグに追加する必要があります。



特に大量の素材の処理に関しては、ビデオの転記を外部委託することができます。たとえば、政府のサイトでは、音声録音などの制限付きですべてのコンテンツにアクセスできるようにする必要があります。リソースへの聴覚障害の訪問者。



All Articles