YouTube は、本日より、YouTube にアップロードされている動画から自動的に日本語のキャプションを生成する「自動キャプション」を提供いたします。自動キャプションは、Google の音声認識技術を使用し、動画の音声から自動的に字幕を生成します。
本日掲載されたばかりのテレビ朝日、ANN NEWS チャンネルの動画で試してみましょう。



動画の再生ボタンを押した後、画面右下から「CC」ボタンにマウスオーバーして、「音声を文字に変換BETA」を選択します。「音声文字変換は、Goolgeの音声認識テクノロジーを利用して、動画のキャプションを自動的に追加する試験サービスです。」という注意書きが表示されるので、「OK」をクリックします。



OK をクリックすると自動キャプションが表示されます。

この機能は、2009 年 11 月にまず英語を対象に提供されました。本機能は、実は耳の不自由なエンジニアが開発に携わっています。彼にとって、以前のテキストだけだったウェブでは、ほとんどの情報にアクセスすることができましたが、ウェブがリッチになるにつれて、動画や音楽など、彼にとって”アクセスできない” コンテンツが増えていきました。技術の力でこの問題を解決したいと考えて生まれたのが、「自動キャプション機能」です。

この機能の提供から 4000 万点以上の動画が英語の自動キャプションに対応し、実際に、耳の不自由な方が情報にアクセスするのを手助けするツールとして活用されています。さらに、自動キャプション機能が提供開始されてから、手動で字幕が付けられた動画数も3倍に増えました。

動画に自動的に字幕がつくことで、耳の不自由な方でも動画を楽しんでいただけるようになるだけでなく、動画の検索がしやすくなるというメリットもあります。さらにGoogle 翻訳の技術を活用して、日本語の字幕を 50 以上の言語に翻訳することができるので、世界中の方が日本発の動画を楽しめるようにもなります。

この機能を使うには、動画の右下の「CC」ボタンにマウスオーバーして「キャプションを翻訳BETA」を選択します。言語の選択画面をクリックすると言語の一覧が表示されるので、右の赤いタブをドラッグして翻訳する言語を探してクリックしてください。



自動キャプション機能はまだベータ版で、現在はニュース等の発声がクリアな動画で最も機能します。今後、YouTube では、誰もが、国境に関係なく、より多様な動画にアクセスできるよう改善を続けて参りますので、ぜひご期待ください。

今回、本機能について、全日本ろうあ連盟 からコメントをいただきましたのでご紹介します。

財団法人 全日本ろうあ連盟コメント:
「耳の聞こえない私たちにとって、テレビ放送や映画、インターネット画像等、あらゆる映像の音声を聞くことができないので、内容を理解することができません。全日本ろうあ連盟では聴覚障害者があらゆる映像作品を享受できるよう、関係省庁や機関等へ要望してまいりました。社会の理解は少しずつ広まりましたが、インターネット画像やDVDなども含めて、私たちが皆さんと同じように映像から情報を得たり楽しめたりできるようになるには不十分です。
このような状況の中、Google が英語版に次いで、YouTube に自動で日本語キャプションを付与できる機能を開発したことは、私たちにとって大変喜ばしいことです。Google が世界中の誰もがいつでもどこでも情報にアクセスできる「ユニバーサルアクセス」を使命として掲げ、それを着実に実現されていることは評価に値します。」

YouTube では今後も全日本ろうあ連盟から協力をいただき、耳の不自由な方々にもより多くの動画を楽しんでいただけるよう、日本語の自動キャプション機能の改善を進めてまいります。