放送と通信の融合に欠かせない、放送メタデータ活用の現状
JX通信社では先日、朝日放送グループと連携して「大阪都構想」の共同特設サイトを開設しました。(プレスリリース)
JX通信社はFASTALERTやNewsDigestで知られていますが、実は世論調査の機械化にも取り組んでいます。そのノウハウを駆使した、異例の頻度で世論の動きを調べ続けるデータジャーナリズムです。
おかげさまで多くの方にご覧いただいているのですが、「いつテレビで紹介されてPVが伸びたのか」は、原始的にテレビを見ているしかない…(しかも当社は神保町にあるので、ABCをリアルタイムに見る方法がない)という事に気づきました。もちろんTV露出を報告してくれる調査会社もあるのですが、藤井はもともとラジオ局で放送のメタデータ(と放送の人は呼びます)関連の開発にも取り組んでいたこともあり、「放送のデータはどの程度メタデータとして取得できるのか」について、現状をまとめてみます。
EPG(電子番組表)
まず「メタデータ」としてみなさんがイメージするのは「番組表」だと思います。30代後半以上の方は、昔のビデオデッキに「Gコード」という謎の数字を入力した記憶があるのではないでしょうか。
あれは番組のチャンネルと放送時間を数字列にして、特定のロジックで数字の桁数を圧縮する技術でした。したがって、放送時間が変更になると追従できません。現在のデジタル放送ではEPG(電子番組表)データが、放送チャンネルの裏でデータ放送として流れていて、それがTVチューナーで常に更新されています。とはいえ、これはあくまでも「番組」単位の情報で、放送帯域としても限られた通信しかできませんので、コーナーやCMなどの内容が全部入っているわけではありません。
ラジオの場合は独特な歴史をたどっていて、特にFMはCD登場以前には比較的音質のよい音楽ソースだったことから、「エアチェック」という、テープに音楽番組を録音する趣味がありました。そのため、エアチェック専門誌が複数登場し、音楽番組のオンエア曲の「予定リスト」が事前に掲載されていました。いまでは事前にオンエア曲を予告する番組はほとんどありませんが、ラジオ局の「オンエア楽曲リスト」ページが充実しているのは、そういった背景もあります。
EPGやオンエア楽曲リストなどのメタデータはradikoやTVerなどのサービスにももちろん活用されているのですが、実はそのデータだけではこういったサイマル配信サービスの運用には十分ではありません。権利処理に必要な、コーナー・CMなどの情報が含まれていないからです。そういったより詳細な運行データを司るシステムは局によって(あるいは所管している部署や設計思想によって)「営放システム」とか「APS」とか呼ばれたりしますが、スポンサーとの契約・請求から素材の管理、放送確認書の発行まで連携する巨大なシステムなので、なかなかこのデータをオープンデータとして引っ張り出すのは大仕事です。特に野球中継のある放送局では、「階段編成」と呼ばれる、延長放送に対応した放送予定の変更に対応する機能があり、その複雑さは想像を絶します。
テレビ調査会社
どこかのワイドショーで、「今週この話題について全局で放送された総時間」をもとにランキングをするような企画があったと思いますが、あれは調査会社が人力で調査をして、販売しているデータを元にしています。CMの放送時間もこういった会社が調査をしています。
こういった会社が作成しているデータは幅広く活用されていますが、当然のことながら、放送局が公式に作成したものではありません。放送局自身もこういったデータを完成形で持っていないので、逆に業務用途で買うようなこともあるようですが、権利処理的に若干難しいところもあり、このデータを多人数の目に触れるような形で活用したサービスはあまり目にする機会が無いようです。
ところで、むかしのアナログビデオデッキのCMスキップ機能って、あれは「音量の変化」や「モノラルからステレオに変化したところ」を検知していたんですよね。それで判定ができていた。いまのデジタルテレビではそれでは判定できないので、もっと複雑な画像検知が行われているはずですが、大変牧歌的な時代でした。
字幕
ところで、あまり見る機会がないかもしれませんが、地デジ放送のかなりの割合では、データ放送で字幕が付与されています(字幕をオンにする方法、説明書で調べてみてください。ちなみに聴覚障害者の方に人気なのはシャープのテレビです。字幕の表示位置の調整ができるかららしい)。
この字幕、CC(クローズドキャプション)とも呼ばれ、米国ではバリアフリーに関する規定として、かなり高い割合で番組に付与されています。NetflixなどのVODサービスも多言語化を前提としているので、字幕付与率が高いサービスです。
この字幕を使えばかなり番組のメタデータは作れるんじゃん…?と思いきや、実は日本のテレビ番組では字幕の付与率がまださほど高くなく、国策としてもその付与率を高めるよう、働きかけがなされています。最近はテレビCMにも字幕データを付けるスポンサーが少しずつ増えてきました(化粧品メーカーのCMなどで「字幕」というマークが出るの、気づいていますか?)。
日本のテレビ番組の字幕の問題点は、「生放送番組が多く、リアルタイムに字幕を打つオペレータが足りない、予算も足りない」「映像にテロップが多用されるため、途中からテロップに任せて端折られている字幕もあり、全文にはなっていない」など、あげたらきりが無いのですが、本当にいろいろと問題がありまして…ちなみにNHKでは、番組の内容を訓練を受けたオペレータが読み上げ直して、それを音声認識し、人間がダブルチェックする「リススピーク方式」というシステムがあります。地方のインタビューなど、いろんな人が大量に出てくるNHKならではの必要性に迫られたシステムだと思います。
自動音声認識にほぼ完全に委ねる方式も、熱心に開発されています。NHKでは手話映像も自動生成する研究をしているので、本当にバリアフリーに関してNHKは日本の研究の総本山という感じです。
テレビ字幕データを使った全文検索の例
完全なものではないものの、せっかくあるのだから活用しようということで、例えばガラポンTVでは、ワンセグ映像と字幕データを全局録画して、それを横断検索できる機能を提供しています。
私も一時期使っていましたが、うーん、実用的かというと微妙なラインかな、と思いつつ、特定の商品が紹介された番組を探す、といった用途では、そこそこ役に立ちました。
SoundUDテレビ字幕トライアル
総務省では、こういった字幕に関する様々な問題を解決してバリアフリーを推進するために、テレビ局ではなく、外部で簡易字幕を実現する方法を模索しています。その取り組みが、ヤマハの「SoundUD」技術と、国の研究機関であるNICTの音声認識技術を活用した以下の実証事業です。
(写真にしれっと私も写ってますが)これはテレビ局・ラジオ局の協力で放送音声をNICTの音声解析エンジンに通し、その解析結果をアプリを通じて配信するものです。見ている番組とアプリが連動するよう、番組には非可聴域に音声トリガー(SoundUD)を埋め込んで、それをスマホのマイクが認識します。
音声認識エンジンの精度の問題もあり、BGMが大きく入った番組はなかなか解析ができないので、スタジオのミックス前の音声を渡してみたり、いろいろな工夫を裏では行っています(一部のニュース番組では、そのまま放送音声を使っているようです)。また、テレビ自体の字幕放送ではなく、外部のサービスとして提供することには、放送局側の負担を減らす他に、仮に音声認識が間違えた書き起こしがあったとしても、放送そのもので提供したものではない、という責任分界点が作れる、という大人の事情としてのメリットもあります。放送で間違った事実を伝えたら放送上で訂正しなければならない、というのは放送法に規定された重要なルールなので、文字字幕であろうが、それは適用されます。
書き起こしニュース
放送を文字にしたもののニーズは、各局がさかんに放送の宣伝やオンラインサービスの拡充、放送外収入の確保の目的で制作しているニュースサイトでもあります。私も「TOKYO FM+」というサイトを立ち上げました。このサイトは少なくともラジオ局においては、自社運営による番組書き起こしニュースサイトの最初期のものだったと思われます。
こういった書き起こしニュースサイトは、第三者のニュースメディアが勝手に番組の一部分を抜き出して書き起こして、本当の番組の意図から逸脱した形で拡散するような事態(こういった記事を「コタツ記事」=コタツに入りながら書いたような記事、と言うそうです)を抑制したい、というニュースキュレーションサービス側の社会的要請もあり、多くのキュレーションサービスで配信が受け入れられた結果、見逃し配信サービスへの顧客誘導のニーズと相まって、大きく広がっています。一方、その記事制作は事実上、「番組を人力で書き起こして、関係者のチェックを通して、配信する」という力技に頼っています。
そういった制作現場の「書き起こし地獄」を少しでも効率化しようと、TBSは自社で開発した書き起こし支援サービスを、外販するようなことを取り組んでいます。記事の形にするために、最後は人間が編集する必要があるので、その手前の部分をできるだけ効率化するものです。
まとめ
Webから放送への連携が数多く取り組まれる中、放送からWebへの連携は、radikoやTVer、NHK+など、「放送が同時に出る」ところにやっと至ったところです。そのサービスの高度化や、膨大な過去のコンテンツ資源の活用に、「内容をいかにメタデータにするか」は欠かせないパーツであり、VODサービスが先行してその部分に莫大な投資をする中、放送メディアが今まさに立ち向かっている技術領域です。
JX通信社は放送をはじめ、報道機関の業務を少しでも技術によって効率化し、本来人間が取り組むべき調査取材などにリソースを割いていただけるように、様々なプロダクトを開発してきた会社です。そのミッションは報道のみならず、防災・安心安全を中心に、ビッグデータで「事実」を明らかにしてお届けする、という範囲に拡大していますが、引き続き、放送と通信の双方向での理想的な連携について、考えていきたいと思っています。
【PR】JX通信社では現在、Webマーケター、UI/UXデザイナーを特に募集していますが、非技術領域のスタッフであっても、持ちうる技術を「どのように」社会に適用するのかの議論に積極的に関われるのが、JX通信社のビジネスの面白いところだと思っています。そんな私もよく間違われますが、技術者ではなく、企画・編成・営業・法務がコア領域です(コアって言いながらなんで4つあるんだ)。
自分の仕事(地方自治、防災、AI)について知ってほしい思いで書いているので全部無料にしているのですが、まれに投げ銭してくださる方がいて、支払い下限に達しないのが悲しいので、よかったらコーヒー代おごってください。