動画要約技術の基礎

この記事を読んでたら、動画要約の基礎というか一般的手法についてわかりやすく書いてあったのでそこで知ったことを書いておく。

動画要約手法

動画要約手法はいろいろあれど、基本的に以下の3段階で構成されているらしい。

1. 重要度の推定
2. シーンの分割
3. 重要度を考慮したシーンの選択による要約の作成

1で推定される「重要度」は、3でそのフレームを要約に組み込むかどうかの判定に用いられる。重要度は一定時間ごとに算出する場合もあれば、全フレームで算出する場合もある。

2に関しては

KTS(Kernel Temporal Segmentation)と呼ばれる手法がよく用いられる。映像が大きく切り替わった場面を検出し、区切り目とする手法だ。映像に絵的な変化が少ない場合には、シーンは長くなる傾向にある。

とのこと。しかしKTSは映画のように明確にシーンが切り替わるようなケースを想定している気がする。一発撮りなスマホで撮影した動画が対象の場合はどうなんだろう。

3のシーン選択は次のように行われるらしい。

30秒など決められた時間で、重要度の総和が最大になるように複数のシーンを選び取り要約を作成する。

ここから先は

160字
文章やサンプルコードは多少荒削りかもしれませんが、ブログや書籍にはまだ書いていないことを日々大量に載せています。たったの400円で、すぐに購読解除してもその月は過去記事もさかのぼって読めるので、少しでも気になる内容がある方にはオトクかと思います。

技術的なメモやサンプルコード、思いついたアイデア、考えたこと、お金の話等々、頭をよぎった諸々を気軽に垂れ流しています。

最後まで読んでいただきありがとうございます!もし参考になる部分があれば、スキを押していただけると励みになります。 Twitterもフォローしていただけたら嬉しいです。 https://twitter.com/shu223/