ソフトウェアがホームビデオの最も面白い部分を識別し、退屈な部分を編集します ソフトウェアがホームビデオの最も面白い部分を識別し、退屈な部分を編集します

ソフトウェアがホームビデオの最も面白い部分を識別し、退屈な部分を編集します

ソフトウェアがホームビデオの最も面白い部分を識別し、退屈な部分を編集します

そもそも、子供がiPadで遊んでいる動画を丸々2分も見たい人がいるでしょうか? コンピュータサイエンスの博士課程に在籍するビン・ジャオさんは、自分の録画を一度も見ないと言います。「スマホにはたくさんの動画が保存されているのですが、実際にはほとんど見返していません」と彼はPopular Science誌に語っています。「主な理由は、動画自体が5分や10分程度の長さだからです。」

趙氏と指導教官であるカーネギーメロン大学のエリック・P・シン氏は、この問題に対する興味深い解決策を考案しました。彼らは、動画の退屈な部分を認識し、それを編集するアルゴリズムを開発しました。完成した作品は、まるで小さなハイライト動画のようです。ユーザーは、例えば30秒など、動画の長さを指定することもできます。これにより、はるかに分かりやすくなっています。「人々がオリジナルの動画を見たくないという思いから生まれたのです」と趙氏は言います。

趙氏と邢氏は、動画内の興味深い部分や重要な部分を自動的に認識しようと試みた最初のコンピュータ科学者ではありません。多くの研究者や企業が、監視カメラの映像に映る異常な動きをその場で検知するソフトウェアの開発に取り組んでいます。少なくとも1社は、この機能を備えたシステムを販売していると述べていますが、研究は現在も継続中です。重要なシーンを認識するプログラムは、ソーシャルメディア企業にとっても大きなメリットとなる可能性があります。インターネット上の友人と共有できる、簡潔で見やすい動画を作成できると想像してみてください。

「人々がオリジナルのビデオを見たくないというのが私たちの動機です。」

新しいアルゴリズムは、動画を処理する際に、見たものを説明する「辞書」を作成することで機能します。そして、常に「今何が起こっているのか、この辞書で説明できるか?」と自問します。答えが「いいえ」の場合、それは動画内で何か新しくエキサイティングなことが起こっていることを示しているため、アルゴリズムはそれを記録します。アルゴリズムはハイライト動画の作成を始める前に動画全体を見る必要はありません。このことと、Zhao氏とXing氏が用いたコーディング技術を組み合わせることで、アルゴリズムの処理速度が向上します。

Zhao氏によると、彼の新しいアルゴリズムは、どのシーンを抜粋するかの判断が異常に高速で、人間のようだという。このアルゴリズムは1時間のビデオを1~2時間で処理するが、科学文献に掲載されている同様のアルゴリズムは10~20時間かかる。アルゴリズムが人間と同じように「興味深い」シーンを選ぶかどうかをテストするため、Zhao氏とXing氏は3人にビデオを見せ、ビデオからハイライトするセグメントを選んでもらった。コンピューター科学者たちは次に、人間の選択とアルゴリズムの選択がどの程度一致しているかを調べた。20本の個人的なビデオのうち18本で、Zhao氏とXing氏のアルゴリズムは、テストした他の3つの競合アルゴリズムよりも人間らしい選択をした。2人はまた、地下鉄の駅に入る人などの状況を示すセキュリティタイプのビデオを5本チェックした。彼らは、自分たちのアルゴリズムともう1つのアルゴリズムが、他のアルゴリズムよりも優れた性能を発揮することを発見した。Zhao氏は今週、電気電子工学研究所が主催する会議でこの結果を発表する。

趙氏は現在、自身のソフトウェアを商用化するためにスタートアップ企業「PanOptus」を設立する計画を立てている。PanOptusのiPhoneアプリとAPIの開発も進んでいる。

Xing の息子のビデオで動作しているアルゴリズムを確認してください。