
韓国の電気技師2人が、職場で視聴すべきではないものの兆候を音声で検出する新しいポルノフィルターを開発した。音声を用いることで、顔や体の一部のクローズアップなど、肌の露出部分に誤認されやすい視覚的なポルノ識別要素(ポルノフィア)の問題を回避できる。
エンジニアたちはまず、音楽、ポルノ以外の動画、ポルノなど、様々な種類の音声のスペクトログラム(基本的にはサウンドクリップの視覚的表現)を作成することから始めました。これらのスペクトログラムを分析することで、ポルノの音声には、比較的容易に認識できるいくつかの独特な特徴があることを突き止めました。通常の会話は低音で、音楽は様々な音程があり、どちらも比較的一定である傾向があります。しかし、ポルノのスペクトログラムは、高音で、頻繁に変化し、かつ繰り返される特徴を示していました。
このデータを用いて、エンジニアたちは約93%の確率でポルノを正確に識別できるソフトウェアを開発しました。しかし、いくつかの問題点もありました。どうやら、笑い声を録音したシットコムはポルノのように聞こえるらしいのです(奇妙な事実です!)。また、ポルノはBGMを使うことで検閲をすり抜けてしまうこともあります。もちろん、画像認識によるポルノ識別器はほぼ同等の精度で、分析時間もはるかに短くて済みます(音声識別器はより長いクリップを必要としますが、画像認識による識別器は1フレームで済みます)。しかし、必ずしもどちらか一方である必要はありません。音声識別器と画像識別器を1つのスーパー検出器に統合し、ポルノを通過させないような、いわば「ガントレット」のような装置を作る可能性を考えている人もいます。
ニューサイエンティスト