
顔認識技術はもはやディストピアSF映画やCSI風の刑事ドラマのギミックではなく、より日常的な用途で使われるようになっています。例えば、iPhone Xのロック解除に顔認証を利用できます。また、ボストンからアルバ島やドミニカ共和国へジェットブルー航空で旅行する場合、顔認証で搭乗券を発行することもできます。このシステムは、米国税関・国境警備局の外部アルゴリズムによって照合されています。そして今、サングラスにカメラを取り付けたこの技術が、中国の警察官によって群衆の中で使用されていると、ウォール・ストリート・ジャーナルが水曜日に報じました。
この中国のシステムでは、警察官が携帯するインターネット接続されたモバイル端末に顔認証メガネに加えて、オフラインの顔認証データが含まれており、システムの迅速な動作を可能にしている。ウォール・ストリート・ジャーナルによると、ある都市の鉄道駅では、この方法を用いて犯罪に関与した7人に加え、偽名で旅行していた人物も逮捕されたという。
人工知能を活用したこのような技術が一般的にどのように機能するのか、そしてそこに潜む潜在的な落とし穴について解説します。(もちろん、監視国家的な側面はさておき。)
まず顔を探し、それから一致を探します。
顔認識ソフトウェアは一般的に2段階のプロセスを採用していると、イリノイ大学アーバナ・シャンペーン校の人工知能専門家でコンピューターサイエンス学科長のデイビッド・アレクサンダー・フォーサイス氏は説明する。第1段階は、対象画像内の顔の位置を特定することだ。システムは、一時停止標識や車といった現代生活によくあるものではなく、人物の顔が映っている窓のような部分を探す。
ステップ2:顔がデータベース内の顔と一致するかどうかを確認する必要があります。「これはステップ1と比べて難しい問題です」とフォーサイス氏は言います。「人は互いに似ている傾向があります」(少なくともアルゴリズムにとっては)。
システムは人間のように画像を単に目で見ているのではなく、数値で構成されたデータとして表現されている画像を見ているとフォーサイス氏は言う。「その表現は、唇、鼻、目といった顔の特徴の形状といった細部など、人々を互いに区別する要素を強調しなければなりません」と彼は指摘する。また、顔に当たる光など、認識を狂わせる可能性のある変数の影響を受けないようにする必要もある。ソフトウェアは、その表現を検査し、登録されている顔画像と一致するかどうかを確認する。
「ここ10年ほどで、分類技術は驚異的な進歩と変化を遂げてきました」と彼は付け加える。「画像の表現を構築する手順は、極めて洗練され、非常に効果的になりました。」
人工知能システムがその機能を効果的に学習するには膨大なデータが必要であり、顔認識技術も例外ではありません。「現時点で私たちが知っている最良の方法は、膨大な数の顔写真を用意することです」とフォーサイス氏は説明します。アルゴリズムは、人々を正確に区別するために、どのような微妙な詳細に焦点を当てるべきかを学習する必要があります。
誤一致問題
しかし、技術が高度化しているにもかかわらず、依然として難しい分野である。「取り違えが起きた場合、非常に悲惨な結果になりかねません」と彼は付け加える。つまり、誤検知が発生し、実際にはそうでない人物を容疑者と誤認してしまう可能性があるのだ。
中国のようなこの技術の使い方と、例えばiPhone Xで使う方法との間には、重要な違いがあります。スマートフォンの場合、デバイスのロックを解除するために意図的に自分の顔を見せることになります。つまり、リスクの低いやり取りです。なぜなら、もし認識されない場合はパスコードを入力するだけで済むからです。一方、Appleによると、他人が顔認証でロックを解除できる確率は100万分の1です。結局のところ、iPhoneは自分の顔の詳細を学習するだけでよく、それを3次元的に認識するのです。
しかし、空港や駅などの混雑した場所で、このような技術を使って多数の顔をスキャンしようとすると、誤照合の問題という特有の課題が生じます。誤照合の問題は、本人だけでなく、他の旅行者にも遅延を引き起こす可能性があります。「実際に使うのはかなり難しい場合があります」とフォーサイス氏は警告します。