
ここをクリックすると、役に立たない写真が識別可能な顔に変わる様子を見ることができます。
ジム・マクレランド刑事がボタンをクリックすると、髭を生やし、無表情でカメラから目をそらす容疑者の粗いクローズアップ映像がコンピューターモニターから消えた。二次元静止画の代わりに、三次元で鮮明にレンダリングされた、肉体のない仮想の頭部が実体化した。マクレランド刑事は容疑者が正面を向き、目が画面からまっすぐに見つめるまで、頭部を回転させ、傾けた。
それは泥棒の顔だった。フィラデルフィア郊外のコンビニエンスストアの通路を何気なく歩き回り、盗難クレジットカードで買い物をしていた男の顔だ。警察はこの違法販売を追跡し、店舗の監視カメラからこの画像を入手した。マクレランドが初めてこの画像を顔認識ソフトウェアにかけたところ、結果は役に立たなかった。遠隔地のサーバーで稼働しているアルゴリズムが、州の既知の犯罪者リストから数百人の候補を抽出したのだ。しかし、どれも容疑者のプロフィールと十分に類似しておらず、更なる捜査を必要としていた。
全く驚くべきことではなかった。マクレランド刑事とチェルトナム・タウンシップ警察がペンシルベニア州の顔照合システムに初めてアクセスした2007年以来、顔認識ソフトウェアは実用的な結果を出せないことが常だった。逮捕時の顔写真は正面を向いているが、路上であれ天井に設置された監視カメラであれ、「自然」に撮影された被写体はレンズをまっすぐに見つめることは稀だ。刑事は行き詰まりに慣れてしまっていたのだ。
しかし2012年以降、州はシステムを全面的に見直し、ポーズ補正ソフトウェアを導入した。これにより、マクレランド刑事をはじめとする訓練を受けた警官は、被写体の顔をカメラに向けることができるようになった。私が刑事の肩越しに見守る中、彼は犯人の顔の修正を終え、画像を再提出した。サムネイル写真が画面いっぱいに並ぶ。マクレランド刑事は、提出された画像と数学的に最も類似していると判断された、最有力候補の画像を指し示した。
一致した。刑事はこれを事実だと知っている。問題の容疑者は昨年、クレジットカード詐欺で逮捕・有罪判決を受けているからだ。マクレランド氏はこのデモンストレーションを、新しい顔認識ソフトウェアの威力とその可能性を私に見せるために選んだ。粗雑なスクリーンショット一枚だけで、彼の郊外警察署は350万件の顔データベースから犯人を絞り出すことができるのだ。
この夏、顔認識ソフトウェアの活用範囲はさらに拡大するだろう。FBIは次世代身元確認(NGI)プログラムの一環として、1600万枚以上の顔写真へのアクセスを全国規模で展開し、地方警察と州警察もさらに数百万枚を提供する予定だ。これはこの種のデータベースとしては最大かつ最も包括的なものであり、これまで比較的限定的な捜査ツールだった顔写真が、法執行機関にとってより広範な活用手段となるだろう。社内に顔照合ソフトウェアを持たない警察官(圧倒的多数)は、ウェストバージニア州クラークスバーグにあるFBIのサーバーに顔写真を送信することで、アルゴリズムによって2人から50人の候補者がランク付けされたリストが返される。
12億ドル規模のNGIプログラムは、すでに顔以外の情報も収集している。そのリポジトリには指紋や掌紋が含まれており、虹彩スキャンや音声パターンといった他の生体認証マーカーも組み込まれる可能性がある。しかし、顔は他の多くのマーカーとは異なり、同意や特別な機器なしで収集できるため、どんなカメラ付き携帯電話でも利用できる。そのため、顔は特に悪用されやすい。国家安全保障局(NSA)が何年にもわたって数百万件もの電子メールアカウントを監視したPRISMスキャンダルから得られる教訓があるとすれば、それは国民の保護とプライバシーの侵害の境界線が曖昧になりやすいということだ。
FBIがNGIを全米に展開する準備を進める中、合理的な答えはこうだ。顔認識技術は、未解決事件や行方不明の子供を減らし、刑務所に収監される犯罪者を増やすことなく、より安全で安心な世界を実現できるのか?そして、私たち全員の匿名性を損なうことなく、それが実現できるのか?
***
FBI身元確認部門は1924年の設立以来、犯罪者に関するデータを収集してきました。その始まりは、最も古くから用いられた生体認証マーカーである指紋でした。当初はインクで汚れたインデックスカードの山に断片的に集められていましたが、現在では約1億3500万点のデジタル化された指紋を保管しています。初期の鑑識専門家は、犯罪現場から採取した指紋の渦巻きや弧を、既存のファイルに保存されている指紋と照合する作業を目視で行わなければなりませんでした。1980年代にコンピューターによる指紋分析の自動化が始まると、数ヶ月かかることもあったこの作業は数時間に短縮されました。専門家は現在、指紋照合のほとんどを「完全自動」作業と呼んでいます。これは、人間が夜に帰宅する間にコンピューターアルゴリズムが処理できる作業です。
指紋から口ひげが生えたり、DNAからサングラスが生まれたりはしません。しかし、顔には毛が生えたり、時間の経過とともにたるんだりすることがあります。
マッチングアルゴリズムはすぐに進化し、DNA鑑定、顔認識、その他の生体認証分析が可能になった。そして指紋の場合と同様、FBIはしばしば新しい生体認証マーカーの収集を主導した(たとえば1994年には初の全国DNAデータベースを構築)。13か所の異なる染色体位置の比較を含むDNA分析の信頼性は極めて高く、すべての一致の99.99%が正しい。一方、完璧な指紋に至らない指紋分析は確実性に欠ける。FBIによると、遺留指紋(犯罪現場に残された通常かすかな、あるいは部分的な痕跡)がデータベース内のものと正しく一致する確率は86%あるという。ただし、これは持ち主の指紋がファイルされていることを前提としている。これは間違った人物が特定される確率が14%あるという意味ではない。DNA分析と指紋分析はどちらも偽陽性が非常に少ないため、法廷で証拠として認められる。
一方、顔認識は対象者を特定することは決してなく、せいぜい更なる調査の可能性を示唆するに過ぎません。これは顔が変化する可能性があるためです。指紋から口ひげは生えず、DNAからサングラスを掛けることもできません。しかし、時間や状況によって顔に毛が生えたり、たるんだりすることはあります。また、人々は互いに似ていることもあります。それは、特徴が似ている場合もあれば、低解像度の画像がアルゴリズムにそう思わせる場合もあります。
こうした制約の結果、NGIを含め、どのシステムも単一の確定候補を提示するのではなく、複数の候補を提示する。顔照合ソフトウェアは、たとえ完全に間違っている場合でも、ほぼ常に何らかの回答を出す。NGIプログラムマネージャーのケビン・リード氏は、高品質のプローブ(提出された写真の専門用語)を使用すれば、約80%の確率で正しい第一候補が提示されると推定している。しかし、この精度評価は誤解を招くものだ。マクレランドのような警察官が滅多に手にすることのない種類の画像を前提としているからだ。

チェルトナム警察署を訪問中、別の刑事がプリントアウトを持ってマクレランドの個室に立ち寄った。「これ、使えますか?」と彼は尋ねた。マクレランドは、まだら模様で表現主義的なピクセルの寄せ集めのような静止画をほとんど見ずに、首を横に振った。「このシステムを何度も使ってきたので、試してみるべきかどうかはほぼ分かっています」と彼は言った。毎週送られてくる何十枚もの写真のうち、1枚か2枚は流用するかもしれない。確実にヒットするとしても、武装強盗や暴行事件でヒットすることは稀で、殺人事件でヒットすることは決してない。
凶悪犯は顔を隠す傾向があり、通常は人前で犯行に及ぶことはない。もしカメラが偶然その様子を捉えたとしても、マクレランド氏によると「ただの万引き犯ではなく、走ったり速足で歩いたりしている」という。この時点で、顔認識は小規模な犯罪者を捕まえるのに最も適している。クレジットカードが盗まれ、ギフトカードや粉ミルクの購入に使われた場合(どちらも転売価値が高いため人気があるとマクレランド氏は言う)、照合ソフトウェアが救いの手を差し伸べるかもしれない。
技術の精度向上は、ある意味ではFBIの手に負えない。法執行機関は独自のアルゴリズムを開発しているわけではない。民間企業が書いた独自のコードを使用するために費用を払い、斬新な手法を開発する研究者に資金を提供しているのだ。顔認識を真に強力なツール、つまり議論に値するツールへと進化させるのは、生体認証研究コミュニティの責任だ。
***
2011年8月、ロンドン全域で暴動が勃発した。警察による致命的な銃撃事件への抗議として始まった暴動は急速にエスカレートし、5日間にわたり放火と略奪が横行した。暴動直後、当局は2012年夏季オリンピックに向けて開発中と報じられた顔認識技術を導入した。「容疑者の画像が6000枚撮影されました」と、世界中のシステムにアルゴリズムが使用されているドイツ企業コグニテックのマーケティングマネージャー、エルケ・オーバーグ氏は語る。「そのうち、角度と画質が十分に優れていたものが1枚ありました」
顔認識は、カメラレンズにこびりついた汚れから、野球帽を深くかぶった状態まで、様々な要因によって妨げられる可能性があります。しかし、この技術における最大の分析課題は、概ねAPIER(老化、ポーズ、照明、表情、解像度)という頭文字で要約されます。
正面を向いたマグショットは、人物の顔の特徴を示す2次元マップを提供し、アルゴリズムを用いて特徴間の距離のユニークな組み合わせを測定・比較することを可能にします。しかし、人間の顔の地形は加齢とともに変化します。顎、顎のライン、そして特定の肖像の境界を構成するその他のランドマークは、伸縮します。ポーズや表情の変化も、これらの測定値に誤差をもたらします。頭を傾けると目と目の間の距離が縮むように感じられる場合があり、笑顔は口元を歪ませ、顔全体の形を変えてしまうことがあります。さらに、照明が不十分な場合やカメラの解像度が低い場合も、顔の特徴が不明瞭になる傾向があります。
生体認証研究者は、これらの課題に対処するため、ソフトウェアを訓練し、各アルゴリズムを無限の一連の探索にかけることで対応してきました。また、日本に拠点を置くコグニテックやNECなどの企業は、画像品質の低さ、極端な角度、その他の欠陥によって生じる例外を考慮に入れるようプログラムに学習させています。こうした改良は大きな進歩をもたらしました。10年前、被写体を5年前の参照写真と照合するには、精度が25%、つまり年間5%低下する必要がありました。今日では、精度の低下は年間1%にまで低下しています。
コンピューター科学者たちは現在、これらの成果に加えて、品質の低い写真の影響を軽減し、膨大な数の新たな画像プールを提供するソフトウェアを開発しています。現在導入されている最も優れた例は、ペンシルベニア州でマクレランド氏が私に見せてくれた「ForensicaGPS」と呼ばれる3Dポーズ補正ソフトウェアです。ニューハンプシャー州に拠点を置くアニメトリクス社がこのソフトウェアを2012年にリリースしました。同社は正確な数字を公表していませんが、ニューヨーク市警やペンシルベニア州の州内ネットワークなど、世界中の法執行機関で使用されています。
2D画像を3Dアバターに変換する前に、マクレランド氏は様々な十字線を調整し、被写体の目、口、顎などの特徴とより正確に一致するように位置を微調整します。その後、ソフトウェアは顔の詳細な数学モデルを作成し、鼻や頬骨の長さや角度など、標準的な2D中心のアルゴリズムでは見逃したり無視したりするデータを取得します。アニメトリクスのCEO、ポール・シューップ氏は、この技術は「誰の顔照合システムも大幅に向上させる」と述べています。
ソーシャル メディアには、顔認識にまさに必要なもの、つまりカメラに向けられた高画質の顔写真が数十億枚あり、その多くは ID に直接結びついています。
世界有数の生体認証専門家、アニル・ジェインは、ミシガン州立大学(MSU)で、捜査に必要な写真を完全に排除できるソフトウェアを開発している。「FaceSketchID」と呼ばれるこのソフトウェアの最も顕著な機能は、法医学的スケッチ(警察のスケッチアーティストが描くようなもの)と容疑者の顔写真を照合することだ。また、画質の悪い動画も利用できる可能性があるとジェインは言う。「画質の悪い動画や横顔しか映っていない動画でも、被写体の正面のスケッチを作成し、それをシステムに取り込むことができます。」
言い換えれば、スケッチアーティストは、殺人事件の目撃証言ではなく、犯人とされる人物の粗く、角度がずれていたり、部分的に隠れているビデオ静止画 1 枚以上に基づいて肖像画を作成できます。これは、暗くピクセル化された顔から細部を引き出すハリウッド スタイルの画像補正の手描き版と考えてください。訓練を受けたアーティストは、適切な角度と照明で顔を作り直し、寄りの眉や鷹のような特徴的な鼻など、特徴的な部分を強調して、画像の修復を行うことができます。その後、その絵がプローブとして使用され、自動スケッチ ID アルゴリズムが対応する特徴を持つ写真を見つけようとします。アーティストの細部へのこだわりを反映して、コードは、類似した包括的な顔のマップを見つけることよりも、目立つ特徴、つまり類似した眉や鼻を発掘することに重点を置いています。
2011年から開発が進められていたこのシステムは、本稿執筆時点では完成したばかりで、ジェイン氏は数ヶ月以内に認可されると見込んでいる。彼が率いるもう一つのプロジェクトは、監視チームや高性能CCTVシステムで使用されている赤外線映像から顔の輪郭を抽出できるアルゴリズムの開発だ。酒屋の強盗は赤外線映像で捕まることはないが、テロ容疑者の追跡や国境検問所での監視といった、より標的を絞った作戦においては、ジェイン氏のアルゴリズムが、著名な標的を捕らえるか、あるいは単に匿名の旅行者を記録するだけかの違いを生む可能性がある。FBIはこの研究を支援している。
これらのシステムはいずれも、単独では顔認識の分析的問題を解決することはできません。解決策には、注意書きや免責事項が伴う傾向があります。例えば、超解像と呼ばれる技術は、画像内の有効なピクセル数を2倍にすることができますが、それは非常に高速に連続して撮影された画像を比較した場合に限られます。Animetricsの新しいビデオ分析システム「Vinyl」は、映像から顔を自動的に抽出し、フォルダーに分類することで、アナリストが丸一日かけて行っていた作業を20分の自動化タスクに短縮します。しかし、アナリストは依然として、これらの顔を1つずつマッチングアルゴリズムに入力する必要があります。複数のビデオフレームをつなぎ合わせて、より有用な複合プロファイルを作成する他の研究では、膨大な計算リソースへのアクセスが求められます。
しかし、これらの様々なシステムを総合的に活用することで、技術の精度は劇的に向上するでしょう。生体認証の専門家の中には、今日の顔認識を数十年前の指紋認証に例える人もいます。顔認識を証拠として認められる水準まで引き上げる基準が策定されるまでには、たとえそれが実現したとしても、何年もかかるでしょう。しかし、散発的なブレークスルーが相まって全般的な照合性能が向上していくにつれ、真の完全顔認識の実現は近づいています。それが約束となるか脅威となるかは、誰の顔が標的となるかによって決まります。
***
私の訪問中にマクレランド刑事が使用した最高のショットは、断然ソーシャルメディアから引っ張ってきたものだ。顔認識の目的からすれば、これ以上完璧なショットはないだろう。明るく均一に分散された照明の下で、タイトで完璧なクローズアップだ。表情も見えないのも当然だ。彼は、銃で知人を脅迫したとされる男性の横顔からこの画像を拾ってきたのだ。
今回は、アニメトリクスの3D魔法は必要ありません。写真を入力すると、システムは同じ身元を持つ第一、第二、第三候補を提示します(画像は3回の別々の逮捕時に撮影されたものです)。この事件には、容疑者の姓を持たない目撃者がいましたが、ソーシャルメディアで繋がりがありました。プロフィールにも姓は記載されていませんでしたが、前科者が有力な候補として挙げられていたため、刑事は事件の準備を始めることができました。
私たちが投稿する自分の写真は、文字通り最高の顔を前面に出しており、顔認証システムにとっては夢のような存在です。アニメトリクス社によると、目と目の間のピクセル数がわずか65ピクセルの画像でも効果的に検索できるそうです。監視カメラの静止画では、目と目の間のピクセル数が10~20ピクセル程度なのは当たり前ですが、低解像度の携帯電話で撮影した写真でさえ、数百万ピクセルものピクセルが含まれています。
つまり、ソーシャルメディアには、顔認識にまさに必要なもの、つまりカメラを向いた高画質の顔写真が何十億枚もあり、その多くは直接アイデンティティに結びついている。GoogleとFacebookはすでにこの技術のインキュベーターとなっている。2011年、Googleはカーネギーメロン大学からスピンアウトした顔認識の新興企業PittPatt(ピッツバーグ・パターン認識の略)を買収した。1年後、Facebookはイスラエルに拠点を置くFace.comを買収し、顔認識の取り組みを社内アプリケーションに向け直した。これは、デジタル写真をスキャンして対応するFacebookの友達の名前で自動的にタグ付けするFace.comのKLIKアプリの終了を意味した。Facebookはその後、タグサジェスチョンと呼ばれるほぼ同じ機能を発表した。プライバシーへの懸念から、同ソーシャルネットワークは欧州連合(EU)全域でこの機能を停止した。
一方、Googleは論争をほとんど避けてきた。元CEOのエリック・シュミット氏は、同社が顔認識検索を提供する技術的能力を有していることを公に認めている。しかし、明らかなプライバシーリスクを懸念し、Googleは提供を見送っている。また、Google Glassウェアラブル・コンピューティング・ハードウェア向けの顔認証アプリの開発も禁止している。
Facebookは本記事の取材要請に応じず、Googleも断った。しかし、ソーシャルメディア大手が保存する画像を顔認識に利用することは、架空の脅威ではない。2011年、PittPattがGoogleに吸収された直後、カーネギーメロン大学のプライバシー経済学者アレッサンドロ・アクイスティ氏は、PittPattのアルゴリズムを用いてFacebookの画像と照合することで対象者を識別する概念実証アプリを披露した。オンラインで自由にアクセスできる人口統計情報をマイニングすることで、アクイスティは一部の人々に社会保障番号を割り当てることさえ可能だった。
1兆枚以上の画像(アクイスティ氏のケースでは数十万枚)とプローブを照合できる、国家規模あるいは世界規模の同等のシステムを展開するには、膨大な処理能力が必要となる。これはシリコンバレーの有力なデータ企業にとっては実現可能だが、現時点では実現不可能だ。「だからといって実現しないというわけではない」とアクイスティ氏は言う。「計算能力は時間とともに向上し続けており、顔認識の精度も向上している。そして、データの入手可能性も高まり続けているため、これは避けられないだろう」
これが悪夢のシナリオの一つだ。ソーシャルメディアが意図的に私たちを裏切り、それを機能と呼ぶようになるのだ。アクイスティは、それが最大でも20年以内に起こると予測している。しかし、FacebookやGoogleが保有する数十億もの顔データにアクセスする、もっと現実的な方法がある。当局が単に問い合わせるだけだ。「企業が収集し、法執行機関が収集したと知っているデータは、いずれ何らかの目的で召喚状が出されるだろう」と、ノートルダム大学のコンピューターサイエンス教授で生体認証とデータマイニングの専門家であるケビン・ボウヤー氏は言う。
問題は、Facebookが法執行機関にデータを提供するかどうかではない。同社は、捜査を支援するために特定のアカウントへのアクセスを提供してきた実績がある。また、NSAのPRISMプログラムの渦に巻き込まれ、他の企業と同様に、ユーザーデータの広範な監視を容認せざるを得なくなった。「NSAの監視やFBIが記録にアクセスする方法を見れば、その多くが民間企業から来ていることがわかります」と、非営利のデジタル権利団体である電子フロンティア財団の上級スタッフ弁護士、ジェニファー・リンチ氏は言う。「データや写真は、政府にとってのハニーポットとなるのです。」
FBIはNSAではないことに注意すべきである。関連性や事前の判断に基づいて有罪を認定したくなるかもしれないが、FBIによる生体認証データの不正利用や乱用は記録されていない。FBIが繰り返し述べているように、NGIの顔データベースが、顔写真だけで構成された文字通りの「悪党のギャラリー」として存在するとしても、プライバシーリスクは比較的少ないと言えるだろう。
しかし、「フィーチャー・クリープ」、つまり顔認識システムが新しいデータをこっそりと、予告なく取り込む方法は、すでに発生している。マクレランド氏にDMVの写真を使って検索できるか尋ねた時、私はそれは取るに足らない質問だろうと思った。ドライバーは犯罪者ではないのだ。マクレランド氏は私をまっすぐに見つめた。「ペンシルベニアでは?ええ」
警察は長年にわたりDMVの写真にアクセスでき、名前、場所、その他のパラメータでデータベースを検索できました。しかし2013年半ば、他の画像を使った検索が可能になりました。現在では、調査を行うたびに、ペンシルベニア州運輸局(PennDOT)のデータベースにある3000万件以上の免許証と身分証明書の写真とも照合されます。マクレランド氏によると、ヒット件数が少ないのはシステムの基盤となるアルゴリズムのせいだそうです。PennDOTの優先事項は犯罪者の追跡ではなく、IDの重複作成を防ぐことです。DMVのオフィスで撮影された、正面からの完璧な顔写真ではない調査写真は、事実上無視されます。その結果、ペンシルベニア州の成人の大多数を占める、犯罪を犯してプライバシーを放棄したのではなく、州発行の身分証明書を申請しただけの人々の顔写真収集が、単純な計算によって妨げられているのです。「私はそれがちょっと気に入っています」とマクレランド氏は言います。 「誤った回答はあまり得られません。」
ペンシルベニア州運輸省が撮影した写真が犯罪捜査にどのような効果をもたらすかは誰にも分からない。しかし、確かなのは、FBIが絶対にしないと約束している一線を越えようとする試みが、年間何千回も行われているということだ。顔写真の捜査から全員の捜査まで、あらゆる捜査が行われているのだ。
***
顔認識がもたらす数々の悪夢のようなシナリオの瀬戸際で、ここで終わらせるのは容易いだろう。信頼性の高いパターン分析と包括的なデータプールの不可避的な融合は、サイバースリラーの這いずり回る恐怖を伴って展開する可能性がある。あるいは、ひょっとすると、事態を収拾させる可能性もあるかもしれない。
ボストンマラソン爆破事件で3人が死亡、250人以上が負傷した1か月後の昨年5月、ミシガン州立大学のアニル・ジェインは、事件の真相を示唆する研究論文を発表した。ジェインは爆発現場で収集された監視カメラ画像を用いて、NECのNeoFaceアルゴリズムに両容疑者の顔を照合させた。ツァルナエフの兄タメルランは、2009年に暴行容疑で逮捕された際に顔写真がファイルに記録されていたものの、上位200人の候補には表示されなかった。タメルランはサングラスと帽子を着用していたため、アルゴリズムは逮捕時の写真と照合することができなかったのだ。
ジョハル・ツァルナエフの場合は別問題だった。ジェインは、卒業式の日に撮影された弟の写真を、主に顔写真で構成される100万枚の画像データセットに組み込んだ。年齢や性別といった人口統計データを用いないブラインドサーチで、ネオフェイスは爆破事件の写真とツァルナエフの卒業式の写真を組み合わせ、最上位の検索結果として提示した。顔認識であれば、捜査において最良かつ事実上唯一の手がかりとなるはずだった。
落とし穴がある。参考写真は元々Facebookに投稿されていたのだ。この照合を成功させるには、法執行機関は1兆枚以上の画像に分散するFacebookの顔データベースに、前例のないアクセスを必要としたはずだ。爆破事件から3日以上経った後、ツァルナエフ兄弟はMITの警察官を殺害し、ケンブリッジと近隣のウォータータウンの街中で銃撃戦を繰り広げることで捜査を終結させた。顔認証に要する時間は短く、技術的なハードルは乗り越えられないものだったかもしれない。
それでも、うまくいったかもしれない。
顔認識の限界について議論するのは時期尚早なのかもしれない。結局のところ、顔認識の最大の勝利と最悪の侵害はまだこれからなのだ。あるいは、集団のプライバシーのコストと一人の命の代償を天秤にかけるといった、厄介な計算を伴うため、単に難しすぎるのかもしれない。しかし、おそらく今こそ、変革をもたらす技術について議論すべき時であり、その理由なのだ。手遅れになる前に。
体があなたを裏切る4つの方法
1) 指/掌紋:犯罪現場で採取される潜在指紋には、指紋と掌紋があります。どちらも個人を特定できますが、潜在指紋は汚れや不完全な部分が多い傾向があります。昨年4月、FBIは指紋分析に革命を起こし、初の全国的な掌紋データベースを公開し、アルゴリズムを更新することで指紋捜査の精度を3倍に向上させました。
2) DNA****:容疑者のDNAと犯罪現場のサンプルを照合するには、かつては検査結果が出るまで最大60日も待たなければなりませんでした。IntegenX社は最近、DNAを90分で照合するRapidHIT技術を発表しました。これは、尋問中に容疑者を特定するのに十分な速さです。この2フィート四方のスキャナーは、検査室で実施できるレベルの化学分析を、使い捨てのマイクロ流体カートリッジ1つに詰め込んでいます。
3) 虹彩:虹彩スキャンでは、容疑者は近くのカメラをじっと見つめる必要があるため、犯罪捜査にはほとんど役に立ちません。しかし、これは確実な認証方法であり、ほぼすべての一般向けカメラで目の独特なパターンを捉えることができます。学校、刑務所、そして企業(Googleを含む)は、既にセキュリティ対策として虹彩スキャンを活用しています。
4) 音声:音声認識は主に商用ツールであり、バークレイズなどの銀行は送金の認証に利用しています。しかし、音声パターンマッチングによって犯罪者を捕捉することも可能です。Nuance Communications社が開発したシステムは、電話での会話から30秒以内に固有の音声プリントを作成し、それを詐欺師の音声プリントデータベースと照合することができます。
顔認識における5つの最大の課題
1) 年齢:年齢とともに顔は変化していきます。同じ人物を撮影した2枚の写真の間に時間が経つほど、顎のラインが変化したり、鼻が膨らんだりする可能性が高くなります。他にも、年齢とともに特徴的な特徴が失われていく要素は数多くあります。
2) ポーズ:ほとんどのマッチングアルゴリズムは、様々な特徴点間の距離(例えば、両目の間隔など)を比較します。しかし、カメラから背を向けている被写体は、相対的な測定値が大きく異なるように見える場合があります。
3) 照明: 薄暗い照明、濃い影、または過度の明るさも同様に悪影響を及ぼし、複数の特徴を見つけて比較するために必要な視覚的詳細をアルゴリズムから奪う可能性があります。
4) 表情: 口を開けて叫んでいるとき、にっこり笑っているとき、または唇を突き合わせて威嚇しているときなど、被写体の表情が参照ショットの表情と一致しない場合は、重要なランドマーク (口の大きさや位置など) が一致しないことがあります。
5) 解像度:ほとんどの顔認識アルゴリズムの精度は、写真のピクセル数に左右されます。これは、カメラの画質から被写体とレンズの距離(顔を切り離すために必要なズームの度合いを左右します)まで、あらゆる要因に左右されます。
この記事はもともと『Popular Science』2014年号に掲載されました。





