GoogleのAIが食べ物の写真のカロリーを計算できるように学習中 GoogleのAIが食べ物の写真のカロリーを計算できるように学習中

GoogleのAIが食べ物の写真のカロリーを計算できるように学習中

GoogleのAIが食べ物の写真のカロリーを計算できるように学習中

偶然か意図的かは不明だが、Googleの人工知能(AI)計画の詳細はこれまで明らかになっていなかった。場合によっては、本当の謎などなく、単に話すほど刺激的なことなどないだけなのだ。AI技術は同社の検索エンジンの基盤であり、Googleが2014年に4億ドルでDeepMindを買収した最も明白な理由は、この英国企業のディープラーニング(AI研究の一部だが後述)に関する専門知識を活用して、同社の中核機能を強化するためだった。しかし、GoogleplexはAI分野の他の優秀な人材や、ロボット工学で最も話題になっている企業のいくつかを吸収してきたが、その集合的な頭脳のうち、自動運転車、配達用ドローン、その他公表されているロボット工学やAI関連のプロジェクトに正式に割り当てられているのはごく一部に過ぎない。では、GoogleのAI専門家たちは一体何をしているのだろうか?

一言で言えば、食べ物です。

今週ボストンで開催されたRework Deep Learning Summitで、Googleの研究科学者ケビン・マーフィー氏は、洗練されたディープラーニングアルゴリズムを用いて食べ物の静止画を分析し、皿のカロリー数を推定するプロジェクトを発表しました。このプロジェクトはIm2Caloriesと呼ばれ、ある例では、システムは画像を見て、卵2個、パンケーキ2枚、ベーコン3枚を数えました。これらの単位は必ずしも世界共通ではないため、システムは皿の大きさと調味料の大きさを、それぞれの食べ物の大きさと比較しながら計測しました。また、Im2Caloriesは、高解像度の画像を丁寧に撮影する必要はない。Instagramで見られるような標準的な画質で十分だ。

では、最終的なカロリー数はいくつだったのだろう。私は、その特定のプレゼンテーションスライドから他の数字を走り書きするのに忙しくて、それを見逃してしまった。Im2Calories の目的は、1 日の食事摂取量の衝撃的な計算結果でユーザーを困惑させることではない。マーフィー氏は、食事日記をつけるプロセスを簡素化し、手動でアプリに入力しなくてもよいように食品を識別し、1 人分のサイズなどのやっかいな変数について推測する必要をなくしたいと考えている。「私たちは半自動化しています」とマーフィー氏はプレゼンテーション中に述べ、目玉焼きをポーチドエッグと取り違えたり、何かを完全に読み間違えたりした場合に、ドロップダウンを使用してソフトウェアを修正できることを指摘した。「たとえ 30 パーセントの確率でしか機能しなくても、人々が使い始めるのには十分です。私たちはデータを収集し、時間をかけて改善していきます」とマーフィー氏は語った。

肥満は米国において依然として深刻な問題であり、Im2Caloriesの商用版はおそらく爆発的に普及するだろうが、このシステムがどのように機能するかは、より詳しく検討する価値がある。多くのディープラーニングアプリケーションと同様に、Im2Caloriesは視覚分析(この場合は画像内の各ピクセルの深度を判定)とパターン認識を融合させている。Im2Caloriesは、特定の食品の見た目と膨大なカロリーデータとの関連性を導き出すことができる。「ディープラーニング」という言葉は、AI関連の用語として研究者以外の人々をパニックに陥れるほど刺激的な言葉であるため、深読みしすぎない方が良いだろう。しかし、Im2Caloriesは使用を通じて自己改善する設計となっている。多くのディープラーニングシステムの目的は、ソフトウェアへの情報入力や質問処理にかかる時間を最小限に抑え、パフォーマンスを向上させることにある。 Im2Caloriesがハンバーガーを認識できるのは、画像内のピクセルが既存のハンバーガーの写真に似ているからであり、研究者がシステムを操作して様々な練習を積んだからではない。ディープラーニングが音声、動画、静止画、テキストから意味を抽出することで有用性を発揮するには、少なくともある程度の自立性が必要だ。

Im2Caloriesが完全に正確になることはなかったとしても、マーフィー氏はインパクトがあると考えています。「人々がこれを本当に求めていることは明らかで、これは本当に便利です」と彼は言いました。「まあ、カロリーを20%減らすこともできますが、それは問題ではありません。1週間、1ヶ月、あるいは1年間の平均を計算します。そして今、複数の人々からの情報を統合し、人口レベルの統計を行うことができるようになります。疫学と公衆衛生学の同僚がいますが、彼らもこのツールを本当に必要としています。」

GoogleはIm2Caloriesの特許をつい最近申請したばかりで、マーフィー氏はいつ利用可能になるかについては詳細を明かさなかった。しかし、この技術の長期的な目標はより広範囲に及ぶ。そして率直に言って、Googleにとってより適していると言えるだろう。「もしこれを食品に応用できれば、まさにキラーアプリです」とマーフィー氏は述べた。「例えば、街路の風景分析を行ったとします。この交差点に車があるというだけの情報提供はしたくありません。それでは退屈です。車の位置を特定し、台数を数え、車の属性や向きなどを取得したいのです。そうすれば、交通状況分析や、最も可能性の高い駐車場の場所の予測などが可能になります。これらはすべてデータから学習するため、技術自体は同じで、データを変更するだけで済みます。」

肥満は深刻な問題であり、Googleが駆使する高度なセマンティック画像セグメンテーションやディープニューラルネットワークの活用は当然と言えるでしょう。しかし、10分後にどのブロックに空き駐車場がある可能性が高いかを本能的に判断するロボットカーは存在するのでしょうか?ディープラーニングがシリコンバレーでこれほど大きな関心を集めているのは驚くべきことではありません。むしろ、これほど長い時間がかかっていることの方が驚きです。