古代のボードゲームがGoogleとFacebookの新たなライバル関係を巻き起こす 古代のボードゲームがGoogleとFacebookの新たなライバル関係を巻き起こす

古代のボードゲームがGoogleとFacebookの新たなライバル関係を巻き起こす

古代のボードゲームがGoogleとFacebookの新たなライバル関係を巻き起こす

IBMのコンピューター「ディープ・ブルー」がチェスのグランドマスター、ガルリ・カスパロフに勝利したとき、世界は注目した。機械が人間を、しかも人間が自ら設計したゲームで打ち負かしたのだ。機械ができることのルールが一変したのだ。

しかし今では、そのような瞬間(1997年にポピュラーサイエンス誌が「世界中に響き渡ったチェックメイト」と呼んだもの)は、ますます少なくなり、稀少になっている。人工知能が、バーチャルパーソナルアシスタントのようにオープンな場でゆっくりと改良されるか、よりカスタマイズされたコンテンツや顔認識を提供するためにサーバーレベルで調整されるかの二分法の世界では、こうしたベンチマークとなる瞬間は、通常、より曖昧になっている。

今日(そして昨夜遅く)、人工知能に多額の投資をしている2つの企業が、古代中国のゲームである囲碁で人間のプレイヤーに勝つという同じベンチマークを主張しようとしている。

過去24時間で、Google DeepMindとFacebookのAI研究所は、それぞれ自社のアルゴリズムが非常に高いレベルの競技でパフォーマンスを発揮できると発表しました。Googleはこの発表において、 Nature誌への論文掲載と10月の実戦シナリオによって、より正式なリードを築いています。AlphaGoと名付けられたこのコンピューターは、囲碁のヨーロッパチャンピオンである樊慧氏に勝利しました。Facebookのソフトウェアは、オンライン囲碁サーバーKGSが開催する月例ボットトーナメントで3位に輝きました。

Google DeepMindは、現チャンピオンに勝つという同社のレベルは、これまで推定より5〜10年長くかかるとされていたと主張している。これは人工知能研究の加速を証明するものだ。一方Facebookは、同社のアルゴリズムは着実かつ定量化可能な改善を遂げてきたと述べている。

GoogleやFacebookのユーザーにとって、これはどちらのユーザーエクスペリエンスにとっても重大な出来事ではありません。実際、サービスの提供方法には全く影響しないでしょう。ただ、研究者たちが既存のアルゴリズム、この場合は視覚情報の処理に優れたディープラーニングの一種、の適用において定量的に優れた成果を上げていることを示しています。これは、パターンをより正確に検出し、結論をより簡潔に表現できるアルゴリズムを意味します。将来的には、これはより良い結果につながるでしょう。

つまり、コンピューターが優れている点がもう 1 つ増えたことになります。

囲碁をマスターしたコンピュータ

しかし、フェイスブックの創設者でCEOのマーク・ザッカーバーグ氏は、これを研究力を誇示する機会と捉え、グーグル・ディープマインドの発表の1日前に、疑わしいことにフェイスブックの個人ページに自社の成果について投稿した。

両社は、実際にはベル研究所でフェイスブックのヤン・ルカン氏が発明した深層畳み込みニューラルネットワークと、囲碁の過去のゲームに基づく数百万のデータポイントの組み合わせを使用した。

httpswww.popsci.comサイトpopsci.comファイルスクリーンショット_2016-01-27_at_12.56.06_pm.png
典型的な囲碁盤。自然

囲碁は19×19の盤上で2人で行うゲームです。各プレイヤーは「石」と呼ばれる丸い牌を置き、相手の石を取ろうとします。片方のプレイヤーは黒石、もう片方のプレイヤーは白石で表されます。361のマスが存在し、それぞれのマスの強さは手番ごとに変化するため、囲碁は果てしなく複雑で、相手を出し抜くための戦略を練るには人間の創造性が求められるゲームと言えるでしょう。

Googleのアプローチ

Google は、どの手が打たれるかを制御するために 2 つの畳み込みニューラル ネットワークを使用しました。これらの畳み込みニューラル ネットワークは、顔認識や画像内の物体識別で使用されているのと同じスタイルです。データを分解する方法が、コンピューターによるピクセルの記述方法とうまく連携するためです。システムには最初に、盤面の記述 (白、黒、未獲得の位置) が入力されます。最初のニューラル ネットワークはポリシー ネットワークと呼ばれ、人間のプレーヤーが打つ可能性のある各手の確率を出力します。コンピューターはトレーニングと呼ばれるプロセスで、過去の囲碁のゲームから 3000 万の位置を既に調べているため、これは比較的迅速なプロセスです。トレーニングでは、コンピューターにすべての位置データと各位置の結果が入力されます。これにより、コンピューターは潜在的な手を評価する最適な方法をランク付けできます。これは、コンピューターが手を決して忘れないことを除けば、フットボール選手やボクサーの試合映像を見るのとよく似ています。

httpswww.popsci.comサイトpopsci.comファイルスクリーンショット_2016-01-27_at_12.35.06_pm.png
Google DeepMindのAlphaGoソフトウェアがフランスの囲碁名人、樊慧と対戦した結果。Google DeepMind

2つ目のネットワークは決定者です。DeepMindがバリューネットワークと呼ぶ、これも畳み込みニューラルネットワークです。すべての確率を受け取り、ゲーム全体でどの手が最も勝つ可能性が高いかを示す単一の数値を出力します。

これは世界有数の囲碁チャンピオンの 1 人を (5 回も) 破ったシステムであり、Google のテストでは、他の一流の仮想囲碁プレイヤーを 495 回の対戦のうち 494 回、つまり 99.8 パーセントの確率で破ったシステムです。

Facebookのアプローチ

Facebookの囲碁への取り組みは、もう少し多様です。2つの畳み込みネットワークを使う代わりに、1つだけを使い、モンテカルロ木探索と呼ばれる別の機械学習手法と組み合わせています。Facebookのヤン・ルカン氏によると、これは前述のように、訓練で学習した膨大な数の潜在的な手を探索するランダム探索の一種です。畳み込みネットワークは、学習した手を実際に探索するモンテカルロ木探索に頼りながら、最善の次の手を予測するという点で、Googleのポリシーネットワークとほぼ同様の機能を果たします。ただし、Facebookにはこの問題に取り組む研究者が1人(ただし、マーク・ザッカーバーグから6メートルほど離れた場所に座る人物)しかいなかったのに対し、DeepMindのNature論文には20人の共著者がいたことに注意が必要です。

今後、Google DeepMindのAlphaGoは、世界最強の囲碁棋士と称される人間の囲碁名人、李世ドルに挑戦します。対局は2016年3月に行われます(試合の模様は後日お伝えします)。FacebookのLeCun氏は、AlphaGoモデルはまだ開発中だが、将来的には他の種類のディープラーニングの導入も検討していくと述べています。