
6月に開催されたコンテストで、「ユージーン」という名のチャットボットが、審査員たちをウクライナのティーンエイジャーだと騙しました。審査員たちは、これを機械がチューリングテストに合格した初めての例として称賛しました。チューリングテストとは、コンピューター科学者のアラン・チューリングが1950年に提唱した人工知能(AI)の神聖な評価基準です。
ユージンの勝利は長くは続かなかった。数日のうちに、AI研究者たちはチャットボットの成果を単なる定型的な返答の寄せ集めとして片付け、チューリングテストそのものを批判した。一種の実存的な社交ゲームとして考案されたこのテストは、人間と機械が遠隔地の質問者からの質問に答えるというものだ。人間と間違えられたコンピューターは、人間の思考プロセスを模倣する能力を発達させたことを証明することになる。
これだけ聞くと十分納得できるが、「人は騙されやすい」とニューヨーク大学のコンピューター科学者アーニー・デイビス氏は言う。「私たちは、話しかけてくる相手は誰でも知的な人間だという安全な仮定に慣れてしまっている」。そのため、人間の司式者はコンピューターに疑わしい点を許容する可能性が高い。さらに、チャットボットは往々にして、単にぼんやりしているように見せることで、推論能力の欠如を隠そうとする。例えば、未来学者レイ・カーツワイルはかつてユージーンにこう尋ねた。「ボウルにビー玉が2つ入っていて、さらに2つ追加したら、ボウルにはビー玉がいくつあることになりますか?」ユージーンは「あまり多くない」と答えた。「正確な数は言えない。忘れてしまった。もし私が間違っていなければ、あなたはまだ住んでいる場所を教えてくれなかった」
「私たちは、話しかけてくる人は誰でも実は知的な人だという安全な仮定に慣れています。」
このように、チューリングテストは、適応力のある人間レベルの知性を備えた機械の開発を促進するものではありません。むしろ、チューリングテストは私たち自身の騙されやすさを露呈させ、皮肉な非論理的な表現と巧妙な操作を巧みに用いることが最大の革新性となるプログラムを生み出します。
AIの最も有名なベンチマークに対する厳しい批判は、この分野への関心と投資が急増している時期に飛び込んできた。Googleは最近、AI企業DeepMindを4億ドルで買収し、IBMはWatsonシステムに10億ドルを投資している。Watsonはクイズ番組「Jeopardy!」の元優勝者で、現在は脳腫瘍の遺伝学を解明している。故アラン・チューリングでさえ、この秋、ハリウッドで伝記映画『イミテーション・ゲーム』の主人公として取り上げられる。AI分野にはもはやチューリングテストは必要ないと言う人もいるかもしれない。機械が人間離れした方法で賢くなるのを許せばいいのだ。
それは間違いだ。チューリングテストの真価は、大衆の想像力を捉え、イノベーションを促したことだ。ならば、真の人工知能を証明するという課題により適した、新たなテストを開発してみてはどうだろうか。「おそらく、一つの大きなハードルに目を向けるのではなく、役に立つ道へと導く小さなステップを積み重ねる方法を理解しようと努めるべきなのだろう」と、スタンフォード大学の認知科学者ノア・グッドマンは言う。機械は、機敏でその場その場での思考を重視する様々な課題に取り組む必要がある。初めて見た動画を説明できるか、率直な質問に直接答えられるか、言語のニュアンスを理解できるか。単なる小道具ではなく、そのようなシステムが実現すれば、チューリングの言葉を借りれば「考える機械」がついに実現することになるだろう。ユージンはまだその目標に程遠かった。
この記事はもともと『Popular Science』2014年10月号に掲載されました。