

最新の XPrize は、間違いなくこれまでで最も奇妙な XPrize です。
その名はTEDが主催するAI XPrize。その名前はすべてを物語っているように思えるが、実際はそうではない。先週発表されたように、このコンテストは「ステージに歩いたり、車いすで登場したりして、観客からスタンディングオベーションを浴びるほど魅力的なTEDトークを披露した最初のAIに授与される、現代版チューリングテスト」である。
しかし、実際の賞品は未定です。また、提示されたルールは、一般から寄せられたアイデアに基づいて、コンテストが最終的にどのようなものになるかを示した例です。
それでも、この一文の説明とサンプルルールを見ると、初の人工知能関連Xプライズの妥当性に疑問が残ります。機械によるTEDトークが、AI開発の推進と一体何の関係があるのでしょうか?
まず、サンプルルールについて。XPrizeのウェブサイトには「このコンセプトの要素は使用する場合と使用しない場合があります」と明記されていますが、それでも詳細は示唆に富んでいます。提案されているシナリオでは、各チームに事前に100個のディスカッショントピックが与えられます。TEDカンファレンスでは、これらのトピックから1つが(ランダムに、または聴衆によって)選択され、AIは30分で3分間のプレゼンテーションを作成します。完成したTEDトークの後、「聴衆は拍手と、必要に応じてスタンディングオベーションで投票します」。
過去のXプライズコンペティションでは、完全に経験的な勝利条件が課されていました。つまり、最初にゴールラインを通過するか、同じ週に2回弾道高度に到達するかです。この仮想的な例では、全体のデシベルレベルが巨大な拍手メーターを講堂の天井に向かって押し上げるでしょうか? また、2台のロボットが同じ会議でスタンディングオベーションを受けたらどうなるでしょうか? 主催者は、それぞれの拍手が達成された速度、叫び声の数、あるいは涙の数を計測するのでしょうか?
これらの質問は冗談のように聞こえるかもしれないが、この曖昧な才能披露の仕組みは、競争の次の、そしておそらくより困難な段階に関連している。
視聴者評価によるTEDトークの後、AIはWired誌元編集者でTEDカンファレンスのキュレーターでもあるクリス・アンダーセン氏から出された2つの質問に答える。専門家パネルが「投票」する。これが拍手喝采の決着点となるかもしれない。あるいは、各専門家の拍手が20倍になるかもしれない。
AI XPrizeはAI研究者によって考案されたものではない、とだけ言っておけば十分でしょう。サンプルルールは、XPrizeをはるかに緩く、よりエンターテイメント性を重視した形で解釈したもので、実際の研究に基づいた一種のマーケティング戦略と言えるでしょう。
ただし、研究者が単に偽装するなら話は別だ。「このチャレンジの精神は非常にクールで、非常に有用だと思います」と、スタンフォード大学の認知科学者ノア・グッドマン氏は言う。「しかし、現状のままでは簡単に不正ができます。アーティストや知識人を集めて、100のトピックそれぞれに台本を作成し、どのトピックかが分かったら正しい台本を再生すればいいのです。そうすれば、AIを全く使わずに最初の部分を解決できます。」
質疑応答セッションはそう簡単には操作できないだろうが、その頃にはスタンディングオベーションの可否は既に決まっているだろう。まるでミス・アメリカの戴冠式後に地政学に関するクイズを出すようなものだ。
Q&Aの目的は、最終的にどのような構成になるにせよ、自己完結的なチューリングテストを提供することです。つまり、一見ロボットの舞台装置のように思えるものに、古典的で分かりやすいAI研究の要素を付加することです。1950年にコンピュータのパイオニアであるアラン・チューリングによって初めて提唱されたチューリングテストは、機械に人間の審査員を騙し、即興の回答を連発することで、自分も人間と同じくらい人間だと信じ込ませることで、その知性を証明することを要求します。
しかし、チューリングテストは科学というより科学史であり、AI研究者の大多数が放棄したアプローチです。毎年、チームはローブナー賞を競い合い、最も人間らしいチャットボットに賞金が授与されます。そして毎年、コンテスト関係者以外、誰も関心を持ちません。「ローブナー賞は楽しいものでしたが、科学的な課題を前進させ、AIへのより広範な一般の関心を集めるという点では完全に失敗しています」とグッドマンは言います。「チューリングテストは思考実験として非常に貴重な役割を果たしました。しかし、現実的な研究目標ではありません。」
チューリングテストのあらゆる問題の中でも、最大のものの一つは人間に関係している。審査員はしばしばユーモアに惑わされる。ユーモアとは、新たな情報に基づいた、臨機応変で創造的なユーモアではなく、より適切な返答を練る手間を省くために、戦略的な間隔で繰り出される、決まり切ったジョークのことだ。結局のところ、人間はチューリングテストの審査員として頼りにならない。「このXプライズにも同じ問題があるでしょう。TEDビデオをたくさん見たことがある人なら誰でも知っているように、TEDビデオは非常に印象的で、すぐに認識できるリズムと平凡な文体を持っています」とグッドマンは言う。「スタンディングオベーションを得るために使われるジョークや独特の文体上のトリックをプログラムするだけで、かなり良い結果を出すことができるでしょう。」
念のため言っておきますが、グッドマン氏は私ほどXプライズを厳しく批判しているわけではありません。主催者がどんなアイデアを出すのか、心から楽しみにしているのです。ハートフォードシャー大学の人工知能教授、カースティン・ダウテンハーン氏は、それほど熱心ではありません。「現在そして将来のロボット工学における主要な課題は、パフォーマンススキルではなく、世界とのインタラクションです」と、AIだけでなく、人間とロボットのインタラクションやソーシャルロボティクスも研究するダウテンハーン氏は言います。
ダウテンハーン氏にとって、AI駆動型ロボットの主な課題は、無生物や社会環境とどのように相互作用するか、つまり、例えば部屋の中を移動したり、会話を進めたりすることにある。「Xプライズにはこれらの要素が全く見当たらないので、賞金のルールが、現実世界のAIを進歩させるという意味で有用なスキルのどれに着目しているのか、私には分かりません」と彼女は言う。
AI XPrizeがより完全な形で実現すれば、単なる奇抜なスタントではなく、より意義深い研究活動となる可能性は十分にあります。グッドマン氏にとって、その変化はAIに即興性を強いるというシンプルなものになるかもしれません。即興性は人間の知性の重要な特徴であり、機械にとって永遠の障害となっています。例えば、100個のトピック(事前に録画したプレゼンテーションを必要とするフレームワーク)といったことは気にしないでください。その代わりに、システムにその場でランダムにトピックを与え、インターネットからデータを収集してプレゼンテーションを行うようにすればいいのです。「今は無理です」とグッドマン氏は言います。「5年後には可能になると思います。」
個人的には、AI XPrizeにはルールよりも大きな問題があると考えています。特にスポンサーとの関係が問題です。Progressive Automotive XPrizeは、チームに本質的に保険料の低い車を作るよう求めていませんでした。AI XPrizeはTED中心主義が顕著で、TEDの土俵で開催され、成功か失敗かは過去のTEDトークと比較されます。こうしたカンファレンスの影響力や、TEDボットが注目を集めることは否定できません。しかし、コンピューターサイエンティストにスタンディングオベーションのために解答を求めるとなると、真剣な競争というよりは、お祭り騒ぎのようです。初めて、誰からも尊敬されずにXPrizeを受賞できる可能性があるかもしれません。