
あらゆる科学分野において、優れた研究は再現可能です。他者があなたの実験を模倣し、同じ結果が得られれば、その発見の妥当性は高いと言えるでしょう。そして、他者があなたの研究を微調整することでより良い結果が得られれば、それはコミュニティにとってさらに大きな利益となります。
これらのアイデアは、人工知能研究のための新しいプラットフォーム「OpenAI Gym」の原動力となっています。今年初めに発表されたOpenAIは、イーロン・マスク、Yコンビネーターのサム・アルトマン、そして元Google社員のイリヤ・スツケヴァーの共同設立です。この共同事業は、野心的な人工知能(AI)研究に取り組むとともに、ほぼすべての成果を公開・オープンソース化することを誓約しています。このプラットフォームは、特定の種類のAIアルゴリズムのベンチマークにおける標準となり、人々が成果を共有できる場となることを目指しています。
しかし、興味深い点は、OpenAI Gym には最高得点アルゴリズムを誰が作成できるかに基づくリーダーボードがないことです。代わりに、優れた一般化能力を持つアルゴリズム、つまり他の類似タスクをこなす際に汎用性を持つアルゴリズムの推進に重点が置かれます。多くのAI研究者は、一般化こそが人間レベルの知能を阻む最大の障害だと考えています。現在、猫の画像認識ができるアルゴリズムは、音声認識ができません。これは、データへのアプローチ方法がそれぞれ異なるためです。一般化とは、アルゴリズムが人間と同じように、両方の処理方法を知っていることを意味します。
OpenAIチームのプラットフォームは、必ずしも小さな改善を伴う反復的な作業のためのものではありません。彼らは、アルゴリズムに対する私たちの考え方を変えるようなプロジェクトを求めています。
「スコアを最大化することだけが目的ではありません。一般化に適したソリューションを見つけることが重要なのです」とOpenAI Gymの応募書類には記されている。「タスク固有のハードコーディングを伴うソリューションや、学習アルゴリズムの興味深い特性を明らかにしないソリューションは、審査を通過する可能性が低いでしょう。」
OpenAI Gymプラットフォームは、タスク達成に重点を置いた人工知能の一種である強化学習に焦点を当てています。アルゴリズムがうまく実行すれば報酬が与えられ、失敗した場合は報酬は与えられず、別の方法を試します。強化学習は、ロボットやビデオゲームで特に効果的であることが証明されています。これは、Google DeepmindがAtariゲームに勝つために使用したのと同じ種類の人工知能技術です。
実際、このサイトではAtari環境に加え、シミュレーションロボットやその他のボードゲームもオプションとして用意されています。今では悪名高い古代中国のボードゲーム、囲碁さえも、このサイトに登場します。
研究者がアルゴリズムを構築し、それを様々な環境(アルゴリズムをテストする仮想空間)に配置するというアイデアです。研究者は、客観的なテストでアルゴリズムの性能を確認し、調整を加え、さらにはベンチマーク結果をコミュニティ全体に公開することもできます。このプラットフォームは、GoogleのTensorFlowやモントリオール大学のTheanoなど、様々なオープンソースの人工知能フレームワークと連携しています。
OpenAI Gym は現在オープンベータ版となっており、研究者はアルゴリズムの提出を開始できます。