
今年のバレンタインデー、あなたは誰かに「STANK LOVE」と書かれたハート型のキャンディーを贈りますか?「TIME HUG」や「BEAR WIG」、あるいはただの「FANG」はどうでしょう?「LOVE BOT」や「PIN A FACE」、あるいはただの「HOLE」と書かれたお菓子をもらったら、あなたはどう思いますか?「TIME STAR」や「SWEAT POO」と書かれたお菓子にうっとりしますか?人工知能にロマンチックなメッセージを書いてもらうと、こんな素敵なメッセージが生まれます。
もっと具体的に言えば、ニューラルネットワークと呼ばれる機械学習システムは、これらの奇妙な表現を生み出しただけでなく、人間にも感謝すべきです。コロラド州の光学研究設計会社で働く研究者、ジャネル・シェーン氏も同様です。彼女は趣味で人工知能の実験を行っています。AIが作成した「LOVE 2000 HOGSYEA」のようなバレンタインデーのメッセージを見て笑ってしまうのは簡単ですが、彼女の研究は人工知能における重要な問題を浮き彫りにしています。それは、AI開発において良質なデータ、しかも大量のデータがなぜ重要なのかということです。
まず、シェーン氏がニューラルネットワークを使って「大きく見える」のようなメッセージを作成した方法と理由を説明します。彼女はまず、「人間が何に魅力を感じるかを推測しようとして失敗するという、ニューラルネットワークの奇妙で愛らしい能力を、何で表現できるだろうか」と考え始めたと言います。そして最終的に、キャンディーのハートにたどり着きました。しかし、ニューラルネットワークは学習し、独自のルールを構築して、斬新で新しい素材を生み出すためのデータを必要とします。
そこでシェーンは、本物のキャンディハートのメッセージのリストを366個作成した。そこには、「COOL CAT」「BEAR HUG」といったお決まりのフレーズや、シンプルで真剣な「I LOVE YOU」などが含まれていた。シェーンによると、そのリストは「哀れなほど小さかった」という。(比較のために言うと、AppleはiPhone XのFace IDセキュリティシステムを動かすニューラルネットワークを作る際に「10億以上の画像」を使ったと言っている。)リストのサイズが小さいことを補うために、彼女はいくつかのステップを踏んだ。最初は、ニューラルネットワークが、彼女が渡したリストにある単語をそのまま繰り返さないようにすることだった。彼女は「ニューラルネットワークがデータを記憶する能力を妨害する」必要があったと彼女は言う。そこでシェーンは、「ニューラルネットワークの一部をランダムに」ノックアウトすることで、AIシステムの側面を意図的に妨害したと説明している。その戦略を使って、彼女は人工知能システムが新しいキャンディハートのスローガンを作るときに「本当に一般的なルール」を考え出すようにした。
彼女はさらに一歩踏み出し、バレンタインデーにちなんだテキストを数多く生成しました。原始人風の「ME LOVE HAVE」のような逸品です。元のデータセットを拡張するために、システムが最初に生成した「STANK LOVE」のようなAI生成スローガンもいくつか追加しました。その結果、タイムトラベルするクマの映画にぴったりのタイトル「TIME BEAR」や、Apple製品のような響きの「HOME BEAR」など、クマをテーマにしたスローガンが数多く生まれました。拡張されたデータセットに「BEAR HUG」「MY BEAR」「BEAR WIG」「TEAM BEAR」が含まれていたため、クマをテーマにしたスローガンが生まれたと考えられます。
「データが増えれば増えるほど、一貫して興味深いものになるでしょう」とシェーンは言う。このような創造的な取り組みでは、何か面白いものを目指すことがすべてだ。しかし、人工知能が私たちの生活の中でさらに大きな役割を果たすようになるにつれ、単なるハート型のキャンディーの話ではなくなるため、その重要性はますます高まっている。例えば、人工知能システムは、目にする言語パターンからバイアスを学習することができる。また、ニューヨーク・タイムズ紙に掲載された最近の研究では、顔認識システムは白人男性の画像の性別をより正確に識別する能力に優れていることが示された。こうしたエラーの原因の一つとして考えられるのは、そもそも使用されたデータセットに白人男性が過剰に含まれていた場合だ。
しかし、シェーンのように楽しく気楽な方法で人工知能を使う場合、創造的な成果は大量のデータを使うことで最高のものになります。キャンディーハートの場合、元の入力はわずかで、彼女は出力を精査して良いものを見つけなければなりませんでした。実際、ニューラルネットワークの生の出力から、WEAL O3、GIGDY LE、TALL U WANKEといったものが生まれました。彼女は他のプロジェクトで、より大きなデータセットを使うことでより良い結果を得ています。例えば、ニューラルネットワークに何千もの実際の鳥の名前を与え、その元のデータに基づいて新しい架空の鳥の名前を考えさせるといったことです。(ケープバブラーは、説得力のある結果の一つでした。)
キャンディハートや鳥の種類以外にも、シェーンは、クラフトビール (Dang River を一口飲んでみませんか?)、メタルバンド (Death from the Trend の音楽はどんな感じでしょうか?)、そして嬉しいことに、My Little Pony の新しい名前を考え出すようニューラルネットワークをトレーニングし、Dark Candy (これもバレンタインデーのお菓子のように聞こえます) のようなポニーの名前を生み出しました。
とにかく、ハッピーバレンタインデー。そしてAIが言ったように、忘れずに「私を応援してね」。