
2015年の夏、Googleの研究者たちは、自社の人工知能アルゴリズムに夢を実現できる可能性に気づきました。彼らは、画像を分類するだけでなく、見たものの価値を高めるプログラムを作成しました。機械は芸術作品の解釈を披露しました。
研究者たちは、プログラムに画像生成を設定することで、機械が特定の物体をどのように見ているかを知ることができることを発見した。この発見は、機械が創造的なツールになり得るという考えが高まっている中で生まれた。
それから約1年後、Googleは創造性と人工知能を実験する探究グループ「プロジェクト・マゼンタ」を発表した。このチームは様々な形態のアート制作に焦点を当て、まずは音楽に焦点を当て、その後、ビデオなどの視覚メディアへと展開していく予定だ。
「Magenta では、別の側面、つまりアートや音楽を生成する方法を学習し、独自に魅力的で芸術的なコンテンツを作成できるアルゴリズムの開発を探求したいと考えています」と、Douglas Eck 氏は Magenta ブログの最初の投稿で書いています。
Magentaで最初にリリースされたプロジェクトは、Googleの研究員エリオット・ウェイトが作った「きらきら星」の最初の4つの音符をベースにしたシンプルな曲です。この曲は、デジタルピアノが音符を弾いているだけのシンプルな曲で、最初はシンプルですが、徐々に複雑でニュアンス豊かな音へと変化していきます。中には、実に素晴らしいフレーズもいくつかあります。(ドラムは後から人間が追加しました。)
芸術的知性
研究者たちは、人工知能の黎明期から、創造的な選択を行う人工知能の解明に取り組んできました。現代人工知能研究の父と称されるマービン・ミンスキーは、1960年にこう記しています。「遅かれ早かれ、複数の最適化装置、パターン認識のトリック、計画代数、再帰的な管理手順といったヒューリスティックな手法を複雑に組み合わせることで、優れた問題解決能力を持つプログラムを組み立てられるようになると私は確信しています。しかし、これらのどれにも、知能の本質を見出すことはできないでしょう。」
知能はパターンを認識する以上のものだが、知能の「本拠地」を見つけるのは難しく、人工知能の研究者や心理学者を同様に悩ませてきた。
シリウス XM の創設者であり、未来学者の著者であり、ロボット パートナーの Bina48 の委託者でもあるマーティン ロスブラット氏は、機械が本当に創造的であるためには、これまで見たものの単なるランダムなサンプル以上のものを作成できなければならないと述べています。
「最も重要な要素は特異性です。要素をランダムに組み合わせただけのプログラムを書いても、それは創造的ではありません」と、ロスブラット氏はMoogfestでPopular Science誌に語った。「それは見る人の目次第です。ユニークだと感じられれば、創造的だと感じられるでしょう。」
創造的で斬新な「感覚」という閾値を超えようと試みるプロジェクトは、特に視覚芸術と音楽制作の分野で何千件も実施されてきました。ピカソが21世紀の風景をどのように描いたか、あるいはベートーベンの壮大な感性をどのように再現しようと試みています。

これらの絵画プロジェクトは、スタイル・トランスファーと呼ばれる人工知能研究のサブセットであり、著名な芸術家の技法を複製・応用することに非常に成功しています。ドイツのベトゲ研究所による研究では、ピカソ、ゴッホ、ワシリー・カンディンスキー、エドヴァルド・ムンクのスタイルをデジタル画像に適用することに成功しました。
そのために、彼らは物体認識アルゴリズムを用いて、絵画に描かれた物体そのものを無視し、代わりにそれらがどのように描かれているかに焦点を当てます。これにより、絵画の内容を様式から切り離し、より正確にそれぞれを研究することが可能になります。
しかし、これは単に既存の人間の創造性の集合体であり、まったく新しいものではないと主張する人もいるでしょう。
マイクロソフトの研究チームを率い、「仮想現実」という言葉を初めて作った未来学者のジャロン・ラニアー氏は、機械が創造的になることはあり得ないと考えているという。
「AIは人間のデータを再利用することで機能する」とラニアー氏はポピュラーサイエンス誌に語った。「結局のところ、AIは人間から得られるものであり、問題は人間が匿名化されていることだ。私たちはAIという方程式から自分たちを排除してしまったのだ。」
人工知能の研究者であり、サイト「Creative AI」の制作者、ポッドキャスト「Ethical Machines」のホストでもあるサミム・ウィニガー氏は、創造性はひらめきや受け継いだ才能ではなく、活動の仕方であると述べています。
「これは創造的なプロセス、つまり物事の進め方に関するものです。創造性を学ぶということは、ギターを弾くことを学ぶということです」とウィニガー氏は言います。「この視点から見ると、神秘性が解き明かされ、これらのツールを使って自分のプロセスを最適化できるようになります。」
ウィニガー氏は、これらのツールは人間の創造性を置き換えるものではなく、強化する手段であると考えている。
彼のシナリオでは、衣料品店がユーザーの好みに基づいてドレスを生成し、その場で製作できるようになる。
「その時点で、H&M の見た目がまったく異なるものを想像できる」とウィニガー氏は語った。
そして、私たちは実際にその現実に近づいています。今年、IBMのワトソンはファッション会社マルケサのメットガラのドレスのデザインに協力し、色や素材の方向性を提案しました。
制作過程において、マルケサはワトソンに喜び、情熱、興奮、励まし、好奇心という5つの感情を提示しました。ワトソンはマルケサの過去のドレスを分析し、色と感情を結びつけるツールを用いて、この服のカラーパレットをデザインしました。ワトソンのサービスは、4万種類の生地から150種類の選択肢を絞り込み、デザイナーに35種類の提案を提供しました。
エック氏によると、プロジェクト・マゼンタは真にジェネレーティブな音楽とアートの創造を目指している。その構想は、機械だけを使って始め、ボタンをクリックするだけで、人間の作曲家が取り入れるような要素をすべて備えた楽曲が突然完成するというものだ。
Magenta は、音楽のテーマや特徴を繰り返し使用することで、生成された音楽に物語の流れを取り入れることにも取り組みます。
全体の操作は一般に公開され、アルファリリースは今日から Magenta の GitHub ページで入手できます。