この機械はあなたよりも優れたクリックベイトを書く この機械はあなたよりも優れたクリックベイトを書く

この機械はあなたよりも優れたクリックベイトを書く

この機械はあなたよりも優れたクリックベイトを書く
httpswww.popsci.comサイトpopsci.comファイルスクリーンショット_2015-10-14_at_2.51.37_pm.png
Click-o-Tronは、人工知能によって書かれたクリックベイト記事でいっぱいのウェブサイトです。ラース・エイドネス

研究者が機械学習の実験を行う際、多くの場合、人間にとって役立つツールを作ることが目的です。コンピューターは設計上、人間の自然な欠点を補うように作られています。疲れたりストレスを感じたりせず、特に誇張することもありません。一般的に、コンピューターは確かな事実と数字にのみ焦点を当てます。しかし、ノルウェーの開発者ラース・エイドネス氏は全く逆のアプローチを取り、人間の好奇心や騙されやすさにつけ込んで人間を騙すように設計された学習機械を開発したのです。これは、昨今の一部の人間の作家が行っているのとよく似ています。エイドネス氏はクリックベイト生成ツールを開発しました。

クリックベイトとは、センセーショナルな見出しを掲げながらも、その記事の趣旨を果たさない記事を指す用語です。今日のインターネットでは、ますます多くのメディアが読者の注目を集めるために、比較的取るに足らない出来事を誇張したり膨らませたりしています。大きく太字の見出しには、読者に衝撃を与え、喜ばせ、刺激を与え、驚かせるような記事が羅列されています(「信じられない…」など)。

アイドネス氏は、BuzzFeed、Gawker、Jezebel、Huffington Post、Unworthy(いずれもクリックベイトだと非難されている)などの大手オンラインメディアから、およそ200万件のこうした見出しを読み取るニューラルネットワークを構築した。

ニューラルネットワークは、入力間の関係性を解読する数式の集合体です。例えば、ニューラルネットワークに200万個のクリックベイトの見出しを読ませると(このプロセスはトレーニングと呼ばれます)、どの単語が他の単語と関連しているかを分析できるようになります。単語間の関係性を理解することで、次に何が起こるかをある程度の確度で予測できるようになります。

訓練後、ネットワークに文を作るよう指示されると、ネットワークは単語を見つけて出力し、ループバックして思考プロセス全体を再度実行し、最初の単語を文脈として組み込みます。このアーキテクチャは、再帰型ニューラルネットワーク(再帰的であることから)と呼ばれ、機械学習の研究者たちは、順序通りに、あるいは時間的な要素を伴って実行する必要があるタスクに最適であることを発見しました。

httpswww.popsci.comsitespopsci.comfilesrnn-unrolled2.png
リカレントニューラルネットワークは、自身の出力を将来の方程式に統合できるため、言語アプリケーションに多用途に使用できます。ラース・エイドネス

アイドネスのニューラルネットワークは、最初のトレーニングセッションの後、世界についてほとんど理解していませんでした。「フランス人サラ・ヨークへの飛行機での移動に同行するリアルウォーク」や「女優が元カレに経済教訓を伝える ― アプリで学ぶ」といった見出しを生成していました。これらはあまり意味をなさないものでした。しかし、さらに数回情報を読み込んだ後、ネットワークは「ジョン・マケイン、最高裁に避妊改革を支持するよう警告」と答えました。

アイドネス氏はデータから「ロムニー陣営:「あなたは悪い大統領だと思います」」のような他の例をいくつか挙げている。

「これは疑わしいほど素晴らしい。もしこれが実際にどこかのウェブサイトに掲載された見出しだとしても驚かない」と、エイドネス氏はシステムの詳細を説明したブログ記事に記している。「しかし、データセットには含まれていないし、近いものさえない」

どうやら「ロムニー陣営」が17回登場したが、大統領選と関連づけられたことは一度もなかったようだ。また、「悪い大統領」というフレーズが使われたのは一度だけだったが、それはマルコ・ルビオによるものだった。これらの情報から、エイドネス氏は、ネットワークが何らかの意味理解を持ち、政治的関係を理解できると述べている。

ネットワークをさらに活用するため、彼はClickotron.comを作成しました。このサイトは20分ごとに人工的に生成された新しい記事で更新されます。サイトはウィキメディア・コモンズから関連する画像を自動的に検索し、本文を生成します。Clickotron.comには、有益な情報とそうでない情報を選別するためのRedditのような投票機能があります。

「これにより、役に立たないジャーナリズムが無限に、しかも無料で入手できることになる」とエイドネス氏は書いている。「経済学の授業で正しく覚えていれば、これによって役に立たないジャーナリズムの市場価値はゼロにまで下がり、役に立たないジャーナリズムを生み出す他の制作者たちは、何か別のものを制作せざるを得なくなるはずだ」