

今朝目覚めたとき、まさか自分の手紙書きの腕前が、史上最高の作家の一人に匹敵するなんて思ってもみませんでした。しかし、テクノロジーの常として、私の考えは間違っていたことが証明されました。IBMのWebイノベーション・ハブであるWatson Developer Cloudが、新ツール「Tone Analyzer」のデモを公開しました。これは「文章における感情的なトーン、社会的傾向、そして文体」を検出するツールです。IBMは私たちをより優れたライターにしたいと考えているのです。私もその気持ちに共感します。それで、試しに使ってみました。
典型的な(つまり神経質な)作家である私にとって、まず最初に考えたのは、自分の気楽な文章が、マーク・トウェインのような文学界の巨匠の文章と比べてどうなのか試してみたかったことです。そこで、トウェインが1876年に書いた手紙をランダムに見つけて、機械に入力しました。先週、PopSciの編集者に送ったメールの私の方も同様に入力しました。
結果は驚くほど近かった(そして、私の文章力は客観的に見てトウェインのそれには遠く及ばないことは承知している)。トーン・アナライザーは文章を感情的なトーン、社会的なトーン、そして文章的なトーンの3つに分類する。これらのカテゴリーの中で、トウェインは感情的4%、社会的なトーン88%、文章的トーン7%だった。私の場合は感情的2%、社会的なトーン90%、文章的トーン6%だった。(計算されていないパーセンテージは固有名詞など、コンピューターが理解できなかった単語のようだ。)また、私たちの文章から、明るい言葉など、他の音調も抽出した。トウェインには明るい言葉が4つ(dear、pleasure、thanks、pleasure)あったのに対し、私の場合は1つ(hope)だけだった。
では、これは何を意味するのでしょうか? トウェインのトーンは1パーセントポイント高かった? 彼は私より4倍も陽気だった? いいえ、この結果の類似性は、実はこのソフトウェアの根本的な問題を示しています。つまり、単語間の文脈が欠如しているのです。このプログラムをテストしていたところ、「私は怒っています」という単語に対して、「怒っていません」と全く同じ「怒り」と読み上げられました。これは、コンピューターが一度に複数の単語を読み取らないためです。そのため、このソフトウェアは望ましくない反応を引き起こす可能性のある個々の単語を見つけるのは得意ですが、それらの単語の全体的な意味は理解できません。自動化されたり、盲目的に使用された場合、これは問題を引き起こす可能性があります。
例えば、パソコンの基本的なワードプロセッサで育った人(私はWord 97で経験を積みました)なら、単語を右クリックして、より重要な響きの同義語に置き換えたときの喜びを覚えているでしょう。「better(より良い)」という単語が「surpassing(上回る)」に変わり、すぐに文章は最初に書いたものとは全く似ても似つかなくなってしまいました。ここでも同じことが起こり、実際、Tone Analyzerには単語を置き換えるための同様のオプションが用意されています。私の文章「Sorry, brain in vacation mode(申し訳ありません、脳は休暇モードです)」は「Grim, intellect successful vacation mode(厳しい、知性は休暇モードに成功しました)」に変わりました。
Tone Analyzerは、期待外れだった唯一の、いや、もちろん最初のライティングツールではありません。しかも、まだ開発中であることは特筆すべき点です。優れた文章を効果的に認識・修正するという大々的な謳い文句の割には、他のツールよりも期待外れです。とはいえ、Tone Analyzerを不公平な基準で評価しているとは思いません。プログラムが社会的な合図や文章スタイルを判別しようとするなら、一度に1単語以上のサンプルが必要です。
この問題はほとんどの文章作成ソフトウェアに共通しており、メールアプリに「ご心配ですか?このメールは送信しないでください」という小さなポップアップが表示されないのもそのためです。ソフトウェアは人間が作成した文章を100%理解できないからです。ただし、一部のソフトウェアはそれに近い理解度を実現しています。
AP通信と提携してスポーツ記事を生成するAutomated Insightsは、ソフトウェアによる言語理解の手法を逆転させています。スポーツのスコアなどの入力データがあれば、コンピューターは形容詞や動詞のバンクを用いてデータを説明できます。これは文章の分析とは逆ですが、考え方は同じです。読みやすく適切な文章を書くためのガイドラインを備えたソフトウェアです。
より限定された目的を持つ Web 上の他のツールとしては、簡潔さと受動態の使用の削減に重点を置いた Hemingway エディターや、テキスト コンテンツ アナライザー ツールなどがあります。
しかし、IBMのツールはそれほどひどいものではありません。テキストを単語ごとに読み取り、それらの単語に共通する意味合いを特定します。ネイティブのメールアプリやプロフェッショナルなメッセージングサービスに統合されれば、間違いなく役立つでしょう。しかし、人工知能の限界に挑戦する現代の世界において、このソフトウェアは、ほとんどのプログラムが真のゴールドスタンダードを達成することからどれほどかけ離れているかを映し出す鏡に過ぎません。