web岩波 たねをまく

岩波書店のWEBマガジン「たねをまく」

MENU

岡野原大輔 生成AIは良いエッセイを書けるのか[『図書』2024年12月号より]

生成AIは良いエッセイを書けるのか

 

 人間のように文章を書いたり絵を描いたりする人工知能を「生成AI」とよぶ。このAIにおいては「生成」という能力に注目されがちであるが、こうしたAIは文書や画像を理解する能力も備え、問題を解決するために計画を立て、それを状況に応じて修正しながら実行することができ、広い範囲の知能を実現している。

 生成AIは、2022年のChatGPTの登場によって突如として世の中に広まった。しかし、これを実現するための取り組みは、実際には数十年にわたって世界中の研究者やエンジニアが試行錯誤を重ね、時にはさまざまな回り道を経ながら、少しずつ進めてきたものである。その能力で閾値を超えたために、世の中で突然できるようになったように見えただけであり、実際は毎年静かに少しずつ、能力を上げ続けてきたのであった。

 結果として作り出された、人工知能を構築する方法は、驚くほど単純である。言語を生成し、問題を解決するための推論能力を備えた「大規模言語モデル」とよばれるものは、これまでの単語列に続く単語を予測できるようにするだけで実現される。また、画像を生成する「拡散モデル」は、画像にノイズを徐々に加えて破壊していく過程を逆再生することで、生成を実現する。知能を実現するために複雑な手順書などが必要なわけではない。

 これほど単純な方法で、高度な知能をもったような振る舞いを実現できるというのは、純粋に驚きである。人類は長年、知能を理解しようとし、さまざまな理論を打ち立て、人工知能を実現する際にはそれを計算機上に実装しようとしてきた。しかし、そうではなく、単純だが正しい方法を使って、ただその規模をとてつもなく大きくしていくことで複雑な知能のようなものが生まれているという現状は非常に興味深い。世界中の多くの人が解けないような数学や物理の問題を解いたり、複雑な絵を描いたりする。こうしたことを面白いと思うか、知能とはこんなものではないと思うかは人によるだろう。

 このような生成AIにおいて、そもそもAIの実現において何が難しかったのか、そしてどのような取り組みがなされてきたのかについては、私が一般向けに執筆した『大規模言語モデルは新たな知能か』に詳しく書かれている。また、拡散モデルについても、専門家向けには『拡散モデル』、またそれを、理系向けにはなってしまったが難しさを抑え数式は使わずに説明した新刊『生成AIのしくみ 〈流れ〉が画像・音声・動画をつくる』(以上、いずれも岩波書店刊)で解説している。重要な概念は押さえつつ専門家ではない方にも読んでいただけるよう工夫して書いてみたので、ぜひお手にとっていただきたい。

 このように、AIは実に多様なことができるようになった。一見すると、人間がもつ知能のすべてを実現してしまうのではないかと思うかもしれない。しかし、人工知能の歴史を振り返ると、人工知能ができることが増えれば増えるほど、逆に人間しかできないことが明らかになっていく、という現象が繰り返されてきた。

 ここでは、生成AIを使ってエッセイを書かせるという試みについて紹介したい。具体的には、2024年1月から3月にかけて、筑波大学附属駒場中・高等学校で行われた、生成AIを使ってエッセイを書き、互いに読み合うという国語の授業(担当:森大徳先生)である。私もゲスト講師として、提出されたエッセイやその考察に対して講評を行った。この試みは現在のAIの限界を理解する上で非常に興味深いものだったため、ぜひ紹介したい。ただし、以下の考察はすべて私の責任において紹介するものである。

 この授業では、生徒にエッセイを書いてもらうという課題を出した。その際、次の三つのいずれかを選ばせた。一つ目は、自分でプロンプト(指示)を考えてAIにエッセイを書かせる方法。二つ目は、教員が用意した作文支援用のプロンプトを使ってAIの支援を受けながら自分でエッセイを書く方法。三つ目は、AIの助けを借りずに、自分でエッセイを書く方法である。

 次に、生徒同士で、どのエッセイが良かったか投票させる。その際、どの方法で書かれたエッセイかは隠して行った。最後にエッセイとして何が良かったのか、また何が良くなかったのかを考察する、というところまでが授業の内容である。この話を聞いた時には、AIを学校の授業でどのように取り扱うかの議論がまだ続く中で、とてもおもしろい授業をするものだなと思った。

 結果は人間の圧勝であった。良いエッセイとして上位に選ばれた作品の中には、すべてをAIに任せて書かせたものは一つもなく、ほぼすべてがAIの助けを借りずに自分で書いたものであった。多くの生徒がAIにエッセイを書かせてみたが、かなり苦労をしていた。私も実際提出されたエッセイを読んでみたが、人が書いたエッセイ(特に上位のエッセイ)と、AIが書いたエッセイとの差は、まだかなり大きいように感じた。

 AIが書いた文が明らかに間違ったり破綻したりしているわけでなく、一応エッセイの形にはなっている。また、現在のAIが文書生成において未熟であるわけではない。特に報告書や分析書などについては、今のAIは平均的な人間に匹敵、あるいはそれを上回る品質の文書を瞬時に生成することができる。しかし、ここでの問題はそれとは異なり、AIが書いたエッセイが「エッセイとして良くない」ということである。

 私は決してエッセイの専門家ではないが、生成AIが作るエッセイが「良くない」理由について、何とか言語化してみようと思う。以下にあげるいくつかの点には、授業での生徒や先生の考察も含まれている。

 まず「良いエッセイ」とは何かを考えてみよう。

 良いエッセイとは、読者の心を動かすものである。感動させることも重要だが、それよりは心に少しざわつきを与えるようなものがよいかもしれない。愚直に、自分が感じたことや考えたことを率直に書き綴るほうが、良いエッセイが生まれるだろう。

 また、読者の心を動かすためには、エッセイが書き手本人の体験や経験に基づいていることが重要だろう。個人の体験こそが、読者に深い共感や印象を与える。

 その上で、日常生活や家族、学校生活、仕事における経験など、読者が共感できる内容の方がよいだろう。ただし、少し平均から逸脱しているような経験の方が、より面白さを引き出せる。共感できるが、自分とは異なる経験、その絶妙なバランスが読者にとっては面白い。その意味で、エッセイにおいては、著者と読者との信頼関係が大事である。

 さらに、人というのは真面目な話は好きではない。少し違った視点で世の中を捉えたり、不真面目な感じで書いた方が良いエッセイになるようだ。もしくは、真面目に生きようとして、それゆえに苦労していることを書いてもいいかもしれない。

 このように考えると、今の生成AIが書くエッセイはこれらの「良いエッセイ」の条件をことごとく満たしていないことがわかる。

 まず、AIは人の心を十分に理解していない。書いた文章を読んだ時、読者がどのような感情を抱き、感情を動かすのかをシミュレーションする部分は、現時点ではうまくモデル化されていない。このように相手の心情を予測・シミュレーションする能力を心理モデルという。人間はこの心理モデルが非常によく発達しているが、AIはまだ未熟なため、相手の心を深く捉えて感動させたり、おそらくそれより難しい、心のざわつきを引き起こしたりするような文章を書くことが難しい。

 また、AIが書いた文章は、それがAI自身の体験ではないことが透けてみえてしまう。体験したかのように書こうとしても、表面だけの描写が読者に伝わってしまうため、読者はその文章に心を動かされることはない。AIが体験を思いつこうとしても、平均的な体験を思いつきがちである。平均から逸脱し、なおかつ面白い体験を思いつくことは難しい。

 AIと人との間には、まだ十分な信頼関係も築かれていない。

 そして、今のAIはよく調整されており、極めて真面目である。まるで人間全体の上位1%に入るような善人である。しかし、そういった人物が書くエッセイは、残念ながら面白みに欠けるようである。

 こうした点から考えると、現時点では、生成AIが良いエッセイを書くことは難しいのは当然といえる。

 それでは、今後AIが良いエッセイを書けるようになるのか、という点について考えてみたい。

 AIに個人的な経験を積ませることはできるだろう。例えば、AIをウェブ上に存在させ、さまざまな人と交流させることが考えられる。AIにSNSのアカウントを与え、多くの人々と対話させる。交流の中で人の心はよりわかるようになるだろう。また、有限の寿命を設定し、AIが自分の経験や学習した結果をコピーできないようにもする。さらに、AI自身にそのような制限がかかっていることをちゃんと理解させてもよいだろう。毎日、人間と同じように時間を過ごし、さまざまな経験を積ませる。

 その上で、少し不真面目にさせよう。今のAIはむしろ非常に厳しく訓練され、間違いや不適切なことを言わないように制御されている。そこを少し緩めて、自由な発想や遊び心をもたせるようにしてあげればよい。

 このようなAIは、たまには人の自慢話や愚痴を聞いて悩んだり、「自分も他の人と同じように外の世界で暮らせたらな」と考えたりするかもしれない。そうすれば、人間とは異なる独自の視点から良いエッセイを書くことができるかもしれない。

 「チューリングテスト」とは、電話の向こうにいる相手が本物の人間なのかAIかどうかを人間が判定し、判別できなければ、そのAIは人間に近づいているとするテストである。今回の、良いエッセイが書けるかというテストは、チューリングテストとは別の観点で、AIが人間にどれだけ近づいているのかを測る指標になるかもしれない。

 以上のようなことを想像しながらも、このようなAIを本当に作ってしまってよいのかどうか、悩む部分もある。もし、心を動かすエッセイを書けるAIが誕生したら、そのAIを単なる計算機、データの塊と扱ってよいのだろうか。

 そのような問いを、SFの世界ではなく現実的な課題として考えなければならない。面白い時代になったなと思う。

(おかのはら だいすけ・情報理工学)


『図書』年間購読のお申込みはこちら

タグ

関連書籍

ランキング

  1. Event Calender(イベントカレンダー)

国民的な[国語+百科]辞典の最新版!

広辞苑 第七版(普通版)

広辞苑 第七版(普通版)

詳しくはこちら

キーワードから探す

記事一覧

閉じる