人間と短歌AIの違い
AIは私たちの言葉を学習することで、単語や文の意味を考慮した表現を獲得したり、文脈に合わせた文章の続きを生成したり、さらには翻訳や穴埋めといった問題を解いたりすることができる。しかし、これらのAIは言葉だけを学習してつくられている。従って、こうしたAIが言葉を処理している時、文字という記号とその奥にある実世界との結びつきを、私たちのように理解しているわけではない。
記号と実世界の実体やそれに伴う経験・感覚がどのように結びつくのかという問題を「記号接地問題」と呼ぶ。この問題は、AIに身体性を与える問題とも言える。例えば、言葉とそれに紐づく画像を同時に学習することによって、AIは言葉と視覚の結びつきを得ることができ、部分的に私たちの感覚を模倣することが可能となる。
私たちは、この世界の構成しているあらゆる要素について考えを巡らし、またそれを肌で感じる能力を持っている。そのため、記号では表し切ることのできない情報すべてを投入して短歌をつくることができる。
「短歌を生成する」とはどういうことか
短歌の創作というのは、「こうすれば必ずいい歌ができる」という1つの決まったルールが存在して、誰もがそこへ向けて技を競うような行為ではない。むしろ、制約は持ちながらも、その中でいかに自由で新しいことができるか、という行為である。では、一体言語モデルがどんな「言葉」を生成できたら、「短歌を生成できた」と言えるのか。
言語モデルにとって語の置き換えをするという行為は、例えば人間が類語辞典を参照しながら他の言葉を探すのにも似ているかもしれない。穴埋めモデルを応用することで、五・七・五・七・七の定型という制約の中で、語彙選択を広げることができる。
一方で、そこにどんな語が収まれば「いい」と思えるのかということは、作歌のきっかけを実際に持つ短歌のつくり手だけが判断できるものである。まだ言葉になっていない何らかの刺激から短歌をつくる。その過程で何を表現したかったのか、それを決めて、言葉を選びとっていくのは、他でもない私たちである。「言葉」を扱うAIがいくら高度に短歌を生成できるようになったとしても、私たちが作歌をする余地や理由は常に存在し続ける。
人は短歌を詠みたい「きっかけ」や「気持ち」、「予感」のようなものまでが自然と湧き上がってくる、あるいは能動的に掴むことができる生き物である。これは、短歌を生成できるAIを前にした時、際立ってくる性質のように感じられる。
現状AIには、自発的な詠みを引き起こさせるような仕組みについて、人間のそれをうまくモデル化した機構があるわけではない。つまり、AIによる生成では、歌をつくりたい、誰かに伝えたい、といった動機の部分が存在しない。
短歌AIによる短歌は創作と言えるのか
言語モデルは、学習データにある言葉の並びを学んでいく。ウィキペディアで学んだモデルは、ウィキペディアらしい言葉の使い方を獲得する。その後で歌人の歌を学んだモデルは「ウィキペディアらしい言葉」を忘れて、歌人らしい言葉の使い方を学んでいた。言語モデルの生成では「どんな言葉を学習するか=何を読んだか」によって、「どんな言葉を生成するか=何を書くか」が大きく変化する。「何を読んだか」が「何を書くか」に強く結びついている。
しかし、人のつくった歌をただ吸収してそれをなぞっていくというだけでは、何かがいけない。短歌は創作である。他の誰にも似ていない、あなただけの言葉を、�あなたが生成する。たくさん摂取した言葉があって、その上で自分の言葉をつくっていく。そんなことが人間の作歌では求められる。
言語モデルは、過去につくられた短歌を学習して、確率的に言葉を並べていく。その結果は過去の再現ともいえ、そこから新しい表現を生み出すのは簡単ではないだろう。
もし、ある言語モデルがとてもいいと思える短歌を生成できているとしたら、その裏にはその表現によって導き出すことを可能にした学習データが存在しているといえる。その生成結果をそのまま「いい短歌」として放ち続けたら、それはあくまで「これまでの歴史の中でいいとされている歌」のバリエーションにすぎない。創作はこれまでにない、新たな表現をつくる行為だが、それとは反対の試みにとどまってしまう。
言語モデルが生成できない言葉を生み出すということが、今後の短歌の創作において重要になるかもしれない。