本日8月24日に行われた「CEDEC2021」のセッション「冴えるヒロインの作りかた ~自然言語処理AIによるキャラクター性の抽出と反映への事例紹介~」の内容をレポートする。
本セッションに登壇したのは、バンダイナムコ研究所の技術開発本部先端技術部AI課に所属する頼 展韜氏と石原 健司氏。AIがいかにテキストでキャラクターの魅力を立たせるか、AIがどのようにセリフ制作現場をサポートするか、といった観点からセッションを進行していった。
自然言語処理AIの活用シーンや、トレンドがルールベース手法からディープラーニング手法へと移行しているという前置きがありつつ、頼氏が今回の主役(ヒロイン)として紹介したのは“ミライ小町”。CEDEC2020のセッションでも取り上げられるなど、キャラクターに適応できるさまざまな技術分野で活躍している。
チャットボットのような汎用的な自然言語処理は機能性や正確性を重視して、万人向けのものになっているが、キャラクターのための自然言語処理においては、フィラー(意味のないつなぎ言葉など)・呼称・語尾・内容などを通じて、面白さやキャラクターらしさ、独自性を生み出している。つまりは(ヒロインとして)冴えているというわけだ。
上記を踏まえて、キャラクターを冴えさせるためのポイントとして挙げたのは「特徴のある魅力的な個性」「個性に沿って首尾一貫した行動」「驚きと感動を与える」の3点。それらに対するディープラーニングの手法を用いたアプローチを、実例を交えて紹介していった。
キャラクター性を抽出するための方法はシンプルで、セリフに含む個性をAIに学習させていくのだが、その際にはマンガやSNSといった、媒体の特徴に特化した前処理を行う必要があるという。具体的には、ほかのキャラのセリフの引用など、キャラぶれの要素になりそうなものの除外や、絵文字や顔文字などの感情表現の取り入れ方などに注意していく。
また、キャラクターの違いを強調する比較学習を用いる点にも言及。アンカーに対して、ポジティブ(対象キャラクター)とネガティブ(対象以外のキャラクター)に分けて学習したセリフの分布をバラけさせることで、よりキャラクター性を抽出させていく。
上記を実際に行うために制作されたのが、セリフチェックツール「AIセリフ監督」。セリフ監修をキャラクターの個性・話し方を学習したAIで支援するシステムとなっており、いわゆる“キャラぶれ”を発生させないために、シナリオライターがセリフ制作時に利用できるものだという。
バンダイナムコとしてはCEDEC2016時点ですでに同様の取り組みは行っていたということだが、本ツールでは入力したセリフのキャラクターらしさを数値化するというコンセプトを踏襲しつつ、シナリオライターがセリフを入力した際に、“らしさ”の要素をより抽出できるような仕組みに落とし込んでいる。
その一方で、数値化の課題として同じセリフに対してキャラクターらしさの判断基準は人によって違う点を挙げた頼氏。その対策として過去のセリフ履歴から類似の新規セリフを作成できる「類似セリフ検索」の機能を実装している。こちらは言葉の意味で検索を行うために類義語も対応でき、セリフの出典も表示可能だ。
アニメ・マンガのゲーム化作品で原作キャラクターのセリフ監修時に使用したり、類似セリフの抽出に役立っているといったシナリオライターからのフィードバックにも触れ、実際に4社以上が複数タイトルで導入していることも紹介された。
その一方、セリフ作成は属人的な作業のため、担当者の変更によるキャラぶれやセリフが担当者の想像の枠組みを超えられないといった課題にも言及。その解決方法として、AIモデルによって生成したセリフを蓄積することで人間に依存しないセリフづくりができる点に触れ、それが結果的に冴えるセリフを作る上でのキャラクター性の反映にもつながっていくのだという。
AIによるセリフ生成、と簡単に言っても自然なセリフを生成するためには莫大なデータ量が必要という大きな課題がある。実際、Facebookが公開した人間らしい会話ができるAIモデル「BlenderBot」では、学習データとしてSNS上の会話データ15億件が必要だったそうで、そうした観点からも学習データをゼロから準備するのは現実的ではない。
そこで、人間における会話の個性が生まれる過程を踏まえて、少量のセリフデータで学習したセリフ生成モデルを用意。汎用セリフに関してはインターネット上の大量のデータで事前学習させ、その上でキャラクター独自のセリフデータで転移学習させることで、キャラクターの個性・話し方を反映したセリフを生み出すことができるという。
その実施例として「ミライ小町対話システム」を制作。この場合のミライ小町のセリフ集は約500件ほどに収まっており、このシステムは実際にグループ内のチャットボットとして実装されており、世間話やグループIPに関する話題で雑談が可能だという。
ここまではディープラーニングにおける冴えるセリフの作りかたに触れてきたが、後半は石原氏にバトンタッチし、ルールベースにおける実例を紹介していくことに。
ディープラーニングでキャラクターらしさを実現するためには、先ほども触れた通りキャラクターのセリフデータが大量に必要になること、生成モデルがどう学習するかがブラックボックス化されるために品質の担保が困難になることが挙げられる。
その上で、らしいセリフを担保する取り組みとしてルールベースで実装しているのが「役割後変換モジュール」。これはキャラクターごとに“役割語”を変換するルールを用意するというものだ。
日本語学者の金水敏氏が定義したという役割語は、“特定の人間像を思い浮かべることができる特定の言葉遣い”、もしくは“特定の人物像から、使用しそうな言葉遣いが思い浮かべられる”ものを指す。セリフの語彙や語法が人物像を生成しており、その語彙や語法は、内容語や機能語に違いが現れるという。
このモジュールは、モデルが生成した返答文をキャラクターらしく言い換えるために利用される。その流れとしては、セリフを形態素と呼ばれる細かい単位に分解した上で、成否表現ベースの変換ルールを適用するというもの。これによって単なる単語の並びがキャラクターらしい単語の並びに変換される。
モジュールには変換ルールの作成コストが高いことや、一辺倒な口調になってしまうといった課題があるが、ルール追加作業フローを可能な限り自動化したり、変換候補が複数ある場合に確率的に選択したりといった対策を行っている。また、本モジュールは対話フロー以外にもキャラクターらしいセリフの学習データ作成に利用されているという。
締めくくりとしてこれまでの内容をまとめつつ、エンタメ業界における自然言語処理の研究開発はブルーオーシャンであることに言及。これはエンタメ用語の独自性から大手ソリューションの対応が難しいこと、機能性重視の既存研究と評価基準が異なることが挙げられる。
その一方で、諸外国に比べると日本のAI研究は遅れている現状もあり、かつ言語の壁があることから日本独自での研究が必要ということで、価値ある研究を積み重ね、オープンリソースでイノベーションの加速を促していきたいとその展望に触れた。
最後に、より冴えるヒロインにしていくため、より豊かなセリフ表現、そしてセリフと連動したマルチモーダルモデル(※さまざまな種類の入力情報を利用したモデル)の用意を目指してしていくことに言及しつつ、質疑応答を経てセッションは終了となった。