2024年11月23日に開催された「CEDEC+KYUSHU 2024」より、「ゲーム会社の業務効率化に生成AIは役立つか?」のセッションをレポートする。
目次
スクウェア・エニックスのAI開発部門による生成AI活用の実践報告。社内向けチャットボット開発やテキスト作成支援など、ゲーム開発現場での具体的な取り組みと、エンタテインメントならではの課題について解説したセッションをお届けする。
スクウェア・エニックスのAI&エンジン開発ディビジョンに所属するAIプログラマーの遠藤輝人氏とAIリサーチャーの森友亮氏が、同社における生成AI技術の活用事例と今後の展望について語った。
社内向けチャットボット「ひすいちゃん」の事例から、テキスト生成支援、実験的なアプリケーション開発、そして生成AI活用における倫理的課題まで、幅広いトピックについて具体的な取り組みが紹介された。
「RAG」を使い社内の独自エンジンの情報を出力できるチャットボット「ひすいちゃん」の事例
「ひすいちゃん」は、社内向けの多機能チャットボットで、専用チャットツールやSlackで利用可能なシステムだ。
本システムの機能として、チャットによる対話機能、Slackでの自動返答、画像解析(OCR)機能、ドキュメントファイルの解析などを備えている。また、多言語対応も特徴的で、Azure AI Translatorで言語を判定し、日本語、英語をはじめとする各言語に対応するシステムプロンプトを使用して応答を行っている。
最大の特徴は、社内で開発された独自ゲームエンジンの知識を持っているという点にある。というのもこのエンジンに関する情報はインターネットや書籍には存在せず、一般的な大規模言語モデルでは回答できない内容を扱うことができる。
「ひすいちゃん」はGPT-4oを採用しており、RAG(Retrieval-Augmented Generation)技術を活用して、5,500ページに及ぶエンジンのドキュメントやゲーム開発チーム・エンジンチームとのやり取りをベクトルDBに格納し、参照しているのだという。
システム構成は主にAzureクラウドサービスを利用し、愛嬌のあるキャラクター性を持たせたシステムプロンプトの設定と、RAGを使用した回答生成の仕組みを備えている。
「ひすいちゃん」の導入によるメリットとして、ユーザーが気軽に質問できる環境が実現し、エンジン利用者の問題解決が迅速化された点が挙げられる。また、エンジン開発メンバーの業務負担が軽減されただけでなく、回答品質の向上につながるドキュメント作成へのモチベーション向上という効果も生まれている。
このシステムは、社内ドキュメントをRAGで活用した生成AIの実践例として、ツール利用者の課題解決とツール開発側の効率化を同時に実現している。さらに、開発メンバーのドキュメント作成への意欲向上という副次的な効果も生み出しており、社内システムとして高い価値を提供している。
テキスト作成支援における生成AIの活用
テキスト作成支援において、シナリオ作成のサポートは重要だが、それ以外の様々な資料作成にも生成AIの活用が期待されている。
例えば、社内向け勉強会の告知や収集情報の分析など、幅広い文書作成のニーズがある中で、生成AIチームには「生成AIで何ができるか」を具体的に示すことが求められているという。そこで実際に生成AIで作成した文章を提示することで、その可能性がより明確に伝わるという効果がある。
なお、生成AIを使用せずとも生成AIの説明や文章作成は可能だが、実際に生成AIを使って、生成されたドキュメントを「見せる」ことで、より身近なものとして捉えられ、また想定外の発想や表現も生まれる可能性がある。
また、社内外への技術紹介において、実データを共有できない場合もある。その際に生成AIを活用してダミーデータを作成することで、情報共有のハードルを下げることができる。
グローバル環境を意識する中で、日本語以外での情報共有ニーズも高まっている。翻訳専用ソフトも多数存在するが、汎用的な生成AIを使用することで、文章作成から翻訳、要約など、複数のタスクを柔軟に組み合わせることが可能となる。さらに、音声入力や画像など、より豊かな入力情報を扱えるマルチモーダルな処理も実現できる。
AIによる情報処理は、文章による思考の学習、画像による視覚情報の共有、音による接近の検知など、様々なモーダルへと拡大している。シングルモーダルからマルチモーダルへの展開が進む、そんなマルチモーダルに関する取り組みをしているという。
テキストを扱う生成AIは日常的な文章作成作業を効率化することができる。例えば、その活用方法を生成AI自身に説明させることも可能だし、また、ダミーデータ作成への応用により、情報共有をより柔軟かつ容易にすることができる。
AI技術を気軽に試せるアプリやツールを試験的に実装、生成AIでどんなことができるかを実感してもらう
AI技術を気軽に試せる環境を提供するため、簡単なアプリケーションやツールの試験的な実装を行っているという。
この取り組みの目的は、生成AIの可能性を開発者自身が実感として得ること、実際にAIツールを使用してもらうこと、そして「AIをこのように活用できるのではないかという発想のきっかけを提供することにある。
その具体例として、マルチモーダル生成AIを活用した魔方陣アプリケーションの例が紹介された。
このアプリケーションは、任意の魔方陣から魔法を出力する機能を持ち、大規模マルチモーダルモデルが独自の魔法を生成し、使用者が望ましいフォーマットに整えて出力することができる。この実験的なアプリケーションを通じて、マルチモーダルAIの可能性とフォーマット制御の検証を行っている。
実装面では、社内Webサイトに埋め込まれたユーザーインターフェース、Azure OpenAI Serviceなどの社外生成AIサービス、そしてこれらを接続するサーバーレスサービスという構成を採用している。サーバーレスアーキテクチャを選択することで、リソース管理の負担を軽減し、アプリケーション開発に注力することが可能となった。
フォーマット制御にはFew-Shot学習を採用し、サンプルを提示することで望ましい形式での出力を実現している。
セッションでは実際にいくつかの画像の認識例も紹介された。重要なのは、このような技術をそのまま組み込むことではなく、その可能性を示すことで新たなアイデアを喚起することにあるという。
エンターテインメント分野だからこその課題も
しかし、生成AIの活用にはいくつかの課題がある。
それは、生成AIの活用において、常に望ましい回答が得られるわけではないという点だ。特に「ハルシネーション」と呼ばれる、誤った情報を正しいものとして回答してしまう問題は重要である。また、専門性の高いタスクにおいては、安定した回答が得られない場合もあり、偶発的な正解ではなく、安定した回答品質の確保が求められるという。
また、ゲームコンテンツへの応用においては、特有の倫理的・権利的な課題が存在する。シナリオやセリフの生成において、問題のある内容や権利侵害を避ける必要がある一方で、エンタテインメントならではの複雑な要求も存在するのだ。
例えば、倫理的に問題のある発言をする悪役キャラクターの描写など、現実世界の倫理基準では制限されるべき内容が、創作表現として必要となるケースがある。
この課題を象徴的に示すのが造語である「ハーフエルフ・ハーフ問題」である。架空世界において、ハーフエルフが差別される設定を扱う場合、その差別意識を持つキャラクターの描写は物語上必要となる。
しかし、そのような設定を含むシナリオを生成する際、ユーザーとの対話において同様の差別的な応答を生成することは望ましくない。これは、創作世界における倫理観と現実世界の倫理観を適切に区別し、扱う必要性を示している。
このように、生成AIをエンタテインメントコンテンツに活用する際には、現実世界とは異なる倫理観や常識を扱いながら、同時に現実の倫理基準も尊重するという複雑なバランスが求められるのだ。
生成AIの活用にはいくつかの課題があるのは間違いない。だが、使う用途や場所次第では大きな成果を発揮するのだ。今回の発表は、業務の効率化のために生成AIの活用に関するヒントが得られるセッションだった。
※画面は開発中のものです。
コメントを投稿する
この記事に関する意見や疑問などコメントを投稿してください。コメントポリシー