はじめに
みなさんはじめまして。Strategic AI Group (SAIG) の加藤です。
2024年5月28日(火)から31日(金)まで開催された人工知能学会全国大会(JSAI2024)に参加してきたので、その様子を報告します。当社はゴールドスポンサーとして、SAIGから4名のメンバーが会場に参加しました。これは2019年以来のスポンサーブース出展となります(2020年以降もスポンサー活動は継続しています)。ブース出展の合間には、複数のセッションにも参加しました。
人工知能学会全国大会とは
人工知能学会は、人工知能(AI)に関する研究発表を行う国内の学会です。機械学習からAIの基礎理論、応用研究に至るまで、幅広いテーマが取り上げられます。今年で38回目となる全国大会は、静岡県浜松市のアクトシティ浜松で開催されました。
一般セッションやポスター発表をはじめ、テーマに沿った発表を行うオーガナイズドセッションや企画セッション、企業の方が事例紹介などを行うインダストリアルセッションなどがあります。
学会公式の発表によると、本大会には約3,790名(内現地参加約2,900名、社会人約3,010名、学生約780名)の方々が参加され、合計946件の発表が行われました。参加者数3,567名で過去最多となった2023年度を上回り、本大会で過去最多記録を更新しました。
スポンサーブース
ブースでは、SAIGで取り組んできたAI案件を中心に実績の紹介を行いました。当社をご存じなかった方から、競技プログラミングコンテストや技育プロジェクトの支援企業として認知いただいていた方まで多種多様な学生や企業の方と交流を持つことができ、非常に有意義な時間となりました。
リクルーティングの一環で、ブースに来ていただいた学生の方には、会社紹介のパンフレットと共にノベルティとしてトートバッグを配布しました。
多めに用意したつもりでしたが、気が付けば最終日の早々に配布が完了しており、改めて多くの方々にお越しいただいたことを実感しました。
セッション聴講
スポンサーブース出展の合間を縫って聴講した各発表の中から、参加したメンバーが興味深いと思ったものをいくつか紹介します。
[4P3-OS-17c-03] 対立する立場間でのコミュニケーションにおける生成 AI の介在による対立緩和
意見の対立が生じるような対話において、攻撃的またはネガティブな表現を対話介入AIシステムによって発言内容を保持しつつ、共感性の高い表現に書き換えることによるコミュニケーションの質向上の可能性について検証した研究です。
実験では、ディベートテーマに対して2つの相反する意見のうち、参加者2名での対話を経てどちらかの意見に統合することが求められました。このとき、対話介入AIシステムの介入の有無が対話の質に与える影響が評価されました。
その結果、対話介入AIシステムによって、対話相手に対する誠実さの認識を低下させる一方で、温和さや親しみやすさ、話の収束度に関する肯定的な印象を与えることが確認されました。また、自由記述アンケートからも、システムの介入によって、対話相手に対する共感的返答を示したり、発言のトーンが穏やかになったり、相手に対して温和な印象を抱いたりした旨の回答が得られました。
利用者の自己表現の自由や発言意図を損なわないようにするための倫理的配慮について議論の余地が残されているものの、対話介入AIシステムによって心理的負担の低下とコミュニケーションの活性化を実現させられる可能性が示されました。
当日の質疑応答でも話が出ていましたが、コールセンター等のストレスフルな環境での活用が期待される研究成果でした(加藤)。
[2A5-GS-10-03] 大規模言語モデルを用いた都市人流データの解析と擬似データ作成への応用
データ収集にコストと制約のかかる都市人流データについて、大規模言語モデルを利用して疑似データの生成を試みた研究です。
研究では、人の行動パターンについて、活動内容トークンに個人属性トークン(性別と年齢層、職業)を加えた一連の活動シーケンスを作成し、Generative Pre-trained Transformer (GPT) を学習させ、過去の活動内容から次の活動の予測を行いました。このとき、一人辺り12時間の活動を15分単位で分割し、全48ステップの活動シーケンスを作成しました。
実験では、GPTに入力するステップを1つずつ増加させ、残りのステップを予測させた際の予測精度を実データとの比較に基づいて算出しました。学習データは、「人の流れプロジェクト」で提供されている日本の都市圏における約600万人/1日分の活動データが使用されました。
その結果、入力するステップ数の増加によって予測精度の向上が確認されました。ただし、入力するステップ数が少ない場合でも、予測精度の低下を招いているのは勤務時間のわずかな延長などの小さなズレであり、予想された活動シーケンスは実際の活動に近いことが確認されました。これらのことから、大規模言語モデルを利用した疑似データ生成の有用性が示唆されました。
都市人流データと大規模言語モデルを組み合わせた初期の研究であり、今後の性能向上と応用研究の創出を期待したいところです(加藤)。
[1T3-OS-32a-05] 物語構造分析に基づくLLMを活用した創作支援を目的とするインタラクティブストーリー生成システム
LLMを使ってAIの理解度によらず直感的な操作で必要項目を埋めるだけで物語が作成できるインタフェースを作成して、実際に制作活動に使ってもらったという内容の研究です。
工夫されている点としては、先行研究で述べられている「物語構造」という物語の展開パターンやそれらに紐づく典型的な要素の一覧をLLMの制御の中に取り入れているところです。
実際に複数のプロの方に本提案システムを使ってもらって、商業誌で『ブラック・ジャック』の新作読切を載せる結果になりました。
使い勝手のフィードバックとしては自分で1から考えるよりかは時間が短縮できるとのでプラスの評価を受けたようです。
ただ一方でLLMの特性上「どこかで見たことがある話」の提案が多くでてきて新規性がないというマイナスの評価も受けたそうです。
そういった課題はあるものの、一定の評価を得ているため、LLMを物語作成へと活かすために今後の発展が期待されるものではないかと思わされました。
今後の研究で、ランダムでユーザが入力したワードから離れたワードを結果に出すことで新規性を出すことができるのではないかという展望を話されていました(松岡)。
[1N4-OS-18-02] 歴史学分野における漢文テキストマイニングの研究の紹介
歴史研究でテキストマイニングをどのような推論で行っていくかという具体的な方法論の発表です。
人文学は一般的にAIの文脈で語られることをあまり聞かない気がするので、筆者が個人的に面白いと思った発表です。
最近の歴史研究では昔よりもアクセスできるデータが増えたために、大量のデータを研究に使える良い面もある一方で、自分の仮説に都合いいデータを切り出してしまう危険性が増しているそうです。
そこで従来のような仮説を立ててからデータを検証するのではなく、データの全体を見た上でそこから仮説を探るEDA(探索的データ分析)の手法の重要性が増しているそうです。
EDAの手法をとってデータの全体を見ることで、従来の方法は到達できなかった仮説にたどり着くことができるため、歴史研究をさらに進めることができたといった内容の話をされており、大変感銘を受けました。
具体例を1つあげると、古代中国の王朝である北魏(386~534)のお墓に記された詩について研究をされております。
従来は亡くなった方を褒め称える詩が書かれているため、どれも同じような詩が書かれていると思われていたものの、EDAを使ったことで定量的に異なる表現が使われる傾向にあることがわかったそうです。
分析を行う際も、既存のライブラリでは対応ができないので、MeCabで辞書を自作して分析を行ったそうです。
これは話を聞いた上での個人的な感想ですが、今までとは異なる分析手法を用いることで新たな知見が得られて、その知見を元にまた新たな知見が得られてやがて誰もが驚くような大きな発見につながる可能性もある、と考えるとかなりワクワクする話だと思わされました(松岡)
おわりに
学会名が指す通り、人工知能に関連した多様なテーマのセッションで発表がされていたものの、主要な技術要素として大規模言語モデル (LLM) を採用した研究が多かった印象を受けました。
ブースにお越しいただいた方からもLLMの話題が出てきており、それぞれの視点からLLMをどう捉えているか議論でき、良い刺激を受けることができました。
この注目の領域であるLLMの社会実装に向けて、SAIGではチームを強化中です。2024年6月現在、シニアNLPエンジニア、NLPリサーチエンジニア、NLPエンジニアを特に求めています。興味のある方は、合わせてキャリア採用ページをご覧ください。条件は応相談ですので、ぜひご応募をお待ちしています。新卒採用も含め、幅広くメンバーを募集しています。
皆さんと一緒に働ける日を心待ちにしております。どうぞよろしくお願いします!