フューチャー技術ブログ

NLP若手の会 (YANS) 第13回シンポジウム 参加レポート

はじめに

はじめまして!2018年8月半ばからフューチャー株式会社にキャリア採用で入社した田中駿と申します。Strategic AI Groupに所属しています。大学4年次より自然言語処理を専門に研究・開発を行っており、2018年からはNLP若手の会(YANS)の委員も努めています。どうぞよろしくお願いいたします。

さて、弊社は8/27~29に香川県で開催されたYANSにゴールドスポンサーとして私、貞光、小池の3人で参加してきました!

この記事では、YANSの参加レポートとして以下のトピックを中心に共有します。

  • 弊社の発表内容
  • 興味深かったポスター発表
  • 全体的な感想

開催場所!!

2018年のYANSは香川県高松市で開催されました~!花樹海という香川県内ではなかなかなグレード(らしい)の旅館で開催されました。山の上にある(なんとエントランスが8F)落ち着いた佇まいの気品のある旅館でした。

屋外のデッキからは電車が見えて最高でした。

弊社の発表内容

弊社の会社についてと、私たちの所属するStrategic AI Groupの紹介を口頭発表・ポスター発表で行いました。
スポンサーブースには非常に多くの方が来てくださり、NLPを始めとするAI関連の取り組みに興味を持ってくださりました。弊社はBtoB事業が多く、一般の方には認知されづらい部分が多いので、スポンサー活動などを通してより多くの人に事業内容の面白さ、仕事のやりがいを伝えていきたいなと思いました。

▲ブースターセッションで話してるわたし。オフィスの綺麗さについてアピールしているところ。 ▲イベントの紹介をする貞光。年に何回か社外の方を招待してイベントを行っています。 ▲ハイテンションでポスター発表する小池。多くの人に足を運んでもらえました。

今回スポンサーブースで展示していたポスターを公開します。
NLPに限らず、ワクチン開発や牛の発情タイミング予測など……かなり幅広い案件に取り組んでいます!

面白かった発表

参加メンバが興味深いと思った発表を紹介します。

テキスト平易化における難易度の制御

西原大貴, 梶原智之, 荒瀬由紀 (阪大)

文章の平易化手法が多くある中で、本手法は難易度を指定して生成することを可能とする手法です。
学習コーパスには、元文と、それに対する言い換え文の難易度が記されているnewselaを用い、その難易度をNMT(Neural Machine Translation)の入力信号として付加する、というシンプルなアプローチでです。
従来手法に比べ、各難易度のリファレンス文に対するBLEU(機械翻訳で主に用いられる指標)やSARI(テキスト平易化で主に用いられる手法)で改善を示しています。newselaは1つの元文に対し、すべての難易度での言い換えが行われているわけではない、というのがタスクとしての奥行を感じました。今回は、難易度を単なるラベル情報として入力していますが、難易度の本来意味する連続値として扱うことで、データスパースネスにも頑健に働き得る可能性もあり、今後の発展が楽しみな研究です。

人手による感情ラベル付けにおける応答時間に着目した感情推定難易度の評価

山下紗苗, 上泰 (明石高専), 加藤恵梨, 酒井健, 奥村紀之 (大手前大学)

感情推定の難易度と、そのアノテーションの時間との間で相関をとろうと試みた意欲的な研究です。
今回アノテーションの対象としていたのは著者のツイートで、著者の知人がアノテートするほど、時間は短くなると仮説を持っていたそうですが、実験結果では真逆、つまり著者を全く知らないアノテータのアノテーション時間の方が短い、という傾向が得られたようです。書き手を知っているが故に、いろいろと深く考えてしまうのでしょうか?当初の仮説と逆の結果を率直に発表する、というのも若手の会の面白いところで、良いところだと思います。今回の結果を受けて、今後どのように本研究が展開していくのかとても楽しみな研究でした。

五感に基づく言語表現における個人のバイアスとその補正

大葉大輔 (東大), 吉永直樹 (東大/生産研), 赤崎智 (東大), 豊田正史 (東大/生産研)

人によって同じ「辛い」という単語でも、個人のバイアスが存在するために人によって捉え方が異なります。この研究では、個人のバイアスの分析をすることによって、「辛い」といった表現に対する捉え方のバイアスを補正することを目的にしています。
手法としては、大規模コーパスから分散表現を用いて単語ベクトルを獲得し、個人の文書を用いて追加学習することによりバイアスの補正に使用している。発想が非常に面白く、表現の捉え方の違いによるコミュニケーション齟齬の減少に貢献するのではないかと思いました。

RUSE: 文の分散表現を用いた回帰モデルによる機械翻訳の自動評価

嶋中宏希 (首都大), 梶原智之 (阪大), 小町守 (首都大)

機械翻訳における自動評価を提案している研究です。
機械翻訳では、BLUE値等の評価指標を使われることが多いですが、これらの評価はN-gramに基づく素性を利用しており、意味的な情報を扱えていません。この研究では、分散表現および回帰モデルを用いて機械翻訳の自動評価を行っており、既存の提案指標よりも人手評価との相関が高いことが報告されています。評価尺度を新しく提案するというアプローチではなく、評価を機械にさせてしまおうという発想は非常に面白いと思いました。

さいごに

今回のYANSは委員の仕事などで朝が早かったため、なかなかハードでした…。
一方で今までお話ししたことのなかった多くの研究者、企業の方々と意見交換ができ、有意義な3日間となりました。栗林公園を散策したり、ボードゲームやインディアンポーカー(独自ルールのやつ)をしたり。。とても盛り上がり、楽しかったです。笑
そして最終日には念願の讃岐うどんをいただきました、食べたすぎてたまらなかったので写真とるのを忘れてしまいました。

▲栗林公園の橋。まったりできました

今後も言語処理界隈のイベントには積極的に参加していきます。
お会いした時はどうぞよろしくお願いいたします。

フューチャー株式会社では自然言語処理の新卒・キャリア採用、インターンを積極募集中です!

社員の関係がとてもフラット、メンバ間での連携・共有がしっかりと行われており、雰囲気も良く、切磋琢磨できる良い環境だと思っています。そしてなんといってもオフィスがきれいです!!笑

見学や面談など、いつでも受け付けているのでぜひ!:)
一緒にNLPしましょうー!