フューチャー技術ブログ

バイオ情報学研究発表会で発表してきました

2021/02/22 賞状について追記

SAIGの玉木です。会社では自然言語処理案件や、ワクチン開発案件に取り組んでいます。

先日、会社で取り組んだワクチン開発に必要な基礎的な研究について、第64回バイオ情報学研究発表会で発表してきました。バイオ情報学研究発表会は情報科学と生命科学の融合領域を研究・報告する会です。

大規模タンパク質データベースに基づくBERTを用いたペプチド結合予測

発表資料はこちらです。

自然言語処理でよく用いられているBERT 1を自然言語でなくアミノ酸配列に応用し、ワクチン開発において重要な

  • B細胞エピトープ予測
  • MHCⅡに結合するペプチド予測

の2つのタスクで有効性を検証した論文になります。

特に大規模なタンパク質データでの事前学習が有効であることがわかりました。すでに二次構造予測や接触予測などでの他のタスクでBERTが有効であることは既存研究により示されています。

こちらのブログが参考になります。わかりやすくまとまっているので、興味のある方はぜひ読んでみてください。

感想

私はこの案件に取り組み、言語モデリングによる事前学習でタンパク質の構造を学習できることを知ったときはとても驚きました。

先日DeepMindのAlphaFold2 2が話題になりましたが、AlphaFold2も大規模なタンパク質データベースで事前学習をしているようです。

ドメイン的にも機械学習の進歩からも非常にホットな分野なので、今後の発展が非常に楽しみです。自分もこの分野に貢献できるよう頑張っていきたいと思います。

賞状について

優秀プレゼン賞をいただきました。ありがとうございます!