フューチャー技術ブログ

社内技術書輪読会とSite Reliability Engineering

TIG/DXユニット 1所属のLEEです。

2019年より社内で輪読会を企画運営し、このたび初回の課題図書になってたSite Reliability Engineering を全10回で無事読破できました。

これを記念に実施概況をまとめさせていただきます。

Who am I

名前から分かる通り韓国出身で、入社してちょうど1年くらいになりました。前職がWeb系の会社のエンジニアだったのでITコンサルティングを生業とするフューチャーに入社したのは、ある意味エンジニア界隈のトレンドに逆走した感じかもしれませんが、外には出せない情報ばかりの貴重な経験をさせてもらえているので良い決断だったと思っています。

背景

入社して今までの会社と違う環境で戸惑いながらも、自分が慣れているWeb系のテイストを取り入れようとしました。

その1つが社内勉強会の企画でしたが、すでにいくつか定期開催済みということもあり、もう少しひねりを加えてと始めたのが輪読会でした。

輪読会は登壇スタイルの勉強会と比べて以下の特徴があると思います。

  • 毎回のテーマは本の内容に限定され特別に悩む必要がなく
  • 忙しい業務の中の準備の手間が発表者一人に集中させない
  • 勉強パーティー的なイベント性を排除しやすい

参加型でライトでありながらみんなの成長に繋がるような勉強会になれたらと思ってました。

書籍の選定

まず初回にどの本にするかと、これからの書籍選定ポリシーを決めました。
経験者などに話を聞きながら以下のように決めました。

  • 古すぎなく、最新のトレンドが取り入れられ
    • 過去の名著はすでに読破したヒトがいる
  • 一人で読むには負担が多く分厚い本
    • 簡単な本は一人で読めば良い
  • 明日業務に役立つことは無いけど、将来的に地力を伸ばせること
    • ちょっと背伸びした内容で、達成感も得やすい

他には、別のエンジニアコミュニティのオンライン読書会の経験から、数式や図式が重要なファクターじゃない読み物 を条件に加えました。

初回としては人を可能な限り呼び寄せるべく、エンジニア界隈のビッグウェーブに乗り、GoogleのSite Reliability Engineeringを選びました。これに関しては後で詳しく話します。

運営ポリシー

輪読会をやるとしたら自然に思い浮かぶ要素を決めるだけでした。

  • 開催頻度
    • 週1
  • 1回にかける時間
    • 集中力が必要になるので1時間以下にした
  • 1回でどれくらいの量・ページを消化するか
    • その分量の担当者の人数
  • 1冊の本を何回に分けて終わらせるか
    • 長すぎると消化しきれず飽きられてしまう

あと1つ、自分は一応社歴が浅かったため、以下の根回しをしておきました。

  • ユニット内のサクラ募集
  • 社内に顔が利く真野 2さんを利用して開催の告知

当日の運用

進行としてはSRE本の場合は全34章だったので一人当たり1章ずつ担当、1回に2〜3章を1時間する計画で10週〜3ヶ月で終わらせる目標で勧めました。実際の輪読会は以下のような感じに進めました。

  • 前回の終わり頃に担当者を募集
  • 担当者はみんなが見れる章の要約資料を事前に用意
  • 皆に本を片手に内容を噛み砕いて説明する
  • 理解できなかった部分をみんなに質問を投げかける
  • 関連する自分の経験を共有する
  • やらなくてもいいと思った章は飛ばす
    • 一部のケーススタディなど
    • 自分でざっくり読んで5分以内にまとめるなど

「輪読会はこれが初めて!」というメンバーが多かったですが、第1回目から予め決めておいたルールに従い運営したため、特に問題が発生しなかったので良かったです。

輪読会の雰囲気

あれこれの根回しのおかげて、ユニットメンバー含め、あらゆるところのプロジェクトから参加してくれました。弊社AIグループの方や同じTIGではないインフラに興味のある若手の方、他にも10年以上なるベテランまで、あらゆる客層から輪を広げることができたのは嬉しかったです。

ということで、参加者はバラエティ豊かでした。

1年目の新人さんから、オンプレミス~クラウドまで構築し続けたインフラスペシャリスト、Oracleの全てを知り尽くすDBスペシャリスト、データ解析プラットフォームの構築エンジニアや、Webフロントエンドのスペシャリストまで様々。

彼らが輪読会中のちょっと専門用語に反応して、自らの経験を話してくれたのは非常に勉強になりました。

ここだけの話、1番盛り上がったのは「11章のオンコール対応」や「13章 緊急対応」です。
みなさん、システムのグラウンドデザインから保守運用まで対応されているメンバーが多かったので、実感が伴った「わかるわかる」とか、「あるよねー」と同意が連発していました。

他にも、リスクの管理手法として「エラーバジェット」という概念は、全てにおいて数値というファクトベースに改善サイクルを回るGoogleらしいなとみんなで感心していました。

また、輪読会の中では、こういったGoogleの物語を聞いて「さすがぐーぐる、言ってることが違うな」とか「それぐーぐるだからできるもんっしょ」といった雰囲気でところどころ茶々を入れながら進められたので和気あいあいです。

効果

輪読会の効果として積読の解消は言うこともないでしょう。

興味があって買ったはいいものの、手をつけるにはあまりにも分厚い技術書が本棚に溜まっていく経験が多くのエンジニアにはあるはずです。その中の一冊をみんなと協力して分担して読み終えていくのは、勉強会的な要素も含めると、シナジー効果があり効率的だと思います。

実際こういった輪読会の読書法は、ある程度ざっくりした内容を頭の中に掴んでおいて、必要になった時に必要な部分を思い出して熟読するスタイルのカタログのような技術書にはぴったりだなと思っているところです。

その他にも、勉強会でも得られる以下のような効果がありました。

  • 関連経験・知見の共有
  • 人脈を広げる
  • 内容の批評
  • コミュニケーションコストを節約できるコンテキストの共有
    • 本に出ているコンセプトと用語(バジェット・トイル・ポストモーテムなど)

週1ペースで1時間にも満たない時間でこれだけの効果があるということで、これからも継続しようと話しています。

個人の所感

1冊の本で数回を繰り返す輪読会というのは「本の読解」「要約」「プレゼンテーション」というフローなのですが、完全に国語能力が要求されると感じました。回を繰り返すにつれ、斜め読みなどで読書の効率を上げたり、聞く人のコンテキストに合わせてうまく説明するなど工夫をこらしましたが、慣れるまでは冗長な説明をしてしまうなど大変でした。

Site Reliability Engineeringについて

Googleが提唱したSREとはどういったもので、どのような道のりをたどって現在に至ったのかを記した知人曰くインフラエンジニアのバイブルのような内容です。

インプラエンジニア、もしくは運用エンジニアの要素として自動化・モニタリング・SLO・オンコール対応・リリースなどに加えマネジメント・ポストモーテム・教育などにも触れています。

感想としては、なんというかイマドキのインフラエンジニアならばこういったものは当たり前だろといった感じでした。

しかし、実際こういった当たり前のことを当たり前のようにやることも大変難しいものですし、Googleの場合、それをはるか以前から研究・実践し、当たり前というトレンドを自ら先導し、エンジニア界隈に拡散させたと考えることもできるではないでしょうか。

あと、これは弊社渋川さんからの引用で、会のみんなも同意した話ですがGoogle SREのみんなが書きあげた同人誌の総集編と一言で言えるものでした。各章はまるである勉強会の1つのセッションのような感覚で読めると思います。

System Performance、それから…

SRE本を無事終えて、2冊目は詳解 システム・パフォーマンスが選ばれ絶賛輪読中です。次の本はもう少し軽いものがいいなと願ってましたがSRE本より厚くなるとは皮肉なものですね。

今後はConnpassなどで外部の人を招待し、もっと輪を広げていこうと考えています。

さいごに

TIG/DXユニットでは社外の勉強会への参加以外にも、様々な社内勉強会を企画運営しています。

ぜひDXユニットに興味を持っていただけたら、 Qiita Jobsもご覧いただけると幸いです。
https://jobs.qiita.com/employers/future/development_teams/109


  1. 1.Technology Innovation Groupの略で、フューチャーの中でも特にIT技術に特化した部隊です。DXユニットはTIGの中でも特にデジタルトランスフォーメーションに関わる仕事を推進していくチームです。
  2. 2.フューチャー技術ブログの運営をしていたり、過去には新人研修に関わっていたため、比較的顔が広いと思われたようです。