はじめに
こんにちは、関です。
業務でOpen Policy Agent(OPA)に触れる機会があり、公式ドキュメントや関連記事を呼んだのですが、ユースケースやPolicyの記述方法についての説明に比べて、実際にどうやって判定をリクエストするのかやポリシーの管理方法について情報が少なかったため、こちらにまとめます。
OPAとは?
Open Policy Agent(OPA, オーパと発音)は汎用PolicyEngineで、統一された方法でポリシーによる判定をすることが可能になります。
OPAが担うのは、あくまでポリシーによる意思決定部分で、その決定を適用するのは、OPAに意思決定を依頼する別のソフトウェアなどが行う必要があります。
そもそもPolicyとは?
ポリシーとは組織の長期的な成功に重要なソフトウェアの振る舞いを支配する一連のルールのことです。
このルールには法的な要請や、技術的な要請、ミスの再発防止などのための重要なナレッジを含みます。もっとも初歩的な形のポリシーは、書かれたものを手運用で適用していたり、組織の文化や暗黙知になります。アプリのロジックや、デプロイ時に静的に設定されることもあります。ソフトウェアサービスそのものにハードコードされていることも多いです。
Policy as Code
ポリシーをコードとして表現することで、管理、自動化を可能にする考え方です。
ソフトウェア開発のベストプラクティスである、バージョン管理、自動テスト、自動デプロイといった恩恵をポリシーの管理にも適用できます。OPAはRegoという記述言語を用いてポリシーを記述できます。
Policy decoupling
ポリシーの管理をソフトウェアそのものから分離することをPolicy decouplingと呼びます。これにより、ソフトウェサービスのポリシーを、コンパイルやデプロイなしで変更できるようになります。つまり、ポリシーのデプロイとサービスのデプロイが分離されます。これに伴い、ビジネス要求の変化への適応がしやすくなり、違反の検知能力、ポリシーへの準拠や一貫性の向上、ヒューマンエラーの緩和が実現します。
これは特に、ポリシーに責任を持つ者とソフトウェアサービスの運用・開発者が異なった場合に有効でしょう。例えば、全社横断的に信頼性に責任を負うSREやセキュリティの責任者が、各サービスの言語で書かれたポリシーを全て把握し、変更、適用をするのは非現実的です。ポリシーをOPAで管理できるなら、責任者の持つ権限による適切な管理が実現されるでしょう。
また、OSSなど、ソフトウェアの開発元がポリシーを管理する組織と異なる場合にもうまく機能します。
OPAは、ポリシー管理を必要とするソフトウェアとは別プロセスとしても動作できるので、Policy decouplingを実現できます。
OPAによるポリシー判定
概念的なモデル
ここまでは、ポリシーを主体に、OPAができることを述べてきました。ここでは、OPAによるポリシー判定の流れを概念的に説明します。図にすると以下のようになります。
OPAは判定リクエストを受け付ける前に、インメモリにPolicyとDataをロードします。Policyは判定に使われるルール群、Dataはポリシーの判定に使われるリクエスト間で共通するデータです。ロードのやり方は別で説明します。Queryは判定リクエストです。この中には、JSONの値(input)と、レスポンスとして受け取りたい項目の指定が含まれています。レスポンスとして受け取りたい項目を指定することで、どのPolicyで評価するかが決まります。Queryを受け取ったOPAは、inputとDataを、レスポンスを構成するために必要なポリシーで評価し、その結果であるDecisionをJSONとして返却します。
OPAの配布形態と評価をリクエストする際のインタフェース
OPAは、以下の3種類の形態で配布されています。
- コマンドラインツール
- コンテナイメージ
- Goライブラリ
また、OPAに評価を依頼するための主要なインタフェースは以下になります。
- CLI
- HTTP API
- OPA側のプラグイン(著名なものだと、Envoy向けのgRPCサーバ)
- Goライブラリが提供する関数
他にもwasmも使えるようですが、あまり詳しくないので割愛します。
何かしらのツールやサービスが必要とする意思決定をOPAに委譲する際には、配布形態とこれらのインタフェースの組み合わせを考える必要があります。
例えば、REST APIの認可判定で利用する場合は、サイドカーコンテナとしてOPAコンテナを起動し、HTTP APIを使ってリクエストすれば良いでしょう。
Terraformと統合する際には、Terraform planの実行結果をJSONに変換してコマンドラインから判定を行う方法で紹介されているようにコマンドラインツールを用います。
ツール側にプラグインが用意されていて、OPAにリクエストする部分を自前実装しなくて済むようになっていることもあるので、そのツールにプラグインやアドオンが存在しないか確認すると良いです。例を挙げると、DockerやKafkaなどです。DockerにあるようにDockerは、openpolicyagent/opa-docker-authz-v2
というプラグインを、KafkaにあるようにKafkaはOpen Policy Agent plugin for Kafka authorization
というプラグインを使います。
プロキシであるEnvoyは少し特殊で、Envoy側が規定するgRPCを使った認可APIを、OPA側が提供するような構成になっています。詳細は、External Authorizationを参照してください。
他にも、Goライブラリを使って自作ツールを作り、CI上で利用する方法も取れます。以前当社のブログに載せられたPolicy as Code を実現する Open Policy Agent に憧れて。ポリシーコードでAPI仕様をLintするはこの方法を使っています。
動作例
how-to-use-opaに動作例として使えるコードを配置しています。必要に応じて動かしてもらえたらと思います。
題材
ここで、ユーザがリソースにアクセスする際の認可を題材にして、OPAに認可判定をリクエストする方法を見てみましょう。
Queryとして、以下のJSONを想定します。
{ |
Dataとして、ユーザごとにアクセス可能なresourceIDが存在するとします。
{ |
アクセスが許可されるのは、Queryに含まれるuserがアクセス可能なresourceIdであるときのみです。Aliceは、”resourceA”に対するアクセスが可能なので、期待する結果はtrueです。
他の入力と出力の例は以下です。
例1: Aliceが、resourceBにアクセス -> false
{ |
例2: Bobが、resourceBにアクセス -> true
{ |
ポリシーとDataの作成、バンドルの準備
まずはポリシーとDataを作成します。ポリシーはRegoという言語を用います。
多くの場合、ポリシーとDataはopa build
コマンドを使って、Bundleというアーカイブファイルにまとめられるので、この記事でもBundleを用意することにします。その際、ソースファイルの入っているディレクトリ構成を適切に設計しておく必要があります。特に、ポリシーであるRegoファイルからDataへアクセス方法はディレクトリ構成に依存しており、同じ構成でもbuildコマンドの対象ディレクトリの指定方法を間違えただけで意図した動作をしてくれなくなるので注意が必要です。RegoやBundleについての詳しい解説はここではせず、いつか別記事として書こうと思います。
ここでは、一旦以下のような構成にします。dataは別ディレクトリにしたりとディレクトリ構成には複数の候補がありますが、シンプルさを求めるならこの構成が理解しやすいです。
policies/ |
{ |
policyの中で利用しやすいように、いきなりオブジェクトを作るのではなく、ファイル名と同じキーを置いた後に目的のオブジェクトを配置しています。このようにすることで、ポリシーファイル中でdata.example.user_resource
のようにしてアクセス可能になります。
package example |
判定リクエストが送られた時、OPAはinputの中にクエリ毎のデータを格納します。input.resourceIdが、先ほどのuser_resourceで管理しているユーザ毎に認可するresourceIdのリストに含まれているかを判定しています。
Bundleを作るには、opa build
コマンドを使います。以下のコマンドで、bundle.tar.gzとしてBundleが生成されます。
opa build -o bundle.tar.gz ./policies |
呼び出し方
少々厄介なことに、OPAは呼び出し方によって渡すJSONのフォーマット、出力のフォーマットが異なります。ここでは各呼び出し方と、出力のフォーマットを見ていきます。
CLI
CLIで呼び出して即時に結果を受け取るには、opa exec
コマンドを使う方法と、開発時の動作確認などで便利なopa eval
コマンドを使う方法があります。
opa execコマンドによる呼び出し
入力データを以下のように作ります。
{ |
以下のコマンドを呼び出すと、OPAが判定リクエストを処理して結果を返却します。
opa exec --decision "/example/allow" -b ./bundle.tar.gz input_cli.json |
--decision
オプションでレスポンスとして受け取りたい項目を指定しています。上で作成したpolicy.regoは、example
packageに属しており、そのうちのallow
の値を取得したいため、/example/allow
と指定しています。-b
オプションでは利用するバンドルを指定し、続いて判定に使う1つ以上のJSONファイルを渡します。
出力結果
{ |
出力結果はJSONで、.result
キーに入っています。この中には、呼び出し時に渡したinputのファイルとresultが配列として入ります。
ちなみに、/example/allow
ではなく、example
の中身全体を受け取りたい項目として指定することもできます。
opa exec --decision "/example" -b ./bundle.tar.gz input_cli.json |
出力結果
{ |
input_cli.json
に対するresultは、辞書隣、allow
の他に、user_resource.json
由来のuser_resource
というキーも含まれていることがわかります。
opa evalコマンドによる呼び出し
opa eval
コマンドはより簡易的に使えるコマンドで、opa exec
コマンドと同じような呼び出し方ができます。ただし、引数の指定方法は異なっており、特にレスポンスの項目指定の方法は、Regoファイル中でデータを参照するときと同じ方式を使う必要があります。以下は、opa exec
の最初に実行したコマンドと同じ意味を持つコマンドです。
opa eval -d bundle.tar.gz -i input_cli.json "data.example.allow" |
出力結果も少し形が変わり、以下のようになります。
{ |
opa eval
コマンドは、bundleの作成をしなくてもビルド対象ディレクトリを直接指定すれば実行できます。このため、開発時の動作確認やちょっとしたお試しで便利です。
opa eval -d ./policies -i input_cli.json "data.example.allow" |
HTTP API
サーバの起動方法
opa run
コマンドによる起動
opa run --server
コマンドを使うことで、OPAをHTTP APIとして起動できます。-b
オプションで利用対象のBundleを指定できます。
# デフォルトで、0.0.0.0:8181 で公開される。 |
コンテナイメージによる起動
OPAはコンテナイメージとしても配布されています。以下のコマンドで、opa run --server
コマンドと同等のサーバを起動できます。
docker run --rm -p 8181:8181 -v ${PWD}/bundle.tar.gz:/bundle.tar.gz openpolicyagent/opa run --server --addr :8181 --bundle /bundle.tar.gz |
curlコマンドによる呼び出し例
curlコマンドで、HTTP APIを使った判定リクエストをしてみます。リクエストはPOSTで投げます。CLIからの利用とフォーマットが異なることに注意が必要です。
{ |
判定リクエストは以下のように投げます。見て分かる通り、レスポンスとして受け取りたい項目は、HTTP APIのパスとして表現されています。今回の場合、example
packageのallow
という項目を受け取りたいので、/v1/data/example/allow
にアクセスしています。
curl -vX POST -H 'Content-Type: application/json' -d @input-api.json http://localhost:8181/v1/data/example/allow |
レスポンスは以下のようになります。
< HTTP/1.1 200 OK |
Goライブラリ
Goのライブラリは2種類あって、高レベルAPIを提供するsdk
パッケージと低レベルAPIを提供するrego
パッケージがあります。多くの場合はsdk
パッケージが有用とされていますが、Bundleやポリシーの読み出し方が限定的だったりと、そこまで使いやすい印象はありませんでした。多くの場合、CLIやHTTP APIで事足りると思うので、詳細は省きます。以下、参考URLです。
- sdk パッケージ(高レベルAPI)
- rego パッケージ(低レベルAPI)
PolicyとDataのロード方法
ここまで、ロード済みのポリシーを使った判定リクエストの方法を見てきました。ここでは、ポリシーのロード方法について見ていきます。ポリシーの主要なロード方法は以下の3つです。
- コマンドライン引数による直接指定
- Bundleサーバからのダウンロード
- REST APIによるポリシー・Dataの作成
コマンドライン引数による直接指定
これまで利用してきた方法がこれになります。追加で述べることはありません。
Bundleサーバからのダウンロード
Bundleを管理する中で最もポピュラーな方法が、Bundleを配布するWebサーバを作成し、そこからダウンロードする方法です。この方法の利点は、アプリ+OPAのデプロイとポリシーのデプロイが分離され、ポリシーのみを更新できることです。Webサーバの機能としては,Bundle Service APIが指定する方式でBundleファイルを提供できれば問題なく、nginxはもちろんのこと、Amazon S3, Google Cloud Storage, Azure Blob Storageといったオブジェクトストレージにも対応しています。詳細はBundlesを参照してください。
ここでは、nginxにバンドルを配置してダウンロードする方法について触れたいと思います。
以下のdocker-compose.yamlで起動したコンテナを題材にしたいと思います。このファイルはこちらを参考に、改修を加えて作成しています。
version: "3" |
opaコンテナは以下のconfig.yamlを読み込んでいます。
config.yaml
services: |
.services
は、OPAのコントロールプレーンのエンドポイントを表している項目です。Bundleサーバ以外にも、Status APIなどがこの項目を使います。各サービスにアクセスする際に必要な認証に関する設定なども環境変数を利用しながら実施できます。.bundles
が文字通りBundleの管理先を表していて、service
でダウンロード先のserviceを指定します。今の場合、nginxを選択しています。またresource
でダウンロードするBundleを指定しています。
コンテナを起動すると、以下のようなログが出力されるので、Bundleをnginxからダウンロードしていることがわかります。
opa_1 | { |
こちらについても、how-to-use-opaに入れていますので、お試しいただけたらと思います。
REST APIによるポリシー・Dataの作成
Policy APIを使うことで、ポリシーを動的にCRUDできます。また、Data APIを使うことで、DataをCRUDできます。Data APIは、判定リクエストを送る際に利用するAPIと共通です。普通のREST APIで、特に難しくないので詳細は公式ドキュメントを見てもらえたらと思います。
終わりに
OPAの入門編ということで、簡単なユースケースを題材にして、OPAに判定リクエストを行う方法と、ポリシーやDataをロードする方法についてまとめました。この記事が誰かの役に立てば幸いです。