Future Tech Blog
フューチャー技術ブログ
Home
Tags
Glue
Glue
タグの記事
10
投稿
8
著者数
273
総シェア数
18
Twitter
0
Facebook
124
はてブ
131
Pocket
リリース直前にライブラリのインストールエラーが発生した際にどのように対応したか
先日、本番リリースを控えたシステムで OSS ライブラリのインストール起因のエラーが発生しました。実際に起きた事象と、どのように検討して対応したのかを残すべく、ポストモーテムの形式で当記事を書きました。
2024.01.19
振り返り
AWS
Glue
トラブルシュート
ポストモーテム
awswrangler
ツイート
シェア
2
1
AWS Glueの開発環境の構築(2022)
2021年の記事でもAWSの公式のDockerイメージを使って環境構築をする内容の記事があるのですが、Glue3.0の公式のDockerイメージがリリースされていたので、そちらを使って再度Glueのローカルでの開発環境構築の記事を書いてみようと思います。せっかくなので昨年の記事と少しコードを変えようと思い、AWSの公式ドキュメント[^2]に書かれたコードを基に解説します。
2022.04.28
JupyterNotebook
AWS
Glue
環境構築
LocalStack
DockerCompose
2
シェア
2
5
AWS Glueで複雑な処理を開発するときのTips
PySparkを使用したGlueジョブ開発のお話をします。ETLツールとして使用されるAWS Glueですが、業務バッチで行うような複雑な処理も実行できます。また、処理はGlueジョブとして、Apache Spark分散・並列処理のジョブフローに簡単に乗せることができます!
2021.10.11
Python
AWS
Glue
Tips
Athena
PySpark
SparkSQL
1
シェア
6
9
AWS Glue Data CatalogでCSVを扱う
PySparkで予定しておりましたが、PySpark関連として、Glueを題材にさせていただきます。Glueといっても大きく下記の3種類、処理系をいれると4種類に分かれると思っていますが、それぞれ全く別のプロダクトという理解をしています。
2021.10.06
Python
AWS
Glue
データカタログ
4
シェア
3
1
AWS Glueの開発環境の構築(2021)
Glueの環境構築は以前の記事([AWS Glueの単体テスト環境の構築手順、AWS Glueの開発エンドポイントがそこそこお高いのでローカル開発環境を用意しました)にあるのですが、公式のDocker imageが案内されているので改めて、構築してみます。なお、Glueの公式イメージでもJupyter Notebookは利用できるのですが、使い勝手を考慮し、Jupyterlabに差し替えています。
2021.05.21
JupyterNotebook
AWS
Glue
環境構築
4
シェア
4
6
DynamoDBをS3へExportして、Glue+AthenaでSQLを実行する
DynamoDBを頻繁に利用しており、連日DynamoDBコンソール画面と睨めっこをしています。DynamoDBのコンソール画面は特定のデータをピンポイントで探すには優秀ですが、データ集計には全く向いていません。
2021.04.03
DynamoDB
SQL
AWS
Glue
S3
Athena
1
シェア
3
8
AWS Glueの単体テスト環境の構築手順
当記事では、AWS Glue をローカル環境で単体テストするための環境構築方法についてまとめました。
2019.12.06
Python
テスト
AWS
Glue
環境構築
Docker
LocalStack
ツイート
シェア
4
6
AWS Glueの開発エンドポイントがそこそこお高いのでローカル開発環境を用意しました
AWS Glue利用していますか?ETL処理をする上で大変便利ですよね。しかしながら開発に必要不可欠な開発エンドポイントが少々お高く、もう少し安価に利用できればなーと思っていたところ、さすがAWSさん素敵なリリースをしてくれました。
2019.11.01
AWS
Glue
3
シェア
6
7
5TB/日 のデータをAWS Glueでさばくためにやったこと(性能編)
大量データをさばくために、Glueの性能についてあれやこれややった検証結果の一部を公開します
2018.12.05
AWS
性能検証
Glue
2
シェア
7
9
5TB/日 のデータをAWS Glueでさばくためにやったこと(概要編
業務で用いたAWS Glueの概要・開発Tips・ハマったところについて共有します
2018.08.28
AWS
データレイク
Glue
データエンジニアリング
ETL
1
シェア
87
79
1