Future Tech Blog
フューチャー技術ブログ
Home
Category
DataScience
3ページ目
DataScience
カテゴリの記事
104記事中の 51 ~ 75 を表示
初めての画像処理〜OpenCVって何ができるの?〜
以前から気になっていた画像処理にチャレンジしてみました。普段はコーディングしてもテストがうまくいくorいかないのどちらかでしか成果物を見れていなかったので、視覚的に動いてる!を感じてみたく、新宿の紀伊國屋で分かりやすそうな書籍を買い、いろいろ試したので同じように画像処理にちょっと興味があるような人に読んでいてもらたらうれしいです。
2023.04.24
初心者向け
Python
画像処理
OpenCV
ポスト
シェア
5
8
Vertex AI Model MonitoringとEvidently AIで運用中のモデル・データを監視する【Output Metrics編】
データ/モデル監視ツールであるVertex AI Model MonitoringとEvidently AIを利用して両者を様々な観点で検証していきます。
2023.04.14
MLOps
VertexAI
AI監視
Evidently AI
ポスト
シェア
はてな
3
Vertex AI Model MonitoringとEvidently AIで運用中のモデル・データを監視する【Input Metrics編】
データ/モデル監視ツールであるVertex AI Model MonitoringとEvidently AIを利用し、両者を様々な観点で検証していきたいと思います。Vertex AIのAutoMLで作成した回帰モデルの監視を想定し、ユースケースを交えて両者をそれぞれ検証していきます。
2023.04.13
MLOps
VertexAI
AI監視
Evidently AI
ポスト
シェア
はてな
1
MLシステムにおけるモデル・データの監視【概要編】
「モデル・データの監視」について、なぜ監視が必要なのか、監視するべき項目は何か、監視するにはどのようなツールがあるのかについてご紹介します。
2023.04.12
MLOps
TensorFlow
VertexAI
AI監視
バリデーション
Evidently AI
Great Expectations
SageMaker
ポスト
シェア
4
6
ChatGPTなどの大規模言語モデルが労働市場に与える影響の分析
世界中で話題となっているChatGPTですが、その開発元であるOpenAIから大規模言語モデル(LLM)が労働市場に与える影響について分析した論文が公開されました。
2023.04.04
AI
LLM
NLP
論文紹介
ChatGPT
OpenAI
4
シェア
2
8
スモールデータ解析と機械学習 を読んだ感想
Kaggle、AtCoder等の趣味が高じて2022年12月フューチャーに入社しました。このような背景の人がフューチャーに入社後、何が不足していると感じ、どのようにそれを埋めていこうとしているのか。といった目線でお読みいただければ幸いです。
2023.02.22
書評
機械学習
データ分析
39
シェア
5
11
Vertex AI PipelinesのTips
Vertex AI Pipelinesを利用してみて分かったTipsについて、いくつかピックアップしてまとめました。なお、コードは全てPython・Kubeflowを用いた場合を記載しています。Vertex AI Pipelinesとは、GCP上でMLパイプライン機能を提供するサービスです。サーバーレス方式でMLワークフローをオーケストレートします。
2023.02.13
GoogleCloud
MLOps
Tips
VertexAI
7
シェア
4
3
Plotly.pyによるデータ可視化のすすめ
現在業務でいわゆるビッグデータを扱っていまして、アウトプットを可視化する機会が多くあります。Pythonでデータ可視化といえばmatplotlibが定番で、メンバー単位でのアウトプット共有なら特に不便は無いのですが、クライアントへの説明資料などに使い回すことを考えると、もう少し見栄え良く仕上げたくなる時があります。
2022.11.16
Python
可視化
Plotly
ヒストグラム
87
シェア
6
10
【合格記】Google Cloud Professional Machine Learning Engineer認定資格を振り返る
先日、Google Cloudの認定資格であるProfessional Machine Learning Engineer認定資格を受験し、取得することができました。また、今回はリモート試験にて受験をしてみました。この記事ではProfessional Machine Learning Engineer認定資格の合格に至った学習過程とリモート試験体験記について...
2022.09.30
GoogleCloud
機械学習
合格記
PMLE
7
シェア
1
6
住所情報から経路を探索する"そこそこ"な方法
ユーザ等から登録された住所情報から、ある程度精度を犠牲にすることで安価に経路を探索できる状態する、つまり"そこそこ"な方法について紹介します。なお紹介する内容は当社でアルバイトとして活躍している大森さん・高倉さんの協力を得ています。
2022.07.22
初心者向け
地図
GoogleMap
ポスト
シェア
1
3
Future Tech Night #17 embeddingを用いた分析・検索・推薦の技術
Future Tech Night #17「embeddingの活用」と「MLOps」のAI勉強会を開催し、「embeddingを用いた分析・検索・推薦の技術」というタイトルで発表しました。当日の勉強会の様子は[YouTubeで公開しており...
2022.06.13
登壇レポート
機械学習
TechNight
NLP
TensorFlow
embedding
8
シェア
はてな
3
H&M Personalized Fashion Recommendations 参加記 (46th/2952)
Strategic AI Group所属の金子です。普段は推薦に関連する実装やデータ分析を行っています。先日Kaggleで開催された[H&M Personalized Fashion Recommendations]コンペに単独で参加し、2952チーム中46位をとりました。今回の参加記では以下の内容を紹介します。
2022.06.02
TensorFlow
Kaggle
参戦記
12
シェア
2
6
Future Tech Night #21 Google Cloud Vertex AIによるフルマネージドなMLOps導入
「Future Tech Night #21 Google Cloud: データエンジニア+MLOps」に登壇させていただきましたので、その内容について触れていきたいと思います。
2022.05.13
GoogleCloud
登壇レポート
TechNight
MLOps
VertexAI
14
シェア
1
2
cuDNN の CUDA API の紹介
NVIDIA 社が提供するディープラーニング用の GPGPU ライブラリ「cuDNN」の CUDA API を紹介したいと思います。cuDNN は TensorFlow や Keras で学習や推論を高速化するためのバックエンドとしてよく使われていますが、CUDA API を直接たたいたことがある方は少ないのではないでしょうか?個人的に作成したアプリケーションで CUDA API を叩く機会があり、社内の技術勉強会で紹介したところ好評だったため、こちらにも寄稿することにしました。
2022.04.13
AI
GPGPU
7
シェア
はてな
1
巡回セールスマン問題(TSP)の基本的な解き方(ILS)
SAIGアルバイトの後藤です。業務では、アルゴリズムの知識を用いた既存処理の高速化やスケジュールの自動作成による業務の効率化を行っています。配送計画問題など、最適化問題に属する社会課題は、部分問題に巡回セールスマン問題。TSPにおいて特に良いとされているILSには次の2つがあります。
2021.12.01
アルゴリズム
最適化
数理
192
シェア
16
27
Software Design 2021年11月号「Kaggleで知る機械学習」を寄稿しました
先日10月18日に発売された[Software Design 2021年11月号]の第一特集、「Kaggleで知る機械学習 前処理から学習モデルの構築,スコアの上げ方までわかる」をフューチャーの農見、玉木、金子が担当しました。数日経ってしまいましたが、簡単に紹介させていただきます。
2021.10.26
機械学習
出版
NLP
SoftwareDesign
画像処理
Kaggle
11
シェア
1
1
scikit-learn 1.0 リリース!更新内容を一部紹介します。
2021年9月24日にscikit-learn 1.0がリリースされました。私が大学院生のころ、scikit-learnのサンプルを動かすところから機械学習を勉強したので、ついに1.0かとなんだか感慨深い気持ちがありますから、個人的に気になった以下の4つの内容を紹介しようと思います。
2021.10.08
Python
機械学習
pandas
scikit-learn
23
シェア
4
3
pandas 1.0以降での変更点を一部紹介します
SAIGの小橋昌明です。業務ではずっとPythonを書いています。Pythonを使ってデータ分析をする上で無くてはならないのがpandasです。リリースノートを見てみると、メジャーアップデートによる1.0.0 がリリースされたのが2020年の1月で、現時点での最新は1.3.3です。
2021.10.07
Python
リリースノート
バージョンアップ
pandas
4
シェア
1
1
医薬品副作用データベースから医薬品同士の関係を学習・評価・可視化する
こんにちは!Strategic AI Groupの金子です。夏の自由研究ブログ連載2021として医薬品副作用データベースにWord2Vecを適用し性能を評価、医薬品-原疾患-有害事象の可視化を行いました。本記事で作成したプログラムは医薬品の情報を扱っていますが、医療機器には該当せず人の疾病の診断、治療、予防を目的としておりません。本記事の内容に基づいて医学的判断は行わないようお願いします。
2021.09.01
Python
ヘルスケア
Word2Vec
腰痛
62
シェア
2
7
Future Tech Night #11「機械学習勉強会」
6月18日にFuture Tech Night #11 ~機械学習勉強会~を開催しました。私は「ワクチン推定精度世界一へ!異分野技術で世界に貢献」というタイトルで、貞光が「複雑・巨大なITシステムをグラフベースの深層学習で自動解析」というタイトルでそれぞれお話させていただきました。
2021.07.19
登壇レポート
機械学習
TechNight
4
シェア
はてな
Pocket
技育祭登壇しました。これから機械学習を学びたい方向けへの自分の経験談とおすすめの本、サイトの紹介もします
TIGの玉木です。去年の12月までは主に機械学習エンジニアとして機械学習案件を任されていましたが、今年の1月からはITコンサルタントとして業務の幅が広くなりいろいろやっています。先月技育祭と呼ばれるイベントの勉強会という枠で、同僚の上野さんと一緒に「初心者必見!機械学習エンジニアがあれこれ話します。〜基礎から実社会応用まで〜」というタイトルで発表しました。
2021.05.11
登壇レポート
書評
機械学習
技育祭
ポスト
シェア
39
38
実世界データの特徴と処理方法
私は大学時代から深層強化学習の研究をしていますが、分野的にほとんど実世界のデータを扱うことがありませんでした。そんな私ですが、実務で実世界データの分析を行う機会があり、その違いに多くの学びがありました。今回は実世界データのデータ分析を行った結果見えてきた、実世界データの特徴と欠損値や不正データの処理について解説しようと思います。簡易的ですがソースコードも示していますので、参考になれば幸いです。
2021.04.23
Python
データ分析
ポスト
シェア
1
3
Transformerを用いた表現学習・推薦の実装
自然言語処理でよく使われるWord2VecやTransformerをログデータやテーブルデータの予測・分析に活用するためのオレオレベースラインの紹介を行います。対象読者は既にWord2VecやTransformerについて知識があり、その上自身で改造を行いたい人や...
2021.03.25
機械学習
TensorFlow
Transformer
Word2Vec
ポスト
シェア
2
16
バイオ情報学研究発表会で発表してきました
SAIGの玉木です。会社では自然言語処理案件や、ワクチン開発案件に取り組んでいます。先日、会社で取り組んだワクチン開発に必要な基礎的な研究について、第64回バイオ情報学研究発表会で発表してきました。
2020.12.08
登壇レポート
機械学習
学会
NLP
ヘルスケア
ポスト
シェア
はてな
2
イノベーションの捉え方
今回は、統計調査という繋がりで、イノベーションの捉え方に関する2つの調査を紹介させていただこうと思います。皆さんはイノベーションという言葉からどのようなことをイメージされるでしょうか?何かが新しく登場してわれわれの生活を便利してくれることをイメージされるかもしれません。身近に当たり前のように普及してきている例で言えば...
2020.11.05
統計
ポスト
シェア
はてな
1
Prev
1
2
3
4
5
Next