yoshinori77/career

職務経歴書

山下慶倫

Yoshinori Yamashita

概要

基本情報
Name	山下慶倫
年齢	32
最寄駅	押上
GitHub	yoshinori77

業務経験

データ分析：4年
データエンジニアリング：3年

言語

Python：5年
SQL：4年
Scala：1年
JavaScript：1.5年
Ruby：1.5年

フレームワーク

scikit-learn：4年
Keras：2年
Pandas：4年
Flask：2年
FastAPI：1年
Ruby on Rails：1年

データ分析

構造化データ：3年
時系列データ：2年
自然言語データ：0.5年
画像データ：0.5年

概要

スキル・ツール

GCP：2.5年
AWS：3年
Apache Airflow：1.5年
Apache Beam: 0.5年
Apache Spark：1.5年
BigQuery：1.5年
Hadoop：1.5年
Tableau・BI：1.5年
Docker：2.5年
Git：5年
Terraform：0.5年
PostgreSQL：2年
MySQL：1.5年
CI/CD：1年
脆弱性診断（DevSecOps）：0.5年
パフォーマンスチューニング：0.5年

強み

機械学習・データエンジニアリング両方に対応できます。

趣味

猫の世話
漫画・アニメ
美味しいご飯を食べること

職務経歴

2023/8 - 現在：ココナラ

ポジション

データエンジニア

データ整備・ワークフロー構築/移行

Airflow（Cloud Composer）のワークフローを構築・2系移行
データリネージ・データ品質チェックの導入
Looker Studioのメンテナンス
DevSecOps（CI/CD）で開発効率化
MLOps（Vertex AI Pipelines）で機械学習の運用強化
チーム間の連携強化、業務フロー改善

開発規模

R&Dグループ
- エンジニア 3名
- PM 1名

担当業務

要件定義・基本設計・詳細設計
実装
単体テスト

スキル

Python、SQL
ワークフロー構築（Cloud Composer、Apache Airflow）
GCP（Cloud Composer、Cloud Storage、BigQuery...）
Docker
CI/CD（GitHub Actions）
Vertex AI Pipelines
ベクトル近傍探索

コメント

これまで経験がある業務が多かったのでリードしつつ、ドメイン知識などわからない部分はフォローしてもらいつつ業務を進めました。
開発効率化に向けてチケットのテンプレートを作成したり、CI/CDでテスト・脆弱性チェック・デプロイを自動化したりしました。
技術以外の部分も改善しました。インフラチームと私が所属しているグループの間でタスクの連携がスムーズにできていなかったので、業務フローを決めて連携しやすくしました。

職務経歴

2023/1 - 2023/7：アスタミューゼ

ポジション

データエンジニア

複数プロジェクトのデータ基盤・ワークフロー構築

Pythonでバッチジョブのロジックを開発（Dataflow）
AirflowのDAGを構築・整備
前処理済みのデータをBigQueryに保存（SQL）
Cloud Profiler、Logging、Snyk、SAST、データリネージなど便利ツールの導入（モニタリング、脆弱性診断ツールなど）
IAMの権限管理、Docker・CI/CDなどチームの開発環境の整備

開発規模

エンジニア 3名
PM 1名

担当業務

基本設計・詳細設計
DevOps、実装（ワークフロー構築、ビッグデータ処理）
単体テスト・結合テスト

スキル

Python、SQL
ワークフローの構築（Cloud Composer、Apache Airflow）
スケーラブルなバッチジョブでデータ処理（Dataflow、Apache Beam）
Sparkのビッグデータ処理
GCP（Cloud Composer、Cloud Storage、Artifact Registry、Dataproc...）
Docker、CI/CD（GitLab Runner）

コメント

リードエンジニアが抜けるなど不安定な体勢の中、役割を超えて協力し合うチームワークでピンチを乗り切った経験で人間としてもエンジニアとしても成長しました。
Pythonの型ヒント、GCPの各サービス、CI/CD、Docker、K8sなどモダンな環境で得られた経験値は非常に学びに繋がりました。
SREのようにシステムパフォーマンスを意識してモニタリングツールを導入したり、脆弱性診断ツールを取り入れるなど積極的に便利なツールを使用して効率化を図りました。
人の入れ替わりが激しい職場なので、ドキュメントを書く習慣を心がけ、さらにデータリネージやER図などを取り入れてデータの流れが誰でもわかるようにしました。

職務経歴

2021/2 - 2022/12 : パーソルキャリア株式会社

ポジション

データエンジニア
データサイエンティスト

大規模レコメンドシステムの運用保守 & AWS -> GCP移行

数億レコードのテーブルを分散処理（Spark）で集計などを行う前処理を実施
複数のモデルを用いてレコメンドし、パイプラインをシェルスクリプトで管理（色々ツライのでAWSからGCPに移行）

開発規模

エンジニア 6名
PM 1名

担当業務

基本設計・詳細設計
実装（パイプライン構築、機械学習モデル構築、ビッグデータ処理）
単体テスト・結合テスト

使用言語

Python
Scala

スキル

学習・推論パイプラインの構築（Cloud Composer、シェルスクリプト）
Terraformによるシステム構築の自動化
Scala・Sparkのビッグデータ処理
GCP（Vertex AI、Cloud Composer、Cloud Storage、Artifact Registry、Dataproc...）
AWS（EMR、S3...）
Python（Numpy）で協調フィルタリングのコサイン類似度を算出する際に、行列演算で処理時間を約1/100に高速化

コメント

稼働しているサービスの運用保守は初めてだったので学びが多かったです。
深夜対応、開発の切り戻しなどがあり精神的にも鍛えられました。
AWSとGCP両方の開発を経験し、スキルアップにつながりました。

職務経歴

2020/6 - 2021/1: パーソルキャリア株式会社

ポジション

データエンジニア
サーバーサイドエンジニア

適正年収の自動査定サービス（のロジック部分のシステム構築）

従来のメンバーシップ型からジョブ型の雇用に切り替わってゆく中で、どの企業も市場の適正年収は大きな関心事です。
転職市場の情報とユーザーの職種、業種、年齢などを照らし合わせて、職種におけるグレード・年収を推定することで適正年収の指標を提供しました。

開発規模

エンジニア 3名
データサイエンティスト 1人
PM 1名

担当業務

要件定義・基本設計・詳細設計
実装（推論パイプライン構築、API構築、通知・ログ環境の整備）
単体テスト・結合テスト

使用言語

Python

スキル

推論システムの構築
形態素解析、IF-IDFなど基本的な自然言語処理
AWS CloudFormationによるシステム構築の自動化
Amazon API Gateway & AWS Lambdaを利用したAPI構築
AWS LambdaとAmazon EFSの連携（学習済みの機械学習モデルを配置）
AWS Cloud Watch Logs を利用したログ環境の整備

コメント

これまでアプリケーションを開発経験が少なかったのですが、諸々の事情でほぼ一人で開発を進めることになり、なんとかやり遂げました。
最終的には使用しませんでしたが、SQS、SageMaker、Step Functionsなどにも触れました。

職務経歴

2019/9 - 2020/5: フリーランス

ポジション

データアナリスト

ECサービスの顧客分析

顧客満足度（NPS）を機械学習で予測して、サービスの改善（特に販売促進）をすることが目的でした。
これまでのユーザー全てに同じ施策を打つマスマーケティグから、ユーザーごとに施策を分けるターゲットマーケティングへの転換の一歩に微力ながら貢献できたと自負しております。

開発規模

エンジニア 1名
PM 1名

担当業務

要件定義
実装（可視化、前処理、機械学習モデル構築、評価）
単体テスト

使用言語

Python

スキル

構造化データの前処理・特徴量エンジニアリング
不均衡データへの対策（Over-sampling、Under-sampling、Calibration）
BigQuery
Keras
scikit-learn

職務経歴

2018/11 - 2019/9: フリーランス

ポジション

データアナリスト

住宅価格査定ロジック構築

このプロジェクトでは物件の価格査定を自動化することが目的でした。
これまでは人が価格査定をするか、機械学習で予測していても精度が低く信頼性が低い問題がありました。
以前よりも精度の高い機械学習モデルを構築しました。
Treasure Data等を利用してETLを行いデータエンジニアリングも行いました。

開発規模

エンジニア 2名
PM 1名

担当業務

要件定義
実装（可視化、前処理、機械学習モデル構築、評価）
単体テスト

使用言語

Python

スキル

構造化データの前処理・特徴量エンジニアリング
Treasure Data
Digdagを利用したワークフロー構築
Embulkを利用したデータ転送
scikit-learnを用いた機械学習処理
チーム開発

職務経歴

2017/11 - 2018/10: DATUM STUDIO株式会社

ポジション

データアナリスト

レコメンドシステム構築/WebAPI開発

アンケートデータからユーザーの求めるアイテムをレコメンドすることで、サービスの価値向上に貢献しました。
特に実装フェーズでは前処理、機械学習（分類）、協調フィルタリング、WebAPI構築などを担当しました。
またダッシュボードの構築も行いました。

開発規模

エンジニア 2名
PM 1名

担当業務

要件定義
実装（可視化、前処理、機械学習モデル構築、評価）
単体テスト

使用言語

Python

スキル

Amazon EC2上にレコメンドシステムを構築
Flaskを利用したWebAPI構築
Amazon RDS（MariaDB）
Amazon S3
scikit-learn
Tableau
チーム開発

コメント

業務でAWSを使用したのは初めてだったので勉強になりました。

職務経歴

2017/5 - 2017/10: 株式会社モノゴコロ

ポジション

データアナリスト

画像認識を用いたサッカー動画解析

YOLOというディープラーニングアルゴリズムを用いて物体検出を行いサッカー動画から自動で選手のチームを判別するアプリケーションのプロトタイプを作成しました。
この技術の発展版として、人を検知することで自動で交通量を調査するアプリケーションを構築しました。

開発規模

エンジニア 1名
PM 1名

担当業務

要件定義
実装
単体テスト

使用言語

Python
JavaScript

スキル

画像認識
OpenCV
D3.js
Git

コメント

画像認識やデータ分析に触れるきっかけになりました。

職務経歴

2016/11 - 2017/4: 株式会社モノゴコロ

ポジション

サーバーサイドエンジニア

チャットアプリ

WebSocketを用いてリアルタイムチャットアプリを実装しました。Ruby on Railsを使用しました。

開発規模

エンジニア 1名
PM 1名

担当業務

実装

使用言語

Ruby
JavaScript

スキル

Ruby on Rails
PostgreSQL
Git

コメント

Railsの使い方やGitなど開発の基本を学びました。

個人活動

Kaggle

プロフィール

使用言語

Python

スキル

参加コンペ

JPX Tokyo Stock Exchange Prediction（2022）
- GitHub
- 途中で挫折しました...
Santander Customer Transaction Prediction（2019）
- 銅メダルでした。 549/8751（7%）
Data Science Bowl（2019）
- ダメでした。1215/3493

コメント

Kaggleでデータサイエンスのスキルを磨きました。
まだまだ結果を出せていないので、今後も粘り強くチャレンジします。