/awesome-studio-lab-jp

SageMaker Studio Labの教材を紹介するリポジトリ。

Apache License 2.0Apache-2.0

SageMaker Studio Lab Community

Amazon SageMaker Studio Labは、無料かつ簡単にデータサイエンスを学び始めることができる環境です。

🆓 Free

  • Amazon SageMaker Studio Labは無料で利用ができます。必要なのはメールアドレスのみです。

:octocat: Open

  • Studio LabはオープンソースのJupyterLabをベースにしています。
  • コードの補完や見出しの作成など、コミュニティで開発された便利な拡張機能も利用できます。

🔰 Easy

  • Pythonが実行できる、Jupyter Notebookが作成できる環境があらかじめ構築されています。
  • Gitが標準でインストールされており、GUIからも使用できます。

📚 Community

  • コミュニティを通じて、Studio Labでデータサイエンスが学べる教材やデータ分析の実装が共有されています。
  • GitHubで検索して見つけることもできます。

🚀 SageMakerへの移行が可能

  • Studio Labで作成したプロジェクトは、AWSのSageMakerへ移行することができます。
  • 学ぶだけでなく活用したい方にとって必要なサービス機能と学習教材を提供しています。

Studio Labで学べる教材

本リポジトリでは、データサイエンティスト協会の定義を参照しデータサイエンスデータエンジニアリングビジネスの3つのカテゴリに分けて教材を紹介します。

Studio LabでJupyterLabで動かせる教材はStudio Labで動かせますが、特に「Open in Studio Lab」のボタンがあると簡単にStudio Labで開くことができます。Open in Studio Labボタンの設置方法は"Open in Studio Lab ボタンの設置方法"をご参照ください。

データサイエンス

東京工業大学 情報理工学院で使用されている機械学習の教材です。Pythonの基本的な文法はもちろん、Numpy、Matplotlibといった機械学習に欠かせないライブラリの使い方についても解説されています。

Python早見帳と同じく、東京工業大学 情報理工学院で使用されている機械学習の教材です。教材内容の解説と確認問題の実装をmlnote-noteで公開しています。

プログラミングの基本、統計入門、前処理、機械学習などを、R・Python対訳・対照で学ぶ書籍です。書籍に掲載されたコードのほかに、Amazon SageMaker Studio Labのための仮想環境構築法もサポートサイトで公開されています。GPUを使った深層学習もAmazon SageMaker Studio Labで動作確認済みです。

Amazonが社内の機械学習教育で使用している教材です。自然言語処理、テーブルデータ、画像、決定木の4コースで、それぞれApplied Scientistらによる解説動画、スライド、Notebookが提供されてます。

パターン認識と機械学習の書籍で登場するアルゴリズムの実装を行っているリポジトリです。かなり難しい書籍なので、awesome-prml-jaで紹介されている各大学の輪講資料も活用して学ぶことをお勧めします。

他教材

データエンジニアリング

小売のPOSデータを題材に、SQLを使用したデータの抽出方法を学べる教材です。SQL以外にも、Pythonの表計算ライブラリであるpandasやRによる実装方法も解説されています。データサイエンス100本ノック構造化データ加工編ガイドブックとして解説の書籍も発売されています。

ビジネス

機械学習モデルがビジネス価値に貢献するよう開発を進める方法を学ぶことができるワークショップです。資料がすべてGitHubで公開されており、機械学習のビジネス貢献価値をどのように計測すればよいかなどが解説されています。

Studio LabからSageMakerへの移行

大規模なデータの前処理や学習が必要になっときは、Studio LabからSageMakerへ移行することができます。

studio_lab_to_sagemaker.png

採用事例

Studio Labを採用頂いている授業や事例を紹介します。

関連記事検索

リンク

Disclaimer

本リポジトリのメンテナンスを行っているメンバーはAWSに所属していますが、コミュニティ活動の一環として行っておりAWSの事業とかかわりはありません。

教材の追加やリポジトリ内のコンテンツの修正はIssues、またPull Requestsよりお送りください。