Azure Machine Learning Handson2019

はじめに

データサイエンティストが行う主なタスクの 1 つは、データセットから予測モデルを構築することです。このようなモデルをワークストリームに組み込むと、コスト予測、変更予測、またはイベントパターンの分析を行って不整合を見つけることができます。 Azure Machine Learning service には、データを準備し、モデルを構築するさまざまな手順を支援するための一連の SDK とクラウドサービスが用意されています。

Azure Machine Learning service を使用すると、データラングリング、モデルのトレーニング、モデルの評価、デプロイ、モデルの管理をスケーリングする主要なサービスを実装できます。その結果、ソリューションを提供する能力が大幅に向上します。

学習の目的

このモジュールでは、次のことを行います。

Azure Machine Learning service がデータサイエンスプロセスにどのように適合するかを確認する
Azure Machine Learning service の実験に関連する概念について学習する
Azure Machine Learning service のパイプラインを調べる
Azure Machine Learning service を使用してモデルをトレーニングする

Azure Machine Learning service と Azure Machine Learning Studio

名前が似ているので、Microsoft Azure Machine Learning Studio と Azure Machine Learning service を区別することが重要です。これらの製品はどちらも機械学習モデルの開発とデプロイに使用できますが、サポートするニーズは異なります。

Azure Machine Learning Studio

ユーザーフレンドリでプログラミングの必要がないドラッグアンドドロップ方式のビジュアルワークスペースです。データサイエンスの学習と小規模な機械学習プロジェクトに最適です。

Azure Machine Learning service

機械学習モデルをスケーリング、監視、デプロイするための呼び出し可能なサービスが提供されます。それは、統合された Azure サービスでデータサイエンスパイプラインを強化および拡張するためのものです。 Azure Machine Learning service SDK を使用すると、このような事前構築済みサービスを使用するコードを記述し、それをデータサイエンスワークフローに統合することができます。

好みの Python ツールとオープンソースフレームワークを使用して、ローカルコンピューターでモデルの開発を始めます。次に、Python モジュールを通して Azure Machine Learning service を使用し、モデルのトレーニングと評価、ハイパーパラメーターの調整、および呼び出し可能な REST API を使用した完全なデプロイを短時間で行います。

データサイエンスプロセス内の Azure Machine Learning service

Azure Machine Learning service を理解するために、次に示されている機械学習の開発プロセスにそれがどのように適合するかを考えてみましょう。

環境のセットアップ

まずワークスペースを作成します。これは Azure で機械学習の作業を保存するための場所です。ワークスペースは、Azure portal または Python コード内から作成できます。トレーニングしてテストするモデルの実行に関する情報を格納するため、ワークスペース内に実験オブジェクトを作成します。 1 つのワークスペースに複数の実験オブジェクトを作成できます。

Azure Machine Learning service を使用すると、ローカルの Jupyter ノートブック、PyCharm、または Azure Notebooks (Jupyter Notebook のクラウド版) のノートブックなど、好みの統合開発環境 (IDE) を使用してワークスペースとやり取りできます。このモジュールで後ほど説明しますが、環境を構成するのは簡単です。

データの準備

モデルをトレーニングするには、その前に、ソースデータを調べて分析し、その品質を判断して、モデルの特徴にあったデータを選択する必要があります。通常、これには統計分析と視覚化の使用が含まれます。その後、データラングリングのステップでは、データをクリーンアップして変換を適用し、モデルのトレーニングで使用できるように準備します。

Pandas や、Azureml.dataprep と呼ばれる Azure Machine Learning Data Preparation SDK など、任意の Python モジュールをデータの準備に使用できます。

実験

実験は、モデルのトレーニングとテストの反復的なプロセスです。 Scikit-learn、TensorFlow、その他のオープンソースパッケージがサポートされています。

モデルを構築した後は、ローカル環境またはリモートコンピューター上でモデルをトレーニングできます。

Azure Machine Learning service の重要な機能は、Azure コンテナー内でモデルのトレーニングと評価を実行する機能です。 Azureml パッケージを使用すると、簡単にリモートモデルの実行を監視し、出力を取得することができます。また、コンピューティングリソースのプロビジョニングに使用されるコンピューティング先オブジェクトを作成して構成する必要があります。

運用環境で使用するモデルを作成したら、ワークスペースにモデルを登録します。

デプロイ

モデルが正常に、必要な正確さのレベルで実行することを、ローカル環境で確認した後、モデルをデプロイすることができます。

Docker イメージを作成し、Azure Container Instances にデプロイします。注:他に使用できるターゲット環境には、Azure Kubernetes Service (AKS)、Azure IoT Edge、フィールドプログラマブルゲートアレイ (FPGA) などがあります。デプロイには、次のファイルが必要です。

スコアスクリプトファイルは、モデルの実行方法を決定するために必要です。環境ファイルは、オープンソースパッケージを使用する場合に重要なパッケージの依存関係を指定するために必要です。構成ファイルは、適切な量のリソースをコンテナーに要求するために必要です。

機械学習の実験を作成する

Azure Machine Learning service の主要なコンポーネントについて考えてみましょう。次の図は、Azure Machine Learning service 内のデータサイエンスプロセスを示しています。

通常、プロセスは 1 つのワークスペースに含まれます。トレーニングフェーズの間に、Python を使用してコンピューティング先を要求し、実験のクエリを実行します。モデルのトレーニングと登録が完了すると、デプロイ用のイメージが作成されます。これで、Python を使用して Web サービスまたは IoT モジュールにデプロイされたモデルを実行できます。

上のプロセスから主な要素をいくつか見てみましょう。

ワークスペースとは

ワークスペースは、Azure Machine Learning service の最上位のリソースです。モデルの構築とデプロイのためのハブとして機能します。 Azure portal でワークスペースを作成したり、好みの IDE で Python を使用してワークスペースを作成したりしてアクセスすることができます。

後で使用するためには、すべてのモデルをワークスペースに登録する必要があります。スコアリングスクリプトと共に、デプロイ用のイメージを作成します。

ワークスペースには、作成した各モデルで必要な実験オブジェクトが格納されます。さらに、コンピューティング先も保存されます。トレーニングの実行を追跡できます。また、ログ、メトリック、出力、スクリプトを簡単に取得できます。この情報は、モデルの評価と選択にとって重要です。

イメージとは

前述のように、イメージには 3 つの主要コンポーネントがあります。

モデルとスコアリングスクリプトまたはアプリケーション
モデル、スコアリングスクリプト、またはアプリケーションで必要な依存関係が宣言されている環境ファイル。
モデルの実行に必要なリソースが記述されている構成ファイル。

データストアとは

データストアは、Azure Storage アカウントに対する抽象化です。各ワークスペースには、すぐに使用できる登録済みの既定のデータストアがありますが、他の Azure BLOB または File ストレージコンテナーをデータストアとして登録することもできます。

パイプラインとは

機械学習パイプラインは、データサイエンスプロセスの間にワークフローを作成して管理するツールであり、通常、データの操作、モデルのトレーニングとテスト、デプロイのフェーズが含まれています。プロセスの各ステップは、異なるコンピューティング先において無人で実行できるので、リソースの割り当てが簡単になります。

コンピューティング先とは

コンピューティング先は、トレーニングスクリプトを実行するための、またはサービスのデプロイをホストするための、コンピューティングリソースです。ワークスペースにアタッチされます。ローカルコンピューター以外では、ワークスペースのユーザーがコンピューティング先を共有します。

デプロイ済み Web サービスとは

デプロイ済み Web サービスには、Container Instances、AKS、または FPGA の選択肢があります。モデル、スクリプト、関連するファイルをすべてイメージに設定したら、Web サービスを作成することができます。

IoT モジュールとは

IoT モジュールは Docker コンテナーです。 Web サービスと同様に、モデル、関連するスクリプトまたはアプリケーション、およびその他の依存関係が必要です。サービスの詳細については、IoT Edge (https://docs.microsoft.com/azure/iot-edge/) を参照してください。これを使用してホスティングデバイスを監視できます。

パイプラインを作成する

Python SDK では、Azure Machine Learning パイプラインを操作するインターフェイスが提供されています。 SDK には、ステップの順次実行と並列実行のための命令型コンストラクトが含まれます。目標は、最適な実行を実現することです。

すべてのデータソース、入力、出力は、パイプライン全体で再利用できるように、厳密に名前付けされています。記録された中間タスクとデータによって、チームのコラボレーションとコミュニケーションが促進されます。

次の図はパイプラインの例です。

Azure Machine Learning パイプラインの機能の一部を次に示します。

タスクと実行のスケジュールを設定できます。それによって、データサイエンティストの空き時間が増えます (特にデータの準備段階)。
個々のステップにコンピューティング先を柔軟に割り当てて、複数のパイプラインを調整できます。
パイプラインスクリプトを再利用し、さまざまなプロセス (再トレーニングやバッチスコアリングなど) 用にカスタマイズすることができます。
すべての入力、出力、中間タスク、およびデータを記録し、管理することができます。

実験サービスを使用してモデルをトレーニングする

新しいワークスペースと実験を作成しましょう。 Azure portal または Python コードを使用して、ワークスペースを簡単に設定できます。ここでは、各アプローチについて説明します。

Azure portal を使用してワークスペースを作成する

Azure portal でワークスペースを作成するには、次の手順を実行します。

Azure サブスクリプションを使用して、Azure portal にサインインします。
ポータル上部の [検索] ボックスに「machine learning service workspaces」と入力します。
[サービス] の [Machine Learning service ワークスペース] オプションを選択します。
Machine Learning service のワークスペースウィンドウの左上にある [追加] を選択し、ワークスペースを作成するために必要な情報を入力します。

フィールド	説明
ワークスペース名	ワークスペースの一意名を入力します。この例では、docs-ws を使用します。名前は、リソースグループ全体で一意である必要があります。覚えやすく、他のユーザーが作成したワークスペースと異なる名前を使用します。
サブスクリプション	使用する Azure サブスクリプションを選択します
リソースグループ	サブスクリプションの既存のリソースグループを使用するか、任意の名前を入力して新しいリソースグループを作成します。リソースグループは、Azure ソリューション用に関連するリソースを保持するコンテナーです。この例では、docs-aml を使用します。
場所	ユーザーとデータリソースに最も近い場所を選択します。この場所に、ワークスペースが作成されます。

リソースグループは今回のハンズオンのために、作成することをおすすめします。

新しく作成したワークスペースを開き、AssetsからExperimentsを

[リソースに移動]を選択してAzure Machine Learning Services

[Azure Notebooks を開きます] を選択して最初の実験を作成します。
Azure portal でワークスペースの作成に使用したものと同じ Microsoft アカウントでサインインします。

サインイン後、Clone Project(ライブラリの複製) プロンプトが表示されます。 Clone(複製)を選択し、ノートブックを実行します。
2 つのノートブックと共に Config.json ファイルが表示されます。この構成ファイルには、作成したワークスペースに関する情報が含まれています。
01.run-experiment.ipynb を選択してノートブックを開きます。
一度に 1 つずつセルを実行するか (Shift+Enter キー)、[セル] > [すべて実行] を選択してノートブック全体を実行します。セルの横にアスタリスク (*) が表示されているときは実行中です。そのセルのコードが完了すると、数値が表示されます。
ノートブック内のセルがすべて実行された後は、記録された値をワークスペースで確認できるようになります。
ポータルページに戻り、[実験を表示します] を選択してから、[my-first-experiment] を選択してモデルの実行レポートを表示します。

Azure Notebooks で Python を使用してワークスペースを作成する

このハンズオンでは、必要なすべてのものが事前に構成されているため、Azure Notebooks を使用してコード例を実行することを強くお勧めします。無料の Azure Notebooks サブスクリプションで、無料のサブスクリプションを取得してください

Azure Notebooks を使用しない場合は、Azure Machine Learning service を使用するようにローカルの Jupyter Notebook 環境を設定する方法について、後で説明しています。

Azure Notebooks サブスクリプションを取得したら、サービスにログインします。

ノートブックを作成する

最初に、新しい Azure ノートブックを作成します。 Azure Notebooks は、関連するノートブックをグループ化することを主な目的とするライブラリに含まれています。このユニットでは、新しいプロジェクトを作成してから、その中にノートブックを作成します。

ブラウザーで https://notebooks.azure.com に移動します。
上部のメニューバーで [マイプロジェクト] をクリックします。

プロジェクトページに移動する

[+ 新しいプロジェクト] をクリックします。プロジェクト名に "AMLSLearn" (引用符を除く) と入力し、プロジェクト ID に "amls-learn" を入力します。 [パブリックプロジェクト] ボックスのチェックマークをオフにして、[作成] をクリックします。

プロジェクトを作成する

[+] 記号をクリックして、ノートブックをプロジェクトに追加します。

プロジェクトへのノートブックの追加

ノートブックに "AMLSLearn1.ipynb" という名前を付けて、アイテムの種類として [Python 3.6] ノートブックを選択します。これにより、Python 3.6 カーネルを使用したノートブックが作成されます。 Jupyter ノートブックの長所の 1 つは、選択するカーネルに応じてさまざまな言語を使用できることです。

ノートブックの作成

ちなみに、.ipynb ファイル名拡張子は、"IPython notebook" の略です。 Jupyter Notebook は、当初は IPython (対話型 Python) ノートブックと呼ばれており、Python のみをプログラミング言語としてサポートしていました。 Jupyter という名前は、Jupyter がサポートする主要なプログラミング言語である Julia、Python、R を組み合わせたものです。

新しいノートブックをクリックします。これによりノートブックが起動し、編集を開始できるようになります。

Azure Notebooks を使用するときに、追加のプロジェクトとノートブックを作成できます。プロジェクトは、関連するノートブックをグループ化するための手段を提供します。ノートブックを最初から作成することも、既存のノートブックをアップロードすることもできます。次のユニットでは、ノートブックを最初から作成し、セルの操作の基本を学習します。

お疲れさまでした。 Azure ノートブックが作成されました。

演習 - 単純なロジスティック回帰モデル向けのデータを読み込む

コード例を実行する場合は Azure Notebooks を使用することを強くお勧めします。すべてが事前に構成されており、最新バージョンの Python を入手できるためです。

MNIST データを取得する

ノートブック内のセルで次のコードを実行して、MNIST データセットを取得し、ローカルの data フォルダーに保存します。

import os
import urllib.request

#create a folder for the dataset
os.makedirs('./data', exist_ok = True)

# load dataset to the directory--as you can see, you must load train sets and test sets separately
urllib.request.urlretrieve('http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz', filename='./data/train-images.gz')
urllib.request.urlretrieve('http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz', filename='./data/train-labels.gz')
urllib.request.urlretrieve('http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz', filename='./data/test-images.gz')
urllib.request.urlretrieve('http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz', filename='./data/test-labels.gz')

出力は次のようになります: ('./data/test-labels.gz', <http.client.HTTPMessage object at 0x00000247D0FE6080>)。 data という名前のフォルダーが作成され、イメージおよびラベルのテストデータとトレーニングデータを含む、gzip 圧縮された 4 つのファイルが格納されます。

データセットを分割します。

次の手順では、データをトレーニングセットとテストセットに分割します。圧縮ファイルを読み込み、処理可能な numpy 配列を返す関数が必要となります。 utils.py という名前のファイルに次のコードを保存します。

import gzip
import numpy as np
import struct

# load compressed MNIST gz files and return numpy arrays
def load_data(filename, label=False):
    with gzip.open(filename) as gz:
        struct.unpack('I', gz.read(4))
        n_items = struct.unpack('>I', gz.read(4))
        if not label:
            n_rows = struct.unpack('>I', gz.read(4))[0]
            n_cols = struct.unpack('>I', gz.read(4))[0]
            res = np.frombuffer(gz.read(n_items[0] * n_rows * n_cols), dtype=np.uint8)
            res = res.reshape(n_items[0], n_rows * n_cols)
        else:
            res = np.frombuffer(gz.read(n_items[0]), dtype=np.uint8)
            res = res.reshape(n_items[0], 1)
    return res

print('Functions defined')

load_data ヘルパー関数が定義され、以下のコードでこれを使用してデータを読み込むことができるようになりました。

# To help the model converge faster, shrink the intensity values (X) from 0-255 to 0-1

X_train = load_data('./data/train-images.gz', False) / 255.0
y_train = load_data('./data/train-labels.gz', True).reshape(-1)

X_test = load_data('./data/test-images.gz', False) / 255.0
y_test = load_data('./data/test-labels.gz', True).reshape(-1)

print('Data loaded')

サンプル画像を表示する

データを読み込んだことを確認するために、matplotlib を使用してサンプル画像 + ラベルの 1 つを表示してみましょう。これを実行するには 1 から 2 分ほどかかることがあります。

import matplotlib.pyplot as plt
import numpy as np

count = 0
sample_size = 30
plt.figure(figsize = (16, 6))
for i in np.random.permutation(X_train.shape[0])[:sample_size]:
    count = count + 1
    plt.subplot(1, sample_size, count)
    plt.axhline('')
    plt.axvline('')
    plt.text(x=10, y=-10, s=y_train[i], fontsize=18)
    plt.imshow(X_train[i].reshape(28, 28), cmap=plt.cm.Greys)
    
plt.show()

print('Done')

次のような画像が表示されます。

演習 - Scikit-learn を使用してロジスティック回帰モデルを実行する

ロジスティック回帰アルゴリズムは、応答変数がカテゴリ別の場合に使用される回帰モデルです。ここでは、よく使われる scikit-learn パッケージをインポートしてアルゴリズムを実装します。

次のコードを使用して、ロジスティック回帰モデルを実行し、モデルの精度を出力します。実行が完了するには数分かかることがあります。

from sklearn.linear_model import LogisticRegression

#load the model
clf = LogisticRegression()
#fit the model
clf.fit(X_train, y_train)

#evaluate the model by using a test set
y_hat = clf.predict(X_test)
#print the accuracy
print(np.average(y_hat == y_test))

print('Done')

演習 - 機械学習の実験を作成する

ローカルコンピューターの容量によっては、さまざまな値のパラメーターにモデルを合わせたり、最適な結果を返す k の値を見つけるのに時間がかかることがあります。この場合は、リモートクラスターでモデルの実行を試す必要があります。

実行と実験の概要

始める前に、実行と実験という 2 つの概念を理解する必要があります。

Azure Machine Learning service における実行は、特定のタスク (モデルのトレーニングや_ハイパーパラメーター_のチューニングなど) の Python コードを指します。実行によってメトリックがログ記録され、Azure プラットフォームに結果がアップロードされます。これは、ワークスペース内のジョブを追跡する方法として、より自然です。

実験は、一連の実行の構成を指す用語です。例では、ロジスティック回帰モデル向けの実行が 1 つと、kNN モデル向けの実行が 1 つあります。これらが、結果を比較するための実験を構成しています。

実験を利用/作成する

実験を作成する最初の手順では、Machine Learning サービスワークスペースを作成します。すでにある場合はNotebook上からワークスペースにアクセスできるようにします。この操作は Azure portal で、または Azure ML SDK を使用して Python で実行できます。 Python を使用するには、Azure サブスクリプション ID を指定する必要があります。サブスクリプションは、Azure portal で左サイドバーの [サブスクリプション] 項目を使用するか、またはグローバル検索ボックスに「Subscriptions」と入力することで、見つけることができます。

使用するサブスクリプションを見つけて、以下の {azure-subscription-id} 値をサブスクリプション ID 値に置き換えます。 Azure アカウントにまだサインインしていない場合は、SDK によってサインインを求められます。

from azureml.core import Workspace,Experiment,Run

ws = Workspace.get(
            name='{YOUR WORKSPACE NAME}',
            subscription_id='{YOUR SUBSCRIPTION ID}', 
            resource_group='{YOUR RESOURCE GROUP NAME}',
)

# 新しく作成する場合はcreateを使う
# ws = Workspace.create(
#             name='AMLSWorkspace',
#             subscription_id='{azure-subscription-id}', 
#             resource_group='{resource_group}',
#             create_resource_group=True,
#             location='japaneast'
# )

Workspace.create 関数は、プロセスで使用する、作成された Workspace オブジェクトを返します。このオブジェクトを変数 ws に格納します。

Workspace オブジェクトで、Azure ML SDK を使用して Experiment と run を作成できます。

from azureml.core import Experiment
#Create an experiment
experiment = Experiment(workspace = ws, name = "my-first-experiment")

#Create a run
run = experiment.start_logging()
run.log("trial",1)
run.complete()

ログに記録された結果を表示する

ジョブが完了すると、次のコードには、実行したジョブに関する詳細が表示されます。

from azureml.widgets import RunDetails

RunDetails(run).show()

Azure portal で実験の実行を表示できます。前回の実行に関する結果にリンクする URL を出力するには、次のコードを使用します。

print(run.get_portal_url())

実験の結果を表示するブラウザーのウィンドウで表示される URL に移動します。 Azure portal が開き、次のスクリーンショットのような画面が表示されます。

演習 - 実験サービスを使用してモデルをトレーニングする

コンピューティングターゲットが、トレーニングスクリプトを実行したり、サービスのデプロイをホストしたりするためのコンピューティングリソースであることを学習しました。ここでは、コンピューティングリソースとして、Azure Machine Learning コンピューティング (AmlCompute) を作成します。 AmlCompute は、Azure Machine Learning service で直接管理される機械学習ワークロード用に最適化されたコンピューティングターゲットです。これらのターゲットを接続または構成する必要はありません - これらはシステムで自動的に処理されます。

最初の手順として、リモートコンピューティングターゲットを作成します。

from azureml.core.compute import AmlCompute
from azureml.core.compute import ComputeTarget
import os

# Step 1: name the cluster and set the minimal and maximal number of nodes 
compute_name = os.environ.get("AML_COMPUTE_CLUSTER_NAME", "cpucluster")
min_nodes = os.environ.get("AML_COMPUTE_CLUSTER_MIN_NODES", 0)
max_nodes = os.environ.get("AML_COMPUTE_CLUSTER_MAX_NODES", 3)

# Step 2: choose environment variables 
# 1時間あたり、1台に付き約11円かかります。
vm_size = os.environ.get("AML_COMPUTE_CLUSTER_SKU", "STANDARD_D2_V2")

provisioning_config = AmlCompute.provisioning_configuration(
    vm_size = vm_size, min_nodes = min_nodes, max_nodes = max_nodes)

# create the cluster
compute_target = ComputeTarget.create(ws, compute_name, provisioning_config)

print('Compute target created')

データを読み込んでモデリングスクリプトを作成する

データソースの場所と形式に応じて、データをモデルにパイプするためのさまざまな方法があります。たとえば、作成された Workspace オブジェクトを使用して既定のデータストアを取得し、Azure Blob ストレージにデータをアップロードできます。

#upload data by using get_default_datastore()
ds = ws.get_default_datastore()
ds.upload(src_dir='./data', target_path='mnist', overwrite=True, show_progress=True)

次に、トレーニング Python コードを保存するディレクトリを作成します。

import os

# create the folder
folder_training_script = './trial_model_mnist'
os.makedirs(folder_training_script, exist_ok=True)

最後に、モデルトレーニングスクリプトを準備しましょう (このスクリプトでは、3 つのパラメーターを定義します)。

最初のパラメーターは、クラウド内のデータを検索するためのもの、またはパス用のものです。
他の 2 つのパラメーターは、kNN アルゴリズムでパラメーター k を定義します。
kmax は、k の最大値を制限します。
kinterval は、各 k の間隔を決定します。

%%writefile $folder_training_script/train.py

import argparse
import os
import numpy as np

from sklearn.neighbors import KNeighborsClassifier
from sklearn.externals import joblib

from azureml.core import Run

import gzip
import struct

# load compressed MNIST gz files and return numpy arrays
def load_data(filename, label=False):
    with gzip.open(filename) as gz:
        struct.unpack('I', gz.read(4))
        n_items = struct.unpack('>I', gz.read(4))
        if not label:
            n_rows = struct.unpack('>I', gz.read(4))[0]
            n_cols = struct.unpack('>I', gz.read(4))[0]
            res = np.frombuffer(gz.read(n_items[0] * n_rows * n_cols), dtype=np.uint8)
            res = res.reshape(n_items[0], n_rows * n_cols)
        else:
            res = np.frombuffer(gz.read(n_items[0]), dtype=np.uint8)
            res = res.reshape(n_items[0], 1)
    return res

# create three parameters, the location of the data files, and the maximun value of k and the interval
parser = argparse.ArgumentParser()
parser.add_argument('--data-folder', type=str, dest='data_folder', help='data folder mounting point')
parser.add_argument('--kmax', type=int, dest='kmax', default=15, help='max k value')
parser.add_argument('--kinterval', type=int, dest='kinterval', default=2, help='k interval')
args = parser.parse_args()

data_folder = os.path.join(args.data_folder, 'mnist')
print('Data folder:', data_folder)

# load the train and test set into numpy arrays
X_train = load_data(os.path.join(data_folder, 'train-images.gz'), False) / 255.0
X_test = load_data(os.path.join(data_folder, 'test-images.gz'), False) / 255.0

#print variable set dimension
print(X_train.shape, X_test.shape, sep = '\n')

y_train = load_data(os.path.join(data_folder, 'train-labels.gz'), True).reshape(-1)
y_test = load_data(os.path.join(data_folder, 'test-labels.gz'), True).reshape(-1)

#print the response variable dimension
print( y_train.shape, y_test.shape, sep = '\n')

# get hold of the current run
run = Run.get_context()

print('Train kNN models with k equals to', range(1,args.kmax,args.kinterval))

# generate a wide range of k and find the best models
# also create a list to store the evaluation result for each value of k
kVals = range(1,args.kmax,args.kinterval)
evaluation = []

# loop over the models with different parameters to find the one with the lowest error rate
for k in kVals:
    model = KNeighborsClassifier(n_neighbors=k)
    model.fit(X_train, y_train)

    # use the test dataset for evaluation and append the result to the evaluation list
    score = model.score(X_test, y_test)
    print("k=%d, accuracy=%.2f%%" % (k, score * 100))
    evaluation.append(score)

# find the value of k with the best performance
i = int(np.argmax(evaluation))
print("k=%d with best performance with %.2f%% accuracy given current testset" % (kVals[i], evaluation[i] * 100))

model = KNeighborsClassifier(n_neighbors=kVals[i])

run.log('Best_k', kVals[i])
run.log('accuracy', evaluation[i])

os.makedirs('outputs', exist_ok=True)

# note that the file saved in the outputs folder automatically uploads into the experiment record
joblib.dump(value=model, filename='outputs/knn_mnist_model.pkl')

print('Training script saved')

トレーニングスクリプトの最後の行で、実験ワークスペースの outputs フォルダーに pickle ファイルとしてモデルが保存されていることに注目してください。この pickle ファイルは、後でモデルをデプロイするために使用します。

見積もりツールオブジェクトは、実行を送信するために使用されます。推定を作成するには、以下のコードを実行し、次のものを定義します。

推定オブジェクトの名前 est。
スクリプトが含まれるディレクトリ。このディレクトリ内のすべてのファイルは、実行のためにクラスターノード内にアップロードされます。
コンピューティングターゲット。ここでは、作成した Azure Machine Learning コンピューティングクラスターを使用します。
トレーニングスクリプトの名前 train.py。
トレーニングスクリプトに必要なパラメーター。
トレーニングに必要な Python パッケージ。

from azureml.train.estimator import Estimator

script_params = {
    '--data-folder': ds.as_mount(),
    '--kmax': 5,
    '--kinterval': 2
}

#import the Scikit-learn package 
est = Estimator(source_directory=folder_training_script,
                script_params=script_params,
                compute_target=compute_target,
                entry_script='train.py',
                conda_packages=['scikit-learn'])

モデルを送信し、実行を監視して、結果を取得する

モデルトレーニングを実行する実験を作成する必要があります。

from azureml.core import Experiment

#Create an experiment
exp = Experiment(workspace = ws, name = "amls-learn-experiment")
print('Experiment created')

最後の手順では、モデルを実行します。メッセージに従って Azure アカウントでサインインします。

run = experiment.submit(config=est)
run

ポータルで、次のように実行中の実験を確認できます。

azureml パッケージのウィジェットモジュールを使用して、実行を監視できます。

# monitor the run
from azureml.widgets import RunDetails

RunDetails(run).show()

次のスクリーンショットでは、リモートリソースが実行中の状態が示されています。

次のスクリーンショットでは、完了したジョブの状態が示されています。出力を見ると、ローカルマシンで先ほど行ったのと同じ結果になっていることがわかります。

この実行が完了したら、結果を出力できます。結果が記録されているのは、トレーニングスクリプトでコードを記述したからです。

#get the result
print(run.get_metrics())

モデルの保存

トレーニングしたモデルは、Machine Learning Serviceで、世代管理することが可能です。

model = run.register_model(model_name='sklearn_mnist', model_path='outputs/knn_mnist_model.pkl')
print(model.name, model.id, model.version, sep='\t')

クリーンアップ

お使いの Azure アカウントでコストが増えるのを避けるため、このラーニングパスに作成したリソースグループを削除してください。このモジュールで作成したすべてのリソースを削除するには、次の手順に従います。

Azure portalにサインインします。
Azure のサイドバーで [リソースグループ] を選択して、リソースグループを見つけます。
リソースグループを選択し、行を右クリックしてコンテキストメニューを開きます。行の右端にある [...] ボタンを使用することもできます。
[リソースグループの削除] を選択します。
リソースグループの名前を入力し、[削除] を選択します。 Azure によってすべてのリソースが自動的に削除されます。

まとめ

Azure Machine Learning service を詳しく知るために、MNIST データセットを使用しました。モデルの構築とトレーニングは、ローカルで行うことも、リモートコンテナーを使用して行うこともできることを学習しました。単純なロジスティック回帰モデルと一連の kNN モデルをトレーニングして、最も精度が高いものを見つけました。使用した例は、画像に含まれている数字を判断する画像分類の問題でした。次に、Azure Machine Learning の実験を作成し、それを使ってモデルをトレーニングしました。モデルのトレーニング実行を送信し、監視し、結果を取得しました。

2 つの用語を定義しました。

Azure Machine Learning service における実行は、特定のタスク (モデルのトレーニングやハイパーパラメーターのチューニングなど) の Python コードを指します。実行はメトリックのログ記録や、結果を Azure プラットフォームにアップロードするジョブを行います。これはワークスペース内のジョブを追跡するより自然な方法です。

APPENDIX

Azure Notebooks

Azure Notebooks の使用の詳細については、次のドキュメントのリンクを確認してください。

Azure Notebooks のクイックスタート Jupyter Notebook を使用して HyperDrive を詳しく知る

Microsoft Learning

このハンズオンは Microsoft Learningのコンテンツを元にしています。

Azure Machine Learning service の概要

Azure Machine Learning service を使用したローカル ML モデルのトレーニング

tottokug/AzureMachineLearningHandson2019