メインモジュールの実装|Irisデータセット分類問題

本ページはゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装を参考にニューラルネットワークを作成していきます。参考書籍では「Affineレイヤ」「ReLUレイヤ」「Softmax-with-Lossレイヤ」という3つのレイヤを作成し、それらを組み合わせることでニューラルネットワークを構築していきます。本サイトでも同じように3つのレイヤをVBAで作成し実装していきます。(実際はSigmoidレイヤを含む4レイヤ)

これまでに「Affineレイヤ」「ReLUレイヤ」「Sigmoidレイヤ」「Softmax-with-Lossレイヤ」、それらを組み合わせたニューラルネットワーク本体である「TwoLayerNetクラス」をVBAで実装しました。

本ページではニューラルネットワークを呼び出し、学習を行うための機能をメインモジュールを実装していきます。また、別ページではこのメインモジュール内に推論を行う機能も追加します。つまり、マクロとして実行するのは今回実装するメインモジュールの関数のみとなっています。

 

メインモジュールの機能

メインモジュールでは「学習」「推論」の2つの機能を持ちます。
(本ページでは「学習」の機能のみを実装します)
 

ニューラルネットワークの学習

「学習」とは、順伝播と逆伝播を繰り返し、重みパラメータとバイアスパラメータの値を徐々に更新していき『適正な値』を見つけ出すことを意味しています。

例えば「ガクの長さ = 6.7」「ガクの幅 = 3」「花弁の長さ = 5.2」「花弁の幅 = 2.3」と4項目それぞれに数値を入力したときに「Virginica」と正しく種類を判別できるようなパラメータ値を見つけます。この入力された数値とその正解となる種類は学習データに依存します

適切なパラメータの値はこれまでに実装したクラス/レイヤの関数を順番に実行していくことで導き出すことができます。導き出す方法はいくつかありますが、今回実装している方法は「誤差逆伝播法」という1番シンプルで簡単な仕組みです。
とても極端な話をすれば「TwoLayerNetクラス」の関数「gradient」と関数「ParamsUpdate」をループ処理に入れるだけで学習が可能になっています。(引数を準備する必要がありますが)
 

ニューラルネットワークの推論

「推論」とは、入力された4つの数字から花の種類が「Setosa」「Versicolor」「Virginica」のどれなのかをニューラルネットが自ら考え導き出すことです。

処理としては非常にシンプルで「学習」で求めた適切なパラメータの値をそのまま使い、順伝播を1回行うだけです。この順伝播によって出力された値がニューラルネットワークの最終的な答えとなります。

1度学習済みのパラメータさえ求めることができれば同じニューラルネットワークに入れることで何度でも使い回すことができます。つまり今回の場合、1度学習を終えパラメータ値が取得できれば入力された4つの値を変更してもそれに対応した花の種類を何回も導き出すことができます。

ただ注意しないといけないのは、正解できる確率(精度)は学習の内容によるという点です。
正しく十分な学習ができていれば正解をうまく導き出すことができますし、逆に学習が不十分の場合はうまく導き出すことができません。

今回のIris分類問題はニューラルネットワークを使うほどでもないかなり簡単な問題のため、学習は数秒で終わり精度もほぼ100%となります。

 

メインモジュールの実装

まずは標準モジュールで「Main」というモジュールを作成します。
これまでに実装したクラス/レイヤと揃えるため、本モジュールでも「Option Base 1」を使い配列を「1」スタートにします。

以下はメインモジュール(学習のみ)の全コードです。

 以下では上記のコードでどのような処理を行っているかを解説していきます。
※メインモジュールではこれまでに実装したクラス/レイヤ/関数を全て呼び出します。
 適宜、各実装ページに戻り本モージュールとの繋がりやレイヤごとの繋がりを確認しましょう。

 

Sub Train

関数「Train」ではこれまでに実装したレイヤや関数を呼び出してニューラルネットワークの学習を行う関数です。ここでは「この関数がどのような処理を行なっているのか」を部分ごとに分けて上から順に説明していきます。
 

ハイパーパラメータ設定

はじめに、学習の初期設定ともいえるハイパーパラメータを設定します。

ハイパーパラメータとは各層のニューロン数や学習率などのニューラルネットワークの根源となるパラメータのことをいいます。このハイパーパラメータの値は学習前に変更することが可能で、学習結果に応じて変更したり自分の好きな設定で学習を行うことができます。

今回作成したニューラルネットワークではハイパーパラメータの値を変更できるものは少ないですが、コードを書き足したり、レイヤを増やすことで隠れ層の数を増やしたり、活性化関数を変更したりすることも可能になります。(ニューラルネットワークについて理解が深まったらぜひコードを書き換えてみてください)

基本的に今回変更できるのは以下のハイパーパラメータだけです。

hidden_size:隠れ層のニューロン数
MinLoss:最少Loss値(Loss値がこの値になったら学習を終了する)
MaxEpoc:最大エポック数(batch_size×MaxEpoc個のデータを学習したら学習を終了する)
train_size:学習用データのデータ数
test_size:テスト用データのデータ数
LearningRate:学習率(この値が小さいほど学習時間は長くなるが精度の高い学習ができる)
batch_size:バッチサイズ(まとめて何個のデータを学習するかを決める)
act_func:隠れ層の活性化関数(ReLU関数とSigmoid関数の切り替えが可能)

batch_size、MaxEpocについては本来の意味とは少し違うので注意してください。
基本的にIris分類問題は簡単な問題なのでハイパーパラメータを少しいじったところで大きな変化はありませんし、よほどおかしな値を入力しない限りほとんどの確率でうまく分類することができます。
 

シートの設定

ここからは「Sub Train()」プロシージャ内のコードです。
まずは「学習した結果を出力するためのシート」を用意します。

ここで作成したシートに順伝播と逆伝播によって求められた”最適”な重みパラメータとバイアスパラメータを出力します。今回は簡単な問題で学習時間も数秒で済むため、学習毎に学習の結果が上書きされていきます。

学習に何時間もかかる場合は、学習途中の場合でもところどころでパラメータを出力します。
こうすることで、その地点から学習を再開することが可能になるためです。
Iris分類問題の次のレベル『Excel VBAでニューラルネットワークを再現|MNIST学習で文字認識』ではこの機能を実装し、学習を途中で終了し、再開させることが可能になっています。
 

学習

次にTwoLayerNetのインスタンスを作成し、ループ分を使って学習を行なっていきます。

複雑なように見えますが処理の流れを大雑把にみると以下の通りです。

① ランダムで学習データを取得
② ①のデータの正解ラベルを取得しone-hot表現に変換する
③ ①と②を引数としてTwoLayerNetの関数「gradient」を実行
④ ③で取得した勾配を使い、各Affineレイヤのパラメータを更新
⑤ ①〜④の処理を「batch_size」回行う(「batch_size」回の学習結果の平均の精度を出力する)
⑥ ⑤の処理を学習終了条件を満たすまでループする

この処理の流れはミニバッチ学習から来ています。
本来のミニバッチ学習では③の処理の時点で複数の画像データをまとめてTwoLayerNetに渡し、まとめて計算を行います。(通常これを1エポックという)

しかしVBAでミニバッチ学習を行う場合、ニューラルネットに入力するデータが増えることは配列の次元が増えることを意味します。ここでは機能の理解をメインとしているためあまり複雑な計算は避けています。そのため本来のミニバッチ学習とは少し変えた処理で、ミニバッチ学習に似せた処理をしています。(つまりミニバッチ学習自体は実装できていません)

上記の処理には書いていませんが、ループの中ではテストデータの精度確認も併せて行います。
処理の内容自体は上記の内容とほとんど同じなので割愛しますが、最終的にはこのテストデータの精度で学習の良し悪しを判断します。(詳しくは実際に学習をする際に解説します)

ここの処理は説明を聞くよりも1行1行コードを見ながら何をしているかを確認していった方が理解しやすいと思います。おそらくニューラルネットワークを学ぶ上で1番つまづきやすいのが「学習」の部分なのでここはじっくりとやっていきましょう。
 

学習終了処理

最後に学習終了条件を満たした際の処理を書いておきます。
ここではTwoLayerNetの関数「ExportParameters」を呼び出すだけです。
引数となる「ParamsSheet」はコードのはじめの方で作成した「学習した結果を出力するためのシート」です。

 

まとめ

ここではゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装を参考に、ニューラルネットワークで学習を行うためのメインモジュールを作成しました。

今回実装したメインモジュールの機能をまとめると以下の通りです。

Sub Train:学習を行う

長いコードにはなっていますが機能としては「学習を行う」の1つだけです。
これまでに実装してきたレイヤやクラスの関数を呼び出して学習していくので、初めのうちは少しややこしく感じるかもしれません。ただ、コードが理解できればやっている内容が思ったよりはシンプルだということがわかります。
このシンプルな内容を理解することで、ニューラルネットワークの仕組みも理解できるのでじっくり理解していってください。

今回のメインモジュールで「学習」に関するコードはすべてです。
次回はこれらのコードを使いIrisの分類問題を行う方法を解説していきます。
 

【次回】Irisデータセットを学習させてみよう
【前回】TwoLayerNetクラスの実装
メインページ
 

 icon-book 参考書籍

2021年6月13日AI, Deep Learning, Excel, VBA

Posted by Lic