ニューラルネットワークをMNISTデータで実装していたが、認識率が向上せずむしろ劣化する結果となっていた。
原因を解析するためにより単純な状態を作ろうとして、最近は28*28のMNIST画像を縮小した9*9のミニMNISTデータを作成し、それでニューラルネットワークを実装したが、これでも同様に認識率が向上せずむしろ劣化した。
初期認識率が90%から開始しても10%から開始しても、学習を繰り返すと10%程度=10クラスなのでランダム認識率と一緒になっていた。
本を読み返していると、学習率について「0.01や0.001」「大きすぎても小さすぎても良い結果にならない」と書いてあった。
学習率を0.1や0.5で実行してしまっていたため、0.01にして実施してみると、初期認識率10%から50%へと向上した。
学習を繰り返せば更に改善するだろう。
割と長く詰まってしまっていたため非常に嬉しい。