卒業研究でDeepLearningを使った画像認識をすることになりそうなので,ナウでヤングなpyleran2を試してみようと思いました.
1.まずはpython2のインストールから.
公式サイトのDownloadからpython2.7.8をダウンロードします.
インストールウィザードに従ってボタンをクリックしていけばインストールできますが,インストールするファイルを選ぶときにadd Python.exe to Pathを有効にしてください.
(自分はこれを有効にしてもパスが通らなかったので,システムの詳細設定>環境変数から手動でパスを通しました.Windowsに標準インストールした時,通すパスはC:\python27です)
コマンドプロンプトを起動して,"python"と入力します.
すると現在入っているPythonのバージョン情報が確認できるので,Python2.7.8のパスが通っているかどうか確認します.
こんな感じで出てきたらOK.
2.必要そうなライブラリをインストールする
Windowsだとインストーラが用意されているのでとても簡単にライブラリをインストールすることができます.
必要なライブラリは以下のとおり.
- numpy(多次元配列をサポート)
- scipy(数値解析ソフトウェア)
- matplotlib(グラフ描画用ライブラリ)
https://github.com/downloads/matplotlib/matplotlib/matplotlib-1.2.0.win32-py2.7.exe
- pandas(PythonにRっぽい型を持たせることができる)
pandas 0.14.0 : Python Package Index 自分の実行環境に合わせてダウンロードして下さい.自分はwin32-python2.7を落としてきました
- (2014/08/03追記)setuptools(Python入れたらまず入れておこう)
(追記ここまで)
この4つをダウンロードしてきたら,いよいよ次はpylearn2のリポジトリからソースコードを落としてきましょう.SourceTreeを使うととても簡単です.
Free Mercurial and Git Client for Windows and Mac | Atlassian SourceTree
以下のURLからリポジトリを適当な場所にクローンしましょう.
git://github.com/lisa-lab/pylearn2.git
クローンができたら,コマンドプロンプトに戻ってpylearn2をクローンした場所にカレントディレクトリを移します.
そこで以下のコマンドを入力.
"python setup.py develop"
これでデータセットやら何やら必要なデータをダウンロードして実行環境を整えてくれそうです.
ここから先は自宅にあるPCのスペックが低くてまだ進んでいませんので,とりあえず今はここまで.
この先は研究室にあるPCをリモート接続可能にしてからやっていこうと思います.
2014/08/03追記
Macで環境を作って実行する所までいけたのでメモ.
検証OSはMacOSX10.9.4です.
Windowsと同じように必要パッケージをインストールしますが,数値Macの場合はsuperpackを使ったほうが良さそうです.
superpackを使った数値計算ライブラリをまとめてインストールする方法についてはこちらから.
fonnesbeck/ScipySuperpack @ GitHub
(2014/08/04追記)
あ,でもSetupToolsは入らないので,これはWindows版と同じようにして導入して下さい.
これらを導入したら,ターミナルを起動してpylearn2をクローンしたディレクトリまでcdコマンドで移動して,
>python setup.py develop
を打ち込みます.
するとpylearn2の実行に必要なファイルやプログラムをどんどん作ってくれます.数十分かかるので,気長に待ちましょう.
ひと通り処理が終わったらIDLEを起動して,
>>>import pylearn2
と入力.エラーが出ないことを確認して下さい.
さて,ここまでできたらいよいよ公式チュートリアルに従ってサンプルデータの学習を行っていきましょう.
公式チュートリアルは以下のURLから
Quick-start example — Pylearn2 dev documentation
まず学習に使うデータのパスを通します.
export PYLEARN2_DATA_PATH=/data/lisa/data
さらに最後に学習結果を確認するためのパスを追加しておきましょう.
export PYLEARN2_VIEWER_COMMAND="eog --new-instance"
以上のパスを環境変数として追加します.Macだと.bash_profileを開いてお好きなエディタで編集します.
以上のパス通しが完了したら,
/pylearn2/pylearn2/scripts/tutorials/grbm_smd/
に移動して,
$train.py cifar_grbm_smd.yaml
と入力し,CIFAR10のデータセットを用いて学習をします.
マシンのスペックにもよりますが,この操作は結構時間がかかると思います.
成功すると以下の様な結果が出ると思います.
こういった結果が出ていれば成功です.
(随時更新中)