以下ドキュメントを参照しつつ、もごもごしてみます。
その前に
virtualenv あたりをもごもごしてみます。とりあえず virtualenvwrapper を導入。
$ sudo apt-get install virtualenvwrapper
で、以下を .bashrc に、とあります。
export VIRTUALENVWRAPPER_PYTHON=/usr/bin/python
source $(which virtualenvwrapper.sh)
て、virtualenvwrapper.sh
とかないですね。面倒なので以下。
$ mkdir mlmpyja
$ cd mlmpyja
$ virtualenv --distribute ENV
$ source ENV/bin/activate
(ENV)$
終わったら deactivate
すれば良いのね。ではチュートリアルすすめます。
とりあえず
以下なのかどうか。
(ENV)$ pip install numpy scipy matplotlib sklearn
盛大にエラーが出まくってるように見えてアレなんですがどうなのか。
matplotlib が導入できぬ
まず、distibute
をバージョン指定で導入。次に libfreetype6-dev
を apt-get
で導入。もひとつ、libpng-dev
も導入。
また、scipy
も導入できておらず以下を導入してリトライ。
- libblas-dev
- liblapack-dev
- gfortran
scipy
導入後、sklearn
も無事導入完了。
Native Bayes
入門編を言われるがまま作ってみます。つうか最終的に以下をカンニングしました。
中身が理解できていない。とりあえず動かしてみました、ってだけですね。ちなみに実行スクリプトですが以下から入手できます。
言われるがまま、実行してみましたの図、が以下です。
>>> from NativeBayes1 import NativeBayes1
>>> import numpy as np
>>> data = np.genfromtxt('vote_filled.tsv', dtype=np.int)
>>> X = data[:, :-1]
>>> y = data[:, -1]
>>> clr = NativeBayes1()
>>> clr.fit(X, y)
>>> predict_y = clr.predict(X[:10, :])
>>> for i in xrange(10):
... print i, y[i], predict_y[i]
...
0 1 1
1 1 1
2 0 1
3 0 0
4 0 0
5 0 0
6 0 1
7 1 1
8 1 1
9 0 0
>>>
諸々について、引き続き精査します。