目次へ
"NIKKEI Linux" を書店で立ち読みする機会が多い。その時に"Python & Jupyter でデータ解析入門" (グーグル 中井 悦司) に興味を引かれていた。正月に 2017年2月号を購入して読んだところ 、Jupyter の環境の整え方について次のように書いてあるので躊躇した。
Jupyterの利用環境を整備する方法については、第1回の記事を参考にしてください。今回のプログラムを実行するには、Dockerコンテイナーを用いて用意した環境が必要となります。
ところで、自分の Mac には Anaconda を使ってJupyter をインストールしてあるので実行してみた。
- Anaconda Navigator から Jupyter を起動できる。
- scikit-learn パッケージを次のコマンドでインストールできる。
$ conda install scikit-learn
- ノートブックにプロットを表示させるには、ノートブックの最初のセルに次のコマンドを書けばよい。
%matplotlib inline
6回の連載を試行するための工夫
2016年9月号 "第1回 Jupyterと Python プログラッミングの基礎" から始まって 2017年2月号 第6回 データ分析と統計解析の基礎"までの計6回の連載になっている。
バックナンバーを購入するためアマゾンで kinndle版を調べたところ、 9月号、10月号、11月号、12月号が kindle unlimited になっていた。kindle unlimited に登録をしているので 0円でダウンロードできた。
記事に載っているノートブックの文字が小さいが Fire HD 10インチを使っているので拡大して読むことができた。
連載記事を実行するには、kindle unlimited と Fire HD 10 の効果も大きいと感じた。
メモ
第1回 Jupyterと Python プログラッミングの基礎、2016年 9月号
第2回 グラフを用いたデータの可視化、2016年 10月号
第3回 乱数シミュレーションで学ぶ確率論、2016年 11月号
第4回 物理シミュレーションを動画で体験、2016年 12月号
第5回 数値計算による数学の直感的理解、2017年 1月号
- アニメーションが表示される。
- パッケージ内の関数のヘルプや例題を見る方法の説明があると良いのだが。
第6回 データ分析と統計解析の基礎、2017年 2月号
pandas
パッケージが提供するデータフレームを使用する。- 機械学習ライブラリーの
scikitt-learn
パッケージが提供する 「ロジスティクス回帰」を使用する。
scikitt-learn
パッケージについては学習すべきことが多い。 - 関係式の精度を確認するため、クロスバリデーションの処理を使っている。