Python & Jupyterでデータ解析入門 (NIKKEI Linux 連載)の試行

目次へ

"NIKKEI Linux" を書店で立ち読みする機会が多い。その時に"Python & Jupyter でデータ解析入門" (グーグル 中井 悦司) に興味を引かれていた。正月に 2017年2月号を購入して読んだところ 、Jupyter の環境の整え方について次のように書いてあるので躊躇した。

 Jupyterの利用環境を整備する方法については、第1回の記事を参考にしてください。今回のプログラムを実行するには、Dockerコンテイナーを用いて用意した環境が必要となります。

ところで、自分の Mac には Anaconda を使ってJupyter をインストールしてあるので実行してみた。

  • Anaconda Navigator から Jupyter を起動できる。
  • scikit-learn パッケージを次のコマンドでインストールできる。
    $ conda install scikit-learn
  • ノートブックにプロットを表示させるには、ノートブックの最初のセルに次のコマンドを書けばよい。
    %matplotlib inline

6回の連載を試行するための工夫

2016年9月号 "第1回 Jupyterと Python プログラッミングの基礎" から始まって 2017年2月号 第6回 データ分析と統計解析の基礎"までの計6回の連載になっている。

バックナンバーを購入するためアマゾンで kinndle版を調べたところ、 9月号、10月号、11月号、12月号が kindle unlimited になっていた。kindle unlimited に登録をしているので 0円でダウンロードできた。

記事に載っているノートブックの文字が小さいが Fire HD 10インチを使っているので拡大して読むことができた。

連載記事を実行するには、kindle unlimited と Fire HD 10 の効果も大きいと感じた。

メモ

第1回 Jupyterと Python プログラッミングの基礎、2016年 9月号

第2回 グラフを用いたデータの可視化、2016年 10月号

第3回 乱数シミュレーションで学ぶ確率論、2016年 11月号

第4回 物理シミュレーションを動画で体験、2016年 12月号

第5回 数値計算による数学の直感的理解、2017年 1月号

  • アニメーションが表示される。
  • パッケージ内の関数のヘルプや例題を見る方法の説明があると良いのだが。

第6回 データ分析と統計解析の基礎、2017年 2月号

  • pandasパッケージが提供するデータフレームを使用する。
  • 機械学習ライブラリーの scikitt-learnパッケージが提供する 「ロジスティクス回帰」を使用する。
    scikitt-learnパッケージについては学習すべきことが多い。
  • 関係式の精度を確認するため、クロスバリデーションの処理を使っている。

目次へ