numpyで平均を求める

はじめに

機械学習を勉強しているとPythonが避けて通れない。
中でもnumpyはとても重要だったりする。

基本的な使い方から調べた。

使い方

何はともあれinstall

pipで一発。

import

以降、npとして利用する

変数に入れる

1,2,3を配列として入れる

結果は

変数の中の平均を取る

この配列の中の平均を計算する
一つ一つ足して、カラム数で割る・・・というような処理は不要で、

.mean()メソッドを利用することで自動で計算することが可能。

結果は以下のとおり

中心化を行う

単回帰分析の場合、求めるのは

  • 傾き
  • 切片

の2つ。
この中心化を行うことで切片を計算する事が不要になる。

やることは、全てのカラムから、平均分を引くだけ。

詳細はこちら  http://www.bokupy.com/detail/93#single-regression3

結果は以下のとおり

[1 2 3]から全てのカラムが平均2が引かれている事がわかる。