Pandas.DataFrameでデータの標準化
データの標準化という言葉が正しいのかどうか、ちょっと不確かなんですが、時々、各データから、平均値を引いて、標準偏差で割りたいときがあります。DataFrameでそれを各行のデータについてやりたいときは、こうします。

d = pd.DataFrame({'a':[1,2,3],'b':[3,4,5]})
m = d.mean(1)
s = d.std(1)
nd = d.sub(m,axis=0).div(s,axis=0)

スポンサーサイト
【2014/08/26 18:22】 | Python | トラックバック(0) | コメント(0) | page top↑
<<scikitlearnでRandom Forests | ホーム | 分類用の色付けを持ったヒートマップを描く>>
コメント
コメントの投稿














管理者にだけ表示を許可する

トラックバック
トラックバックURL
→http://tanopy.blog79.fc2.com/tb.php/113-9f70fea8
この記事にトラックバックする(FC2ブログユーザー)
| ホーム |