【Pandas】set_indexで複数(2つ以上)の列をインデックスに使う|Anacondaでデータ分析

pandas set_indexメソッドを覚えようの巻 データフレームワーク

PandasやAnacondaを使って、データ分析をする際に、

便利な機能を紹介していきます。

目次

set_indexメソッドを使って複数のインデックスを作る

上記のような表を作成しました。

ここから、sex、ageの二つをインデックスしていこう思います。

使うのは、set_indexメソッドです。

データフレームのset_indexメソッドは、指定した1つ以上の列をインデックスとして持った新しいデータフレームオブジェクトを生成します。

『Pythonによるデータ分析入門』 P.248
df = age_sort.set_index(['sex', 'age']) 
df

以下が実行した結果です。

はい、しっかりとsexとageがインデックスに使われています。

ちなみに、set_indexのsexとageの順番を入れ替えてみるとこんな結果がでてきます。

つまり、インデックスを先にさせたいものをset_indexの最初にもってくればOKです。

まとめ

set_indexはデータ分析をする上で、非常に役に立つメソッドなので、

ぜひたくさん使って覚えてください、

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

節約に励むマーケターです!30歳を機に別職種から、マーケターにキャリアチェンジ。IT企業で専任のマーケターをしています。0からプログラミングを学びはじめました! ★データサイエンティストの勉強中です!お問合せはこちら!

コメント

コメントする

CAPTCHA


目次
閉じる