Python日記

【Pandas】set_indexで複数(2つ以上)の列をインデックスに使う|Anacondaでデータ分析

2021年8月14日

pandas set_indexメソッドを覚えようの巻 データフレームワーク

PandasやAnacondaを使って、データ分析をする際に、

便利な機能を紹介していきます。

set_indexメソッドを使って複数のインデックスを作る

上記のような表を作成しました。

ここから、sex、ageの二つをインデックスしていこう思います。

使うのは、set_indexメソッドです。

データフレームのset_indexメソッドは、指定した1つ以上の列をインデックスとして持った新しいデータフレームオブジェクトを生成します。

『Pythonによるデータ分析入門』 P.248
df = age_sort.set_index(['sex', 'age']) 
df

以下が実行した結果です。

はい、しっかりとsexとageがインデックスに使われています。

ちなみに、set_indexのsexとageの順番を入れ替えてみるとこんな結果がでてきます。

つまり、インデックスを先にさせたいものをset_indexの最初にもってくればOKです。

まとめ

set_indexはデータ分析をする上で、非常に役に立つメソッドなので、

ぜひたくさん使って覚えてください、

-Python日記
-,