Dive into hoge

データ分析関連の備忘録

pandas操作⑦:列表示

列が省略されるときに全表示させたい

デフォルトは20らしいので好きな数値に変更する。

# pandasの表示列数設定
pd.set_option('display.max_columns',65)

レコード毎にmaxの列番号を抽出したい

最大値の列番号をmax列に突っ込む。

# DataFrameでレコード毎に最大値の列番号を抽出
# dfは使いたいデータフレームという前提
df['max'] = df.idxmax(axis = 1)

任意のカラムでカウント(Group byでカウントのイメージ)

# 上記の最大値の列番号をmax列に入れたときのカウント
df["max"].value_counts()

列の名前を変更したい

上記で作ったmax列の名前をcluster_idという名称に変更したい。

# 元のデータフレームに変更を反映しない場合
df = df.rename(columns = {'max':'cluster_id'})

# 元のデータフレームに変更を反映する場合
df = df.rename(columns = {'max':'cluster_id'}, inplace = True)