pandas操作⑦:列表示
列が省略されるときに全表示させたい
デフォルトは20らしいので好きな数値に変更する。
# pandasの表示列数設定 pd.set_option('display.max_columns',65)
レコード毎にmaxの列番号を抽出したい
最大値の列番号をmax列に突っ込む。
# DataFrameでレコード毎に最大値の列番号を抽出 # dfは使いたいデータフレームという前提 df['max'] = df.idxmax(axis = 1)
任意のカラムでカウント(Group byでカウントのイメージ)
# 上記の最大値の列番号をmax列に入れたときのカウント df["max"].value_counts()
列の名前を変更したい
上記で作ったmax列の名前をcluster_idという名称に変更したい。
# 元のデータフレームに変更を反映しない場合 df = df.rename(columns = {'max':'cluster_id'}) # 元のデータフレームに変更を反映する場合 df = df.rename(columns = {'max':'cluster_id'}, inplace = True)