いつも忘れるpandas.DataFrameの備忘録

全然覚えられない。

#欠損値NaNが含まれる行/列を削除する(how="all"とすると全て欠損値の行/列を削除する。デフォルトはhow="any"。axis=1とすると列削除)
result_df = df.dropna(how="all", axis=1)

# DataFrameのindexを振り直すreset_index(drop=Trueを指定しない場合、元のindexは新しい列として残る。それを消すにはdrop=Trueを指定する)
result_df = df.reset_index(drop=True)

# 特定の行を削除する(次の例は最初と2番目の行を削除する)
result_df = df.drop([0, 1]) 

#特定の行を新たなカラム名とする
df.columns = list(df.iloc[インデックス番号])

# 特定のカラムに NaN がある行を削除
df.dropna(subset=['カラム名'])

#特定のカラムに、指定した文字がある行を削除
result_df = df.drop(df.index[df['特定のカラム名']==ある値])

#***ちなみに、df['特定のカラム名']==ある値、により「特定のカラム名」に「ある値」が含まれるか含まれないかをbooleanで表すSeriesが取得できる。