いつも忘れるpandas.DataFrameの備忘録
全然覚えられない。
#欠損値NaNが含まれる行/列を削除する(how="all"とすると全て欠損値の行/列を削除する。デフォルトはhow="any"。axis=1とすると列削除) result_df = df.dropna(how="all", axis=1) # DataFrameのindexを振り直すreset_index(drop=Trueを指定しない場合、元のindexは新しい列として残る。それを消すにはdrop=Trueを指定する) result_df = df.reset_index(drop=True) # 特定の行を削除する(次の例は最初と2番目の行を削除する) result_df = df.drop([0, 1]) #特定の行を新たなカラム名とする df.columns = list(df.iloc[インデックス番号]) # 特定のカラムに NaN がある行を削除 df.dropna(subset=['カラム名']) #特定のカラムに、指定した文字がある行を削除 result_df = df.drop(df.index[df['特定のカラム名']==ある値]) #***ちなみに、df['特定のカラム名']==ある値、により「特定のカラム名」に「ある値」が含まれるか含まれないかをbooleanで表すSeriesが取得できる。