いつも忘れるpandas.Dataframeの列処理 ~ 文字列分割
dataframeの特定の列の値をsplitで分割して新しいdataframeの列として取得するには、splitにexpand=Trueオプションを使用する。
例えば、dataframeのある列が次のような文字列を格納していたとする。 X'分割区切り文字'suffix1 Y'分割区切り文字'suffix2 Z'分割区切り文字'suffix3 #分割するが、戻り値はSeries df['列名'].str.split('分割区切り文字') 0 [X, suffix1] 1 [Y, suffix2] 2 [Z, suffix3] #分割して、Dataframeの各列として取得 df['列名'].str.split('分割区切り文字', expand=True) 0 1 0 X suffix1 1 Y suffix2 2 Z suffix3