いつも忘れるpandas.Dataframeの列処理 ~ 文字列分割

dataframeの特定の列の値をsplitで分割して新しいdataframeの列として取得するには、splitにexpand=Trueオプションを使用する。

例えば、dataframeのある列が次のような文字列を格納していたとする。
X'分割区切り文字'suffix1
Y'分割区切り文字'suffix2
Z'分割区切り文字'suffix3

#分割するが、戻り値はSeries
df['列名'].str.split('分割区切り文字')

0      [X, suffix1]
1      [Y, suffix2]
2      [Z, suffix3]


#分割して、Dataframeの各列として取得
df['列名'].str.split('分割区切り文字', expand=True)

     0  1
0    X  suffix1
1    Y  suffix2
2    Z  suffix3