pandasのread_csvでファイルを読み込む際のヘッダの扱いについて
前回の勘違いネタ「pandasのread_csvはDataFrameを戻してくれるのではないのか?と思っていたら、その通りだった・・・」からの続き。
filename = "USDJPY.csv" data = pd.read_csv(filename, names=('Time','Open','High','Low','Close'), sep=',', parse_dates=True, float_precision = "high").values
このように実装したときの出力結果は次のようになって、データにヘッダが入ってしまった。
Time Open High Low Close
0 Time Open High Low Close
1 2016/9/7 6:10 102.022 102.042 101.022 101.542
2 2016/9/7 6:10 102.021 102.041 101.021 102.041
3 2016/9/7 6:10 102.02 102.04 101.02 102.04
4 2016/9/7 6:10 102.019 102.039 101.019 102.039
5 2016/9/7 6:10 102.018 102.038 101.018 102.038・・・・・・・・・・・・・・・・・
入力データのCSVファイルにはヘッダがあるので「header=None」を指定せずに読み込んだが、「names=('Time','Open','High','Low','Close')」を指定するとこのようになる。namesの指定を外して次のように修正。
filename = "USDJPY.csv" data = pd.read_csv(filename, sep=',', parse_dates=True, float_precision = "high").values
Time Open High Low Close
0 2016/9/7 6:10 102.022 102.042 101.022 101.542
1 2016/9/7 6:10 102.021 102.041 101.021 102.041
2 2016/9/7 6:10 102.020 102.040 101.020 102.040
3 2016/9/7 6:10 102.019 102.039 101.019 102.039
4 2016/9/7 6:10 102.018 102.038 101.018 102.038
5 2016/9/7 6:10 102.018 102.038 101.018 102.038・・・・・・・・・・・・・・・・・