時系列の解析をする際に、データフレーム内の日付データを時間を含む、つまり
2016-01-01 00:00:00
のような形ではなく、
2016-01-01
の形で取り扱いたい場合があります。

Romania Earthquake Historical Dataをサンプルデータとして取り扱います。
※Kaggleからのデータ取得のやり方はこちらから

実際に読み込みを行ないます。

※Kaggleからのデータ取得のやり方はこちらから

実際に読み込みを行ないます。
※pd.read_csvで型を指定して読み込む場合はこちら

import pandas as pd
import numpy as np

eq_data = pd.read_csv("eartquakes_Romania.csv", parse_dates=[0])

データの中身はこちら

In [10]: eq_data.head()
Out[10]:
                     time  latitude  longitude   depth  mag magType  nst  \
0 2017-03-08 13:43:13.070   45.6583    26.4629  148.97  4.1      mb  NaN
1 2017-02-08 15:08:20.550   45.5187    26.2594  127.01  4.7      mb  NaN
2 2017-02-08 09:52:06.090   45.7360    26.6616  129.27  4.4      mb  NaN
3 2016-12-27 23:20:56.100   45.7144    26.5283   97.00  5.6     mww  NaN
4 2016-10-31 11:59:49.800   45.8700    26.7800   90.00  4.1      mb  NaN

    gap   dmin   rms    ...                      updated  \
0  41.0  0.259  0.76    ...     2017-04-20T10:53:57.224Z
1  19.0  0.222  1.10    ...     2017-03-01T06:16:37.044Z
2  48.0  0.559  1.23    ...     2017-03-05T08:24:32.472Z
3  14.0  0.466  0.80    ...     2017-03-23T22:52:05.040Z
4   NaN    NaN  1.43    ...     2017-01-24T02:02:12.040Z

                            place        type horizontalError depthError  \
0  19km N of Gura Teghii, Romania  earthquake             3.2        3.9
1     11km NNW of Nehoiu, Romania  earthquake             6.6        5.4
2      4km WNW of Nereju, Romania  earthquake             6.4        5.4
3       14km W of Nereju, Romania  earthquake             4.3        1.8
4     2km SW of Matacina, Romania  earthquake             6.7        6.4

   magError  magNst    status  locationSource magSource
0     0.127    17.0  reviewed              us        us
1     0.045   152.0  reviewed              us        us
2     0.148    13.0  reviewed              us        us
3       NaN     NaN  reviewed              us        us
4     0.157    11.0  reviewed             buc        us

[5 rows x 22 columns]

pandasのto_datetimeと、dt.strftimeを利用する

formatを時間を含まない形に指定する必要があります。

eq_data['time'] = pd.to_datetime(eq_data['time'].dt.strftime("%Y-%m-%d"))

結果はこちら

In [12]: eq_data.head()
Out[12]:
        time  latitude  longitude   depth  mag magType  nst   gap   dmin  \
0 2017-03-08   45.6583    26.4629  148.97  4.1      mb  NaN  41.0  0.259
1 2017-02-08   45.5187    26.2594  127.01  4.7      mb  NaN  19.0  0.222
2 2017-02-08   45.7360    26.6616  129.27  4.4      mb  NaN  48.0  0.559
3 2016-12-27   45.7144    26.5283   97.00  5.6     mww  NaN  14.0  0.466
4 2016-10-31   45.8700    26.7800   90.00  4.1      mb  NaN   NaN    NaN

    rms    ...                      updated                           place  \
0  0.76    ...     2017-04-20T10:53:57.224Z  19km N of Gura Teghii, Romania
1  1.10    ...     2017-03-01T06:16:37.044Z     11km NNW of Nehoiu, Romania
2  1.23    ...     2017-03-05T08:24:32.472Z      4km WNW of Nereju, Romania
3  0.80    ...     2017-03-23T22:52:05.040Z       14km W of Nereju, Romania
4  1.43    ...     2017-01-24T02:02:12.040Z     2km SW of Matacina, Romania

         type horizontalError depthError  magError  magNst    status  \
0  earthquake             3.2        3.9     0.127    17.0  reviewed
1  earthquake             6.6        5.4     0.045   152.0  reviewed
2  earthquake             6.4        5.4     0.148    13.0  reviewed
3  earthquake             4.3        1.8       NaN     NaN  reviewed
4  earthquake             6.7        6.4     0.157    11.0  reviewed

   locationSource magSource
0              us        us
1              us        us
2              us        us
3              us        us
4             buc        us

[5 rows x 22 columns]

 

これで日付型を維持しつつ、時間を含まない日付型に変更できました。