通过案例学习Pandas数据分析datetime类型!

datetime类型案例

加载丹佛市犯罪记录数据集

显示结果:

显示结果:

查看某一天的报警记录

显示结果:

243 rows × 7 columns

查看某一段时间的犯罪记录

显示结果:

75403 rows × 7 columns

时间段可以包括小时分钟

显示结果:

75175 rows × 7 columns

查询凌晨两点到五点的报警记录

显示结果:

29078 rows × 7 columns

查看发生在某个时刻的犯罪记录

显示结果:

118 rows × 7 columns

在按时间段选取数据时,可以将时间索引排序,排序之后再选取效率更高

显示结果:

显示结果:

计算每周的犯罪数量

  • 为了统计每周的犯罪数,需要按周分组

  • resample重采样,可以按照指定时间周期分组

显示结果:

检验分组结果

显示结果:

显示结果:

也可以把周四作为每周的结束

显示结果:

将按周分组结果可视化

显示结果:

分析每季度的犯罪和交通事故数据

显示结果:

所有日期都是该季度的最后一天,使用QS生成每季度的第一天

显示结果:

查看第二季度的数据,检验结果

显示结果:

结果可视化

显示结果:

分析工作日的犯罪情况:可以通过Timestamp的dt属性得到周几,然后统计

显示结果:

显示结果:

小结

  • Pandas中,datetime64用来表示时间序列类型

  • 时间序列类型的数据可以作为行索引,对应的数据类型是DatetimeIndex类型

  • datetime64类型可以做差,返回的是Timedelta类型

  • 转换成时间序列类型后,可以按照时间的特点对数据进行处理

  • 提取日期的各个部分(月,日,星期…)

  • 进行日期运算

  • 按照日期范围取值

资源下载:

 

发布日期: