本期,边肖将为大家带来一篇关于如何进行iPhone行走数据的分析。文章内容丰富,从专业角度进行分析和描述。看完这篇文章,希望你能有所收获。
我将展示如何使用熊猫和ggplot来分析iPhone的行走数据。我主要用Rodeo(yhatsquo;S IDE)进行数据分析。
数据收集
首先,我想从我的iPhone导出行走数据进行分析。量化自我实验室的工作人员开发了一个方便的数据提取工具;mdashQS通道.
以下是一组关于行走数据的截图:
QS Access应用程序可以提取一个包含一定时期行走数据的CSV文件,其中包含三列变量mdashmdash起点、终点和步数。
数据分析
我主要使用熊猫中的时间序列分析工具来分析数据。当韦斯麦金尼开始处理熊猫项目时,他已经在一家投资管理公司工作,该行业广泛依赖时间序列分析方法。因此,熊猫包含许多时间序列分析功能。
首先,当我们有时间序列数据时,我们可以定义参数parse _ dates,这样熊猫就可以正确处理时间序列数据。对我们来说,终点变量不包含任何额外的有价值的信息,所以我们在分析过程中不会考虑这个变量。
* * *我们将起点变量设置为指标变量,这有助于我们进一步的数据分析。
每小时步行数据
如何快速绘制和分析已有的行走数据?
遗憾的是,我们无法从上图中获得更多有价值的信息。应该如何提高可视化效果?我有一个好主意。mdash我们可以使用熊猫中的重采样函数来改变数据集的时间粒度。
更准确地说,我们可以使用下采样的方法来降低时间频率。比如我们可以采集小时数据,然后通过重采样和汇总计算得到日数据、周度数据和月数据。
获取每天步行数据
从上图可以看出,每天的步数都有上升的趋势。随着时间的推移,步行距离越长。
获取每周和每月步行数据
就像上面的代码一样,通过将W和M传入重采样函数,可以得到每周和每月的行走数据。
因为我比较关心日常锻炼,所以我会用平均函数来计算每周或每月的平均日常步行情况。的具体代码如下:
更深入的分析
我很好奇:工作日的运动量比周末大吗?我们可以使用weekday和weekday_name来帮助分析。对于每个时间戳数据,前者可以知道它属于一周中的哪一天,而后者可以知道该时间点对应的时间名称信息。在添加了这两个新变量之后,我们还可以添加一个布尔变量来指示某个时间点是否是周末。
lt="如何进行iPhone步行数据的分析">
此外,我们还可以根据变量 weekend_bool 来做分类汇总处理,并对比两组数据的差异情况。
从上述结果中可以看出,周末期间的每天平均步数是 11,621 步,中位数是 10,228,而工作日期间的每天平均步数是 10,146 步,中位数是 9,742,因此我们可以认为周末期间的运动量更大。
趋势分析
***让我们来讨论下上文提到的上升趋势,四月初由于工作的原因,我从夏洛特搬到了纽约城,担任 Yhat的软件工程师。
我想知道经过这次搬家之后,我每天的步行情况有没有发生改变?我们可以利用上文分析周末与工作日步行情况的方法来分析这个问题。
从上图中我们可以轻易地看出自从搬到纽约城之后,每天的运动量确实增加了。但这是由多方面因素共同决定的,比如搬到纽约城后我的跑步次数增加了,这会增加每天的平均步数。如果想要进行更深入的分析,我们需要获取更多的数据支持,由于篇幅问题,我们将在之后的文章中继续分析。
上述就是小编为大家分享的如何进行iPhone步行数据的分析了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注行业资讯频道。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/153430.html