数据可视化初探-用G2分析睡眠数据

时间:2021-1-8 作者:admin

G2 Data-Visualization

最近一直想研究研究数据可视化,想想自己买了 Misfit 的手环也差不多有一年半多了,虽然 Misfit App 上有每日和月度的统计,但是 Misfit 似乎无法满足做长期数据分析的要求,不过幸好 Misfit 有开放 API,可以调用他的 API 来拉取数据,因此我取了2017-01-01 到 2018-08-31期间的睡眠数据来做分析。

本文中的图表均用 G2 绘制,G2 是 AntV 团队基于 The grammar Of Graphics 理论的可视化库。相比于其他的可视化库,G2 还自带数据处理的 DataSet API,相当的实用,强烈推荐有兴趣的同学去学习一下。

月度平均睡眠时长

折线图是日常生活中最常见的数据图标,使用 excel 也能轻易地制作出来,经常用来反应数据随着时间的变化趋势。

首先可以看出来,我从 2017 年 1 月 1 日到 2018 年 8 月 31 日这段时间里,月度平均睡眠时间能超过 7 小时的,只有三个月,可以说是非常缺睡眠了。

2017 年的下半年,整体的睡眠时间是比较少的,主要那个时候在操心装修房子的事,每天工作完了回家都要想这个地方怎么弄,那个地方会不会有问题,还得和设计师沟通,虽然有父亲在家帮我和工人联系,老婆帮我把控装修风格,省了不少事,但是也会去一些地方海淘家具,还是操了不少心,。这段时间持续比较久,估计也是头发掉得最多的时间段。

接下来一个低谷就是 2018 年的 3 月,这段时间又开始忙结婚的事,每天就是,和老婆讨论结婚的细节,和婚庆的沟通,和长辈协商婚礼流程,准备婚庆的各种东西,相比于装修可以说是有过之而无不及,不过结婚要做的事情还是比较少,所以基本上一个三月就搞定了。随后的四月几乎是这个半年来睡得最香的一个月,估计也是烦心事搞定了,才会变得这么能睡吧。

5、6、7 三个月,把人生中最烦恼的两件事搞定了,于是开始放纵了起来,去欧洲度蜜月的时候,每天 12 点睡,6 点起,可以算是作息最规律的时候,然后接下来两个月,不是在玩 switch,就是在看世界杯,或是在准备换工作的面试,跌到了睡眠时间的谷底,非常地堕落,想想自己的年纪轻轻,就身体那边不行,这边不行,接下来还是要好好睡觉啊,毕竟身体才是革命的本钱啊!

睡眠时长占比图

饼图常用于表示不同分类的占比情况,也是非常常见的一种图表。

这些日子里,我的平均睡眠时长是 6 小时 41 分钟。

这张图表用的是四舍五入的数据来统计的,图中可以见到睡了 6.5-7.5 小时这个时间段的次数是最多的,不过令我感到意外的是,超过 8 小时的睡眠居然达到了 109 次,看来我还是比较偏爱睡懒觉的。3.5-6.5 小时的睡眠,占了约 38%,这就大大降低了平均睡眠时长,变得不到 7 小时了。

睡眠时长、深度睡眠、浅睡眠雷达图

雷达图经常用于多分类多维度数据的对比,图中的周中每一天,就属于一个维度,而时间则是一个衡量尺度,这样子就很容易比较出周中每天的变化趋势,以及每天深度浅度睡眠时间占比。

为了符合查理,这边的时间取的都是晚上,比如说你虽然是周六凌晨才睡,但是时间仍然算在周五晚上。分析可知,每周五的深度睡眠时间最长而且占比最高,这大概就是经过一周的劳累,虽然周六早上起来可能有事,但是周五的晚上还是睡得最香。而睡眠时间最长的居然是周一,根据我的推测,是周末一般都比较珍惜时间,用来玩游戏啊,刷社交网站,不愿意睡觉,这样子 high 过了一个周末,到了周一的晚上反而特别累,就睡得早了一点。whatever,这都是根据数据的出来的推测,也回忆不出什么特别的场景了。

睡觉起床时间分布图

这张图表属于热力图,热力图的展现数据通常是三个维度的,两个连续的维度映射到 x, y 轴,第三个连续数据通过颜色映射,热力图主要关注分布。

图中可见,我的主要睡觉时间是 00:30 到 2:00 这个时间段,想想我平日里躺到了床上,就算时间已经到了 1 点,还是要刷刷即刻,看看微博才能睡,这大概就是一个夜猫子最后的倔强吧。而起床时间则主要是 8:00 到 9:00,因为一年半多的时间里,我一直在堆糖工作,上班时间是 10 点,骑车 20 分钟就到了,虽然早上可能偶尔去游个泳,买个早饭回来给老婆吃,而且搬回昆山开始高铁侠这个时间段只有一个月多一点,还不能撼动这么长的时间形成的稳定趋势。

总结

之前总是在写电商啊,内容平台的业务,写着写着就发现总是重复劳动,偶尔会有新功能会要去突破自我,但也没有什么自我满足感。现在看了一看数据可视化,才发现有意思的东西有这么多。

其实我分析的数据其实还不够到位,比如睡在出租屋里和家里的睡眠时间和质量,搬家了之后的睡眠时间和质量,世界杯期间的睡眠和质量等等,这些东西都是值得去探讨,去研究的方面。而有些数据从我个人就能分析得到,另外一些则需要大数据才能分析得出,所以数据可视化还是非常有意思的一个领域。

从本次数据可视化的探究,我也得出了以下几点总结:

  1. 数据可视化往往就诞生于生活,应用于生活,服务于生活;
  2. 数据到处都是,但是如何挖掘数据场景,应用数据场景,就要平时多观察,多累积多实践;
  3. 数据可视化的步骤分为以下几步:数据准备、数据整理、绘制图表,在你看到一组数据的时候,你就要洞察他可以从哪些角度来分析,随后你就要确定要用那种展现方式,然后如果你能力够强,就可以自己设计图标(像我这种菜鸡就是跟着别人的 API 来画图);
  4. 数据处理的工具有很多种,选对工具很重要,比如 python 的库和内置方法,处理数据就比 js 方便许多,能达到事半功倍的效果;
  5. 画完了图也不要不了了之,分析这些图表,是否可以做 Business Intelligence(BI),总之就是要不断地思考;
  6. 一个人的力量是有限的,互联网时代是信息爆炸的时代,有不懂的就要去搜索,就要找专业的人士去问,这样才能不断成长。
声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。