[文章摘要]Studying commuting behaviours using collaborative visual analytics

来源:互联网 发布:淘宝开店认证需要等吗? 编辑:程序博客网 时间:2024/06/08 16:16
文章:Studying commuting behaviours using collaborative visual analytics
作者:Beecham R, Wood J, Bowerman A.
来源:Computers, Environment and Urban Systems, 2014, 47: 5-15.


本文利用伦敦的公共自行车租用数据来分析通勤模式,将通勤作为一种事件(event)来处理。


以前的研究假设早上和晚上的journey形成一个闭合的圈,即早上和晚上的旅途正好相反,但这有时候是不成立的,特别是对自行车数据而言。
以前相似的研究仅利用了temporal模式来分析,而本研究还加上了空间部分。


文本两大贡献:
1,利用自行车停靠站的空间分析,来得到用户的工作点,并且标记出通勤旅行。
2,与多个人共同协作的协同可视分析方法。


方法分为三步:
1,定义问题:与交通局的人员一起商定
2,开发可视分析工具
3,生成假设和见解。


注意:早晚高峰时期,自行车除了通勤还可能有其他目的。


为分析用户行为,利用市场分析中的时间邻近-频度分割法(Recency–Frequency (RF) segmentation),对用户分组,即考虑用户最近一次使用自行车的时间,以及使用的频率,将用户分组,每个维度分为5组,如果Recenty为5,Frequency也为5,则其为重度用户。


见journey按早晚高峰的时间过滤,并且查看每个用户高峰时间的journey总数,总数越大,则越能确定与工作相关。

利用三个协同视图来分析该数据,如下图,timeline,flowmap view和用户视图(显示其属性,注意这里有用户属性信息)。




本文使用了三个方法来确定work地点:

1,对早高峰的目的地(Destination)和晚高峰的出发地(Origin)求加权平均中心点(Weighted mean centers),但该方法会遗漏有多个工作地点的情况,如下图,

左图是三个中心地点,右图是两个,其中还绘制了标准差椭圆,地点用红色的圆表示。



2,利用K均值聚类来克服上述方法不能发现多个工作地点的不足,利用标准差椭圆的信息来制定k的数目。但从下图可见,该方法有时候也会出错,a high level of distance deviation and large ratio of dispersion(标准差椭圆的信息)也不一定意味着双中心的工作地点。当然,空间异常的存在也会干扰结果。




3,利用KDE方法,拟解决上述两个问题(多中心和空间异常)。
对早高峰的目的地(Destination)和晚高峰的出发地(Origin)进行KDE,结果如下,
Kernel的大小为750m,750m作为停靠站和用户工作点步行的距离。两个参数:一个是kernel大小,另一个是如果密度小于某一阈值,则认为其不属于通勤的地点。




下面是城区用户和周边用户的使用情况,城市外围(蓝色)的一般通过火车等赶到市中心,最后的一点距离使用bike,红色的为市区居民的使用,可以看到两者的模式有很大不同,市区用户的模式更加多样化。



在peak time 之间(早10点到下午3点)发现bike使用大多在大学城中。




0 0
原创粉丝点击