大数据共享单车的版图,如何反射出社会问题?

7

刚才的图,我们从地铁站为维度去区分流量,我想,还有一种途径,就是根据版块来看待投放的问题,我们假设习大大的“房子是用来住的,不是用来投资的”,忽略群租房一类的特殊情况,版块内的居住人口,大致等于这个版块包含的户数(有多少套房子)* 3,因此用链家的数据计算版块内总户数,基本可以代表每个版块夜间的常驻人口,只要我们配合凌晨的单车存量,基本可以刻画第二天一早的单车供需关系。

大数据

你发现,三林、江桥、顾村、金山都是蓄积人口的大户,但是郊区面积也大,真正适合刻画人多人少的,还是按照户数 / 版块面积算人口密度比较合适,你发现环市中心是最密集的部分,包括了甘泉/宜川、光新、曲阳这些地方,如下

9

因此,人均保有单车,更准确的说是每天早晨从家出发的路程的单车供需关系如下人均保有单车率 = 这个版块的单车数 / 这个片区的小区户数,我们会发现漕河泾、外滩、张江、五角场和金桥比率很大。

10

当然,我们关注的不是哪里单车多而是哪里单车缺,显示深红色的表明,这个版块早上是缺乏共享单车的,当然,这个单车很缺的地方可能人也很少,我们以5万户为界限,删掉人口很少的版块,此刻我们发现,普陀区的甘泉/宜川版块、 闸北区的彭浦版块、奉贤区的南桥版块、浦东的周浦、浦江版块,这些都是比较缺共享单车的,这也许值得单车公司去优化布局。

11

从这份数据里,我们还可以推测单车公司的投放策略,只要看今天系统中新捕获的单车分布,亮点代表在一个地方叠加了许多单车,这种分布,应是自然过程无法形成的。从昨天看,单车公司在流量最大的2号线的某几个站点附近投的单车。

12

单车的数据非常之简单,经度纬度时间id,而且还不是连续的轨迹,但还是反应了一些问题。当然,我觉得共享单车最重要的不是今天我们讨论的怎么投放车子,而是变成一面数据的镜子,反射出社会的别的层面的问题留一个悬念。