一文教你如何用python探寻地铁与房价的关系
从我大学毕业到现在工作已经快20年了,由于我这个人比较喜欢挑战,所以北上广深都待过,偶尔休假回到我的三四线小城市时,我发现没有地铁的日子是多么的不方便。
随着科技的发展,地铁越来越普及,几乎中国一二线城市都有自己的地铁。房价、商铺的数据信息都与地铁线路以及地铁站都有很大的关联,所以地铁线路图越来越重要。
根据外媒Curbed的数据,上海和北京是地铁系统增长规模最大的两个城市,有着庞大、覆盖密度极高的地铁网,年客运量分别为20亿和18.4亿,与之对比,纽约的年客运量仅为16亿。
这是公共交通狂人和设计师皮特·多瓦克(Peter Dovak)再次带来的惊艳作品,这一次他将中国30年的地铁发展视觉化。90年代之前,中国只有北京、香港和天津拥有地铁,三个城市分别在1969年、1979年和1984年运营了第一条地铁线路,其中天津的第一条地铁现已拆除重建,这一细节也在多瓦克的图中体现出来。
地铁多了,交通便利了,房子也就自然贵了。
那到底怎么用python看出每条线路附近的房价是多少呢?本篇文章以深圳地铁为例,学会之后任何城市都是小菜一碟。
1.地铁线路的绘制
要想获得地铁线路数据信息,可以使用前面介绍的数据拾取工具。先从网上下载相应的地铁线路图片,然后使用数据拾取工具拾取数据。需要拾取两个方面的数据:
- 地铁站的坐标位置信息
- 地铁线路的位置信息
实际地铁线路图的数据,可以先从网上下载各个地铁站的名称以及对应的站号,在使用python语言根据地铁站名,在高德地图自动查找对应的地理经纬坐标(long, lat),使用R包ggmap的get_map()函数获取深圳市(shenzhen)的地图,再使用包ggplot2的geom_point()和geom_path()两个函数绘制地铁线路和地铁站。
现在世界各地的地铁图都是根据1932年伦敦地铁图设计的。这张标志性的伦敦地铁图由工程师Harry Beck 设计,除了每条线路一个颜色,设计重点在于全图只有90度和45度角,均衡各站点距离,以便查找使用。该图放弃了和实际地理位置的准确对应,而只是大致反映。
地铁线路图的数据信息可以通过GetData和Excel插件EasyCharts等数据拾取功能从网络上下载的深圳市地铁线路图-图片拾取数据信息,包括地铁线路和地铁站绘图坐标(x, y),可以在R中分别使用包ggplot2的geom_point()和geom_path()两个函数绘制地铁线路和地铁站。
2. 房价数据的爬取
1. 链家网一般提供了每套出售的二手房信息。我们可以在链家网使用python爬虫,爬取两个关键的信息:房楼名称和每平米单价。
2. 在使用爬虫,根据房楼名称,在高德地图中爬取获得房楼具体的经纬坐标信息(long, lat)。然后就可以将房楼以散点图的形式绘制在深圳地图上。
3. 深圳市地铁房价分布图
根据地铁站地理坐标(lat, long),获得附近方圆3km内所知的房楼每平米的价格,然后求取均值,即作为该地铁站的二手房均价数值(平方米)。
使用R包ggplot2的geom_point()函数绘制地铁站坐标(x,y),并将圆圈大小size映射到房价均值。
相关文章
-
出去千万别说UI和美工是一个职业,千万别暴露你的缺点哦
文章来源:老铁商城2019-10-31 -
我优化多年的 C 语言竟然被 80行Haskell 打败了?
文章来源:老铁商城2019-10-20 -
当程序员遇到中秋节,会产生怎样的化学反应......
文章来源:老铁商城2019-09-18 -
淘宝、京东这些网站的哪个部分用了web前端技术?你能学会吗?
文章来源:老铁商城2019-09-18 -
Linux和哪些行业有关?2019Linux运维必备哪些技能?
文章来源:老铁商城2019-09-18 -
公认最具影响力的4种编程语言!平均薪资20K,Java第一
文章来源:老铁商城2019-09-18 -
PYPL 9 月编程排行榜:Python第一,继续称霸!就业薪资怎么样?
文章来源:老铁商城2019-09-18