我们编了概念,叫“城市影像研究”

第一次写知乎的专栏,还是自己厚着脸皮开的。

想来写什么比较好呢?考虑到很多人问我们几个人到底想做什么,于是在开篇就介绍一下关于这个问题我那算不上答案的思考吧。我们想做基于“城市影像研究”的东西,有产品、有咨询、有技术服务输出。我们在尝试,有侧重,但离不开这个概念。

我们是一个来自于MIT和Harvard的小团队。大家的专业背景各不相同,又各有侧重。有计算机人工智能领域、地理信息系统、城市规划(现在叫城乡规划)、以及建筑学等多重不同背景的人在一起。这种“跨界”的融合,不仅在团队的组成上,关注到个人层面,这种融合亦非常明显:搞设计的在写前端,搞GIS的在train CNN,做城市设计的在data mining。尽管我们每个人都有自身的能力边界,但没有囿于所谓的“学科边界”。

从Startup的角度考虑,我们团队自身的强处在于LBS数据和人工智能图像分析的两大领域,而当两者结合在一起时,方为我们最独特的优势。自2013年我与博磊初次合作开始,我们就模模糊糊的在这个另辟的道路中摸索起来。期间经历了C-IMAGE, 城市街景风貌研究,以及StreeTalk的城市感知研究,包括一直到现在思考全新产品的研发,一路上我们始终在坚持做自己认为有意义、有价值的工作。有生之年干一些牛X的事情,是我们当前不变的追求。

这个时代普遍在强调“跨界合作”的重要性,而所谓的跨界其实分两种:其一为将不同专业领领域的专家撮合在一起组成团队,其二为团队成员自身具有多方面的知识技能,各有侧重互补。前者的合作模式较为传统,而后者则是依托这个信息时代的便利方才促成的合作形式。正因如此,团队之间合作沟通也才会更为顺畅,idea也更容易从各类角度迸发。说句题外话,我并不care“领域”这个概念,过去人们之所以强调专业领域,本质上是局限于寿命、时间的短暂,而如今我们的人均寿命提高了不少,甚至现在的八零后估计连退休都要迟个5-10年吧?外加信息知识的爆炸,让每个人生命的浓度得到了极大的提升可能性。身边的很多朋友表达了对于码农的羡慕,其实coding这种东西应该算是最开放的知识技能了,琳琅满目的open course充斥在我们周围,可以丰盈每一个想要改变的人。所以,“领域”的作用可能并不是让自己更好的专注于某件事,而很可能是影响和缩窄自己的格局的假想枷锁。

城市影像大数据就是我们团队今日今时在思考、求索的重点。这或许也是基于我之前的一大堆关于大数据的杂七杂八的工作加以总结得出的一个小总结吧。

提起“大数据”,在我看来主要可以分为三大类型。

1) 分布类信息

该类数据主要指独立的个体信息数据,即指在特定时空内某一客观特征基于大量样本采集之后呈现的空间分布,且研究对象可人可物。分布信息是开展城市研究的基础,为后两种信息的发展奠定了基础,并提供对照。分布类型数据是大数据之于城市研究的基础。签到信息、手机信令、公交卡数据、出租车轨迹数据、TD数据。

比如这VIIRS,包括橡树岭实验室出名的landscan都是不错的位图数据源。显然这也属于分布类数据,可在一定程度上显现各类空间地域的尺度规模等。

又比如POI的信息,以前可以用某宝来购买,之后又有童鞋直接po抓取工具包。总之,这类数据均为非常直接的分布类数据。

亦或者较为复杂一些的房价数据,比如之前曾经抓取过的安居客的房源信息数据。可以包含各类楼盘的价位、年代、以及相关的物业信息等等。

2) 迁移类信息

而当分布信息加入时间维度后,即转而变为迁移信息。尽管称作“迁移”,但该信息并不特指人。理论上,凡是分布信息均可增设时间维度,地产价格的演变等也属于该范畴。迁移信息的作用通常是反映城市空间联系度。该类研究在目前来看最具有市场价值与普及使用价值。遥感信息、地产信息、轨迹分布、签到信息、各类地图poi信息等。

迁移类信息的case就很多了。比如学界经常提及的时空行为数据研究,而在城市监理方面比较突出的有基于LBS的城市实时监控,再有甚者就是用过时空行为所限定出来的用户画像,因为抽取的用户画像具有极高的商业价值。之前的一些工作在这几个方面均有涉及,比如利用微博的联系度观察城市空间的地区的结构、又比如通过LBS数据去限定特定人群的行为特性等。

比如上面的两张早在“远古时期”鄙人利用微博签到数据获得的城市流动网络数据。无论是左边的南京江北新区还是右侧的长沙市,这类关联网络对于城市空间联系紧密程度具有一定程度的指导作用。

又比如这图。这张我放过很多次,不过几乎没有解释过它具体是啥,今天就多说两句吧。此图是我2013年7月在纽约大都会交通运输署用Processing绘制的。图中的数据是纽约公共交通每天800万刷卡记录(AFC MetroCard)累积一年的数据(总量大约在24亿)。不过此图我应该是随机抽样了一把再计算的,原始数据量估计Procssing是吃不消的(具体抽样多少我还真忘记了,人老了看来)。底下的横坐标代表不同的车站,而上面的连线则代表着不同的车站间乘客的进出数量。不同颜色的线呢,则表示不同的交通卡种类(单次卡、月卡、周卡、学生卡、老人卡等)。不难发现左边那个半圆比较浓密,右边有个小半圆。这是因为左边那个半圆下面覆盖的区域是地铁站点,而右边那个则是公交车,可见两者之间的换乘情况远不及地铁内解决交通来的方便。而曼哈顿比较有意思的一点在于,本岛大部分的地铁线路基本是南北向连接,而比较窄的东西方向连接基本靠地面公交,多数情况下大量的连接都是首先从某个 street 往南或者往北去往另一个street,然后出站后再走一两条 avenue 到达目的地,不过事实上在曼哈顿横跨几条大道其实是需要一定体力的。其实上图也可以放大看,顺带提一句,纽约的这类数据其实都是开放的。

【城室科技】Boston Taxi (波士顿出租流动)—在线播放—优酷网,视频高清在线观看 http://v.youku.com/v_show/id_XMjUyNDQyNjU3Mg==.html#paction

又比如“上古时期”和博磊参加的一个波士顿出租车流动数据可视化的竞赛中,我们采用了再当时还非常先进的D3完成的可视化作品。

3) 评价类信息

接下来才是真正的重点。在分布信息中,将客观信息替换为主观评价类信息,该信息则转变为大评价信息。它与大分布信息的区别在于以人为本的出发点,反映了个人对于城市空间的认知与感受。考虑到不同的个体对于城市客体会产生主观的价值判断,因此这类信息的复杂度最高,但同时挖掘潜力也最大。点评打分信息、语义评价信息、城市视觉意象信息分析。

上面这张图可能是我开始搞城市影像研究这等孽缘的开端。2013年当我还年少无知的时候抱着一堆抓取的Panoramio数据期望可以靠他们完成毕业论文的时候,却遭到赵锦华老师的“无情打击”(其实后来还是非常感谢他的激励)。他当时跟我说你这些数据都是图片,最好必须要知道图片的内容才能更有价值。于是我卯足干劲去倒腾才发现当时的自己要想干成图像识别简直是痴人说梦。直到后来经历了3次辗转介绍,我才认识了今天的合伙人博磊童鞋。于是在那时候开始我俩采购了一台组装机作为两人的工作站,我负责挖数据,他负责处理识别并输出给我用以后面的地理位置分析。长这么大第一次和码农一起通过写代码的方式合作,还是一个挺不错的经历。当时还是天真无知的我随口问了句,“这个识别的能力叫啥?” “叫深度学习”,“我去,这名气也忒土了吧。。。”我心想,然后很快就不记得这货了。直到2015年我开始慢慢又从博磊那里求指导的自己开始训练模型跑神经网络开始,我才慢慢了解CNN这些个玩意儿。再后来,当初只凭个人兴趣喜好学习的这一领域摇身成为了最为火爆的行业,也换了个口号:人工智能。(尽管这并非真正的人工智能,我们离人工智能还早呢,这个话题下回另说)

关于这个新城市意象的内容,具体可以看这两篇Paper:

Liu, L., Zhou, B., Zhao, J., & Ryan, B. D. (2016). C-IMAGE: city cognitive mapping through geo-tagged photos. GeoJournal, 81(6), 817-861.

ZHOU B, LIU L, OLIVA A et al. Recognizing City Identity via Attribute Analysis of Geo-tagged Images[G]//Computer Vision–ECCV 2014. Springer, 2014: 519–534.

还有一篇不成文的我自己放在了网上,哪位好心编辑乐于认领可烦劳告知一声:)

新城市意象 – 城室 | CITORY

当然评价类信息也不都需要人工智能,除了语义分析和图像分析,还有一种最简单的基于打分的评价类信息,比如用大众点评的评价后POI来做研究。上面这张图的我的文章还没正式po,就放着看看罢了,有机会再聊。

OK,扯这么多,其实我最想说的是,这三类信息的价值是不一样的,我们来比一比。

话说,能看到这里的都是好童鞋啊~~~所以下面要说的点才是我最在意的point,尽管很简单。

还记得左边三个小图案分别是什么类型么?从上到下依次是分布类信息、迁移类信息、以及评价类信息。

从获取难度来讲,分布与评价信息的获取门槛均不高,起码有不少开放数据。而迁移类数据因为涉及到用户隐私以及巨头的独占问题,导致除非与BAT,或者运营商的合作,否则连练手接触的机会都不会很多。

从实用角度来看呢,分布类信息几乎没有很多价值,因为它就描述了一个静态的分布。而迁移类信息在今天是当红辣子鸡。用迁移分析流、再从流转换到势能、到联系紧密度,再到空间聚类。。。一些列的方法论大军正扑面而来。但其实评价类信息的价值也非常高,只以为四个字“以人为本”。另外多说一句,并不是说搞图像研究、街景识别都是评价类信息研究,比如之前的用街景寻找街边摊的case,其实是一个分布信息研究,但之后做的名为StreeTalk的城市感知地图,则是评价类信息研究,因为每一个打分其实都试图反映人与空间的感知关系。

重点是,评价类信息往往捉摸不定,而且分析困难,因为这类信息大量的都是文字与图像信息,属于最难理解与被定量化研究的部分。但所幸这一波人工智能浪潮的核心技术CNN这种高位特征抽取效果非常好的网络可以很有效的理解人的部分高阶脑活动(视觉、语言)。换言之,评价类信息高高在上的门槛正在被逐步瓦解!

所以我的判断是,在迁移类信息发展到一定成熟阶段之后,也该是评价类信息出风头的时候了:)这也是为何我们选择城市影响大数据作为我们核心工作内容的深层原因。(终于给我兜回来点题了。。。)

最后借朋友拍的一张图,自己给自己喝碗鸡汤。不知不觉都快早上8点了。。。睡觉去也。。。

来源:知乎 www.zhihu.com

作者:刘浏

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载