媒体人用大数据研究城市:怎样的城市让年轻人幸福

17.04.2016  07:11

  

  东方网4月17日消息:媒体人、作家王欣(笔名“反裤衩阵地”)撰文比较什么样的城市更适宜单身人士居住。他的答案是上海——从静安到张江,从浦西到浦东,只有两三张桌子的酒吧、咖啡馆、小饭店,24小时营业的便利店、小吃摊转角便有一个。人人都习惯适度的距离,不必非得亲密同行,一个人下楼,喝一杯酒、吃一碗馄饨,或者要一杯热咖啡看看杂志,说不说话都没关系。出门稍微走一走,总有一个像样的小酒吧,能喝一杯得体的oldfashion,或者有一家看起来油渍麻花的小饭馆,要一碟炸猪排、一碗葱油面,喝得心花怒放,吃得欢天喜地,又回去继续写作。我是一个人,但在上海这样自给自足的生活,我可以一整天不说话,却也不会觉得寂寞。

  这是凭自己的经历和感觉,看法既有代表性,又是属于个人的。

  一个城市是否宜居,便利店真有加分作用。记者有两三位经常出差的朋友,他们坚持认为北京没有便利店,不方便(其实有不少,人的固有印象很难改变)。而假如问起久居在上海的白领为何喜欢这座城市,步行5分钟范围内总找得到一家便利店会是不少人的回答。

  理性严谨的数据出来说话了。数据既支持王欣的感受,又不完全支持。全国城市中,上海拥有的便利店和超市总数最多,但上海的人多,按常住人口一平均,上海只能排到第20名。上海餐厅的数量,人均拥有量排在第13位。这两个排名得第一的,分别是你想也想不到的——大连和三亚。

  再说到咖啡馆,把爱评网和大众点评上的数据统计起来,台北拥有3271家咖啡馆,上海5296家。但上海市建成区面积远大于台北的面积271平方公里,多达好几倍,所以,尽管上海已经遍地咖啡馆,密度还是远逊于台北。再算算人均,上海每万人拥有2.18家咖啡馆,台北是12.1家,接近上海的6倍。

  对一个城市的感性认识,可以用很多维度的数据来理性验证。以上数据,是一个昵称“新一酱”的小团队做的。大数据这座巨大的金库,她们在研究其中一种打开方式。

   6个女生给城市分级

  “新一酱”的“”,跟当前最红的网红“Papi 酱”相同,来源于日语,表示亲昵的后缀称呼,女子专用。“新一”是“新一线城市研究所”的简称。说是研究所,其实是一份杂志内的一个报道小组。

  2013年,《第一财经周刊》想从擅长的商业报道领域做一些数据分析。当时数据还是手工采集,人也是临时抽调组成的松散型团队。2013年底,周刊从商业魅力角度——依据大公司对不同城市的关注度,对400个城市(包括除传统一线城市之外的300个地级及以上城市,100个百强县)进行详尽调查,做出了分级和排名,评选出成都、杭州、南京、武汉、天津、西安、重庆、青岛、沈阳、长沙、大连、厦门、无锡、福州、济南为15个“新一线城市”。

  报道小组认为,改革开放30多年之后,中国城市的发展正在冲破行政级别的枷锁,更加贴近现代意义上的由商业驱动的都市。依据工商业繁荣程度对城市进行分级已经成为可能,而且必要性也越来越迫切。

  做完这组报道,几位年轻媒体人对城市大数据的兴趣一发不可收。2015年,阿里巴巴投资第一财经,商业数据挖掘这块算是对上路了。

  2015年4月,《哪个城市让你感到幸福》专题的制作过程中,新一酱的班底基本成型。7月,正式成立新一线城市研究所。研究所共6位全职采编人员,包括主编沈从乐,2名记者,1名编辑,1名美编,1名市场经理。全是女生,大多为90后。

  她们用数据新闻的方式,探索和分析中国城市的商业魅力,生活方式的发展与变迁。她们玩起了各种各样的分级、分类,衣食住行游购娱,“为什么南京没有外资便利店”、“第一家诚品书店为什么开在苏州”,新鲜视角层出不穷。

  什么叫新一线城市,是一个生造的新概念,把原来定位为二线的城市提拔上来?并非如此,新一酱的目标是“寻找下个一线城市”,名单并不固定,“北上广深”也应有危机感,不进则退。

   挖数据就是挖宝

  新一酱的观点是,城市的未来取决于对年轻人的吸引力。要了解每个城市中的年轻人都在想些什么,或者对什么感到兴奋,并不困难。他们是离不开网络和手机的一代,也将大部分生活的足迹都留在了网络。

  数据怎么挖呢,一个来源是各大互联网公司。主流互联网公司在新一线城市的渗透已经足够高,它们的大数据能够为城市青年的生活状态描绘出一个大致精确的画像。在《哪个城市让你感到幸福》专题中,取用了京东、大众点评、支付宝、优酷、去哪儿、滴滴打车、微信电影票、知乎、领英的数据。这些公司的头儿差不多都到乌镇参加了世界互联网大会,别的场合也经常能凑一堆。但是,他们各自把数据拿出来合成一体,没什么由头。这事由媒体来做,比较好办。

  从阿里系拿数据相对容易一些,自家人嘛。不过,媒体的立场应该不偏不倚,按选题需要来,BAT的数据可以同时存在于一个图表中。新一酱说,互联网公司是愿意做数据共享的,乐意与媒体合作。记者把需求交给他们,他们专门去把这部分数据跑出来。

  这种方式有一定的缺点,可控性比较弱。你认为A公司有这项数据,A公司也同意给,可最后拿到的数据不一定符合要求,时间也不好控制。不少公司把数据视为核心竞争力,不能毫无保留地拿出来。上市公司的话,还会被财务部门阻止。

  要可控性强就自己动手,用技术手段去抓取。为此,文科出身的几位记者编辑都学会了写代码。一开始是一个姑娘会一点,她边自学边教大家,半年后,6个妹子都成了编程小能手,实习生也概莫能外。

  抓取的都是公开信息,从网站的前端获取。当然,即使是公开信息,零散的单独的一条两条没什么,把成千上万条搜罗到一起,分析出规律来,就不一样了,有的会有点敏感。可是,新闻要的不就是发现力么?新一酱添置了一个可靠的亲密伙伴,一台32G内存的大电脑,连日连夜跑数据。近期做的房价、高铁专题,每个都用到了10万条以上的数据。假如人工一条一条去摘录,理论上也是能够做到的,花上十天半月。

  自己抓取也有缺点,毕竟是外人,不知道人家有讲究。主动寻求合作的企业还挺多的,会不会有猫腻?新一酱认为,大数据要伪造非常难。

  整个项目是研究城市的发展,数据的积累非常重要。所以,合作者多多益善。至于选题,坚持独立,不受干扰。

  数据有了,新一酱又自己研究数据库和算法,也向研究学者讨教,从数据中挖宝。

   量化的信心

  为什么要研究城市?哈佛大学教授爱德华·格莱泽在《城市的胜利》一书中指出,尽管城市面临这样那样的问题,但它的吸引力正变得越来越大,在一个城市人口占比较高的国家,居民更容易感受到快乐。假如从创新的角度去思考,就会理解这种快乐——一种对文明的向往。

  城市是创新的发动机,城市是否幸福,决定了这座城市的未来命运,也关系着国家的未来命运。

  街角咖啡馆的多寡,知乎用户的活跃度,电影票房的高低,餐饮品种的丰富度,交通系统的效率,都是城市幸福与否的一部分。不必为个人的体感争论,也不用考量去过多少个城市的人才有发言权,大数据提供了量化比较的可操作性。

  新一酱先列出五个维度,五个维度获得均衡发展的城市,才能够让年轻人感到幸福:

  首先它要能够提供足够多样的选择,让年轻人可以自由地选择生活方式。它也需要是一座开放的城市,以便满足好奇心强烈的年轻人挖掘自我更多的可能性。效率和信息对称则更能促进创新,也将年轻人从琐碎的事务中解放出来,把精力更多集中到所热爱的事情上。便利度会吸引更多的年轻人聚集在一起,而良好的生活方式则会阻止城市老去。

  大公司是重塑城市的主体。人均收入、教育资源、大公司和大品牌的选择等多项更具现代商业意义的指标,意味着大公司和公司人选择把自己的未来投资到某个地方,都是建立在对未来的信心之上,外国领事馆数量、国际航线开通数量等等,在某种程度上也是一种可以量化的信心。

  根据这些指标,新一酱排出了中国120个城市针对年轻人生活的幸福榜。从计算结果看,北上广深的一线城市地位并未被撼动,而紧随其后的成都、苏州、杭州、宁波、武汉、厦门、青岛、天津、西安、沈阳、昆明、东莞、大连、南京、无锡和福州成为了年轻人幸福感“新一线”城市。

  其他城市也各有长处。比如“生活的多样性”这个指标,参考“生物的多样性”而来。就说吃吧,大众点评上把餐饮分成68个菜系,新一酱归并为20多个,看这些菜系在各个城市的分布,发现最丰富的不是一线城市。新一酱觉得,这结果蛮符合认知的。谁不说一线城市节奏太快压力太大,中小城市更适合生活?

   发现新增长极

  一个选题的数据跑出来之后,往往能抓出比原来设想更有意思的点。新一酱有了很多意料之外、情理之中的新发现。

  “白色情人节”做了一个关于快递包裹运费的选题,打的名义是,情人节送礼物嘛。结果发现,从价格看,安徽也许可以纳入苏浙沪包邮区,此外全国还有若干个区域内包邮的幸福“小区”。快递的运费,取决于快递业发达程度、城市间联系紧密度等因素,距离不是第一位的。能包邮,意味着这些城市购买力强、与其他城市经济联系密切,新包邮区的经济增长潜力不容小觑。

  长沙不愧为娱乐之城,文化创意产业产值高速增长。年轻电视人才涌入,文化创意产业占GDP比重8.88%,高端酒店品牌也迅速进入。

  最“黑马”的是成都,被新一酱评为“新一线城市NO.1”。同为西南大城市,成都的GDP不如重庆高,重庆是直辖市而成都是省会城市,但各种排名中,成都的名次大多高于重庆好几位。在新一线城市中,成都最适合创业,国际航线数量第一,在公司人眼里是最有吸引力、生活最便利的城市。

  更多的黑马藏在二线、三线、四线城市。这两年,马云、刘强东老喊着电商下乡,在县城直至乡村投入了大量人力物力,布点、建物流、手把手教村民上网购物。他们早就看到了,一线、二线城市的市场基本饱和,新的增长点在三四线城市和农村。听上去比较“洋气”的海淘,新一酱拿来跨境电商的数据一比较,三线城市用户购买力甚至高过一线城市平均值。她们分析,三四线城市居民能够接触海淘的,应该是其中最有实力的人群,他们很难从实体店买到多元、与潮流同步的商品,购物的渠道相对集中;而大城市居民选择多、用户分散,平均下来,数字反而低了。

  排一排大数据,收获的是城市大发现,中国经济新的增长极隐约可见。

   记者手记

  多一点挖宝者

  因为自己也尝试过做类似(但远远不能跟她们比)的城市数据新闻,所以对新一酱的做法比较有感觉。

  大数据城市研究的价值,毋庸赘言了。很多机构在研究大数据下的城市。BAT中,淘宝/天猫最喜欢分享他们为各种维度的消费者画的像,星座、性别、年龄,最常用的维度是地域。“上海的男人最疼老婆”啦,“北京爷们的朋友最多”啦,类似这样子。

  相比大公司和专业科研机构,新一酱的数据来源和研究方法、理论储备、图表制作,都不完善。不过,她们有自己的优势,最大的优势是,能够在一定程度上打通各个来源的数据。

  传统咨询公司更多依靠抽样统计和经验的方法来帮助商业品牌做相关决策。到了大数据时代,用户行为分析能够带来更精准的分析。但互联网大数据分散在各家互联网公司,真正能够挖掘出来,转化成商业价值,目前还没有成熟的模式。

  为城市管理者、城市开拓者和城市人提供丰富有趣、有价值的数据内容和数据服务,新一酱自称“野心不小”。

  这份“野心”,记者倒希望不仅这6个妹子有。精准助推经济增长和生活幸福,大数据中挖宝的层次,目前还浅得不能再浅呢!