电子科大周涛:半路出家的物理人怎么玩转大数据和AI | 上海市北·GMIS

百家 作者:大数据文摘 2019-07-24 04:25:19

大数据文摘出品

记者:时慧、毅航


上海市北·GMIS全球人工智能峰会在7月20日这天迎来了电子科技大学周涛教授。


本次讲座,周教授虽自谦理论物理出身、只是半路出家,但他用丰硕的项目成果和深入浅出的幽默语言,展示了大数据和AI如何推动治理和监管的革命。


基于街景的城市感知


如何利用街景来感知我们的城市,助力城市管理?


针对这个问题,周教授团队做了一个有趣的实验。实验选取2000张google街景图片,在网站上征集志愿者参与,判断两张照片里的街景哪个看起来更安全。


实验将采集的50多万个标注数据进行排序,再把得到的list给map到[0,1]的空间上,更高的分数表示更安全,从而得到训练集。训练好的系统可以对新的街景照片打分,判断安全程度。计算机打分的数据与真人打分进行比对,其有效性得到了验证。


接着实验进一步延伸,借助系统判断城市中的某一处街区在5至10年的发展变化,通过比较街区前后分数变化可以判断街区是否更美好了。由此,城市建设和管理水平得到有效评估。



通过对图片分析,还可以发现贫民窟。现实社会是,贫民窟的面积和范围比我们想象的还大,而且,政府也可以利用该系统评判自己花出去的改善民生的钱有没有用到实处,亦或只是赢得属下的马屁而沾沾自喜。


基于行为数据的金融监管


面对中小科技企业因没有抵押物而贷款难的问题,周教授团队开发了针对企业征信、信贷的产品——信易贷。


它的商业模型很简单,就是小微企业申请贷款,通过模型判断分数;之后政府贴息、并开放一些数据,比如税收,公积金等等;然后担保机构就进行担保征信,其他的资金方再来放钱。


信易贷的数据来源分四类。第一类是行为数据,举个例子,比如说一个企业可能会存在诉讼的问题,全中国有300多家地级别法院,周教授爬虫爬取法院历年来涉及诉讼的信息,通过查看企业是否有大量合同欺诈诉讼和仲裁案件,来评估借贷的风险性。


招聘信息也是企业行为数据的重要组成。作为一个互联网企业,可能多家招聘网站上都有招聘信息,招多少人,招什么职位,平均薪水如何,有没有公司的人已经在修改简历等等。这些数据虽然是公开的,但却很有用。如果推断出企业员工数在大幅度的萎缩,有人在离职,那么可以进一步评估出此企业信用等级较低。以上涉及到的是企业在发展过程中形成的大量行为数据,基于这些行为数据,实现针对中小科技企业的金融监管。


此外,企业投资关系网数据也值得探究,基于这些数据我们看出其中的异常关系。比如一个企业可能是A企业,全资控股B,B全资控制C,C全资控股D,D全资控股A。那A投了B之后,A再把其股东的股份转给B,如果有这样的关系他有什么样的好处呢?如果一个亿的现金正常给到B作为注册资本,B给C,然后C给D,但是D又给A,这样来回转,四家公司都有一个亿的注册资本,这样公司就可以申请很多资质,比如做集采,建筑,甚至做P2P的行业。如果有20个亿,在今天成立了一家公司,老百姓认为公司账户有20个亿,然后给公司投钱,受害的还是老百姓。这种公司可以在成都做一遍,然后又移到南京去,最后到上海。凡是有这种循环结构的,80%都有问题。



立体化的环境治理


周教授还用大数据人工智能的方法来做空天一体化的环境治理。



面对水域治理时有这样几个痛点问题:第一,无法对大水域做治理。比如四川省的水资源非常丰富,同时水资源丰富的地方往往经济落后。因为政府没有足够多的钱去安装足够多的监测站监测大水域。于是周教授想到利用遥感航拍,拍摄水域全景图,对水域管理情况进行打分。第二个问题是无法实时获得水域治理情况。当发现疑似问题,需要再用无人机确认一下第三,当出现大型的污染事件,比如一个河道中有大量的污染物,此时要立刻判断要不要向上游借水把污染物冲到下游城市,那么污染处就安全了。再考虑借多少水,因为成本高,需要实时知道污染物的情况,甚至进行扩散动力学分析。


周教授的项目涉及成都22个区市县,它的难点主要是去云,而不是机器学习。“我们过去发现这些泥沙的污染,黑臭水体等等,这个主要是用遥感”,周教授做了一个设备,“这个设备只有3公斤重,可以放无人船上,造价只有一点点钱,但是卖给政府非常非常贵,这个本来可以更便宜一点。”设备的灵感来自于遥感,现在大概5-10秒钟一个读数。

该设备可以超过国控站的误差水平。做环保治理的时候,可以拿着手持设备,10秒钟就获得读数。如果有一个移动设备,比如三公里河或者一个大湖,只要一艘船来回反复的开,就能知道每个排污口排的东西,过多长时间对下面的影响有多大。这个是以前绝对做不到的。


大气也是类似的,相较于水体稍微难一点,周教授用的方法是用出租车在北京、成都跑,通过安装设备,来避免原来站点的监测精度不够,它可以用机器学习的方式进一步的提高精度。或者是去找到城市的绿地、水面、建筑、人口密度、车辆密度,找到这些变量和污染的关系。精度大概是一千米乘一千米,进而知道污染情况。



下面展示成都某地的示例,城市管理者可以借此管理工业企业,能知道如果关闭了某一家企业,或者把用工时间从平常移到周末,或者白天移到晚上,会带来什么影响,这样就避免环保部的一刀切,实现精确可控。



在最后,周教授感慨道,以前讲监管,讲治理,本质上是一个人的行为,人的行为会带来很多误差,有的误差是中国的政治体制本身带来的,所以有一些话大家不敢说,不好说,老百姓的问题不好向上面反应,或者花了很多钱没有起到效果。但是现在随着一些技术突破,我们完全可以在50公分,甚至30公分的精度用遥感看城市,所以城市的发展企业行为,人的行为记录了大量的数据,使得观察和判断越来越准确化。所以周教授认为治理和监管将会有四方面特别大的变化,会变得自动化,规模化,定量化和客观化。



实习/全职编辑记者招聘ing

加入我们,亲身体验一家专业科技媒体采写的每个细节,在最有前景的行业,和一群遍布全球最优秀的人一起成长。坐标北京·清华东门,在大数据文摘主页对话页回复“招聘”了解详情。简历请直接发送至zz@bigdatadigest.cn


志愿者介绍

后台回复志愿者”加入我们


点「在看」的人都变好看了哦

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接