xml地图|网站地图|网站标签 [设为首页] [加入收藏]

人工智能新突破,如何用AI提高全国调研的效率

来源:http://www.ruibiaowang.com 作者:基础资源服务 人气:189 发布时间:2019-11-07
摘要:人工智能算法(Artificial IntelligenceAlgorithms)能让无人汽车主动识别道路指示牌、行人车辆、道路标线等视觉信息,使用这些信息自动行驶。不过我们换个角度,如果汽车是被识别的对象

人工智能算法(Artificial Intelligence Algorithms)能让无人汽车主动识别道路指示牌、行人车辆、道路标线等视觉信息,使用这些信息自动行驶。不过我们换个角度,如果汽车是被识别的对象,会得到什么有趣的结果呢?

谷歌街景(Google Street View)让你坐在家里就能漫步于城市,拍摄用的街景车差不多是一个头顶安装了360度相机的汽车。有些人用谷歌街景旅行,有人用它规划假期路线,有人做了“猜街景”的游戏。而斯坦福的AI工程师则尝试用它预测美国的投票情况。

在新近发展的人工智能技术的帮助下,研究人员能够分析大量的图像、提取可以进行排序和挖掘的数据来预测一些事情,比如某个社区的收入水平、政治倾向、购物习惯等。

图片 1Google 街景车,图片来源:Pixabay

图片 2

美国人拥有私家车的比例很高,除了可以用来判断主人的富裕情况外,汽车也能判断一个人的政治观点和投票倾向。比如,买轿车的人倾向于投票给民主党,而买皮卡的人倾向于投票给共和党。

据了解,来自斯坦福大学的研究人员们完成了一个雄心勃勃的项目——通过分析谷歌街景(Google Street View)上收集到的数百万张照片,可以对社区投票模式作出准确的预测。这一迹象表明,计算机能够像文本分析一样流利地进行图像分析。

街景车理所当然得能拍到许多道路上的汽车,要是和上面的常识结合,是不是能预测一个城市或者一个镇子的投票倾向呢?比如,按照上面的例子推演,如果一个镇子的轿车比皮卡多,那这里的人给民主党投票的概率会很高,反过来得到另一种结论,逻辑简单清楚。

虽然其他学术项目早已开始使用人工智能挖掘谷歌街景来获取社会创见的见解,如街道变化,但是此项目值得注意是因为在整个过程中,AI软件处理了大量图像。

图片 3谷歌街景:旧金山居民区,图片版权:谷歌街景

在斯坦福大学计算机视觉科学家Timnit Gebru的带领下,研究人员使用软件分析了近五千万幅街景和位置数据的图像。他们的目标是找到可用于预测邮政编码和分区(通常包含大约1000人)水平的人口统计数据。

具体如何操作呢?以下是这个实验的菜谱:

图片 4

  1. 准备15,000 张不同车型不同角度的照片,人工分类和标注制造商、车型、生产日期、驾车人的投票倾向;
  2. 准备谷歌街景的照片,200 个不同城市,共50,000,000 张;
  3. 让AI算法自动将街景照片对应到已经分类好的车型上,这个算法的原理和无人汽车识别道路指示牌的原理是一样的;
  4. 统计识别出来的车型数据,对应到不同的城市,得出结果。

从这些图像中,他们能够搜集到大约2200万辆汽车(占全国所有汽车的8%),3000个邮政编码和39000个投票区的信息。研究人员将这些数据与包括人口普查局的美国社区调查和总统选举投票记录在内的其他资料交叉引用后发现,他们能够准确预测邻里的收入,种族,教育以及投票模式。

我们看到这样的方法将本来只能用于个体的知识,扩展(Scaling)到更大范围的群体。

为了让他们的人工智能算法准确地对汽车进行分类,研究人员通过招募来自Mechanical Turk等地方的数百人以及汽车专家来对其进行训练,以识别出数百万张图片中的汽车。最终,他们的软件能够在短短两周内对5000万张图片中的汽车进行分类。《纽约时报》称如果是人类完成这项任务的话,至少需要15年的时间。

如何判断这种方法的效果呢?因为从来没有先前的经验,所以只能跟以前的数据比较,找出相关性。美国有个专门的机构,名叫美国社区调查(American Community Survey, ACS),会对这样的问题做全国调研。通过对比ACS的调查数据和总统选举投票的情况,新方法和老的统计数据有强相关性,这间接证明了新方法的有效性。

图片 5

那是否能用新方法替代老方法呢?

在《美国国家科学院院刊》上发表的一篇文章中,研究小组写道,他们的技术可以作为美国社区调查的补充,这项调查每年的花费都要超过2.5亿美元。由于调查也是劳动密集型的,调查员需要挨家挨户地进行调查,这意味着人口少于6.5万的小地区往往会被忽视。随着技术进步,人口统计数据最终可能会实时更新。但研究人员指出,政策制定者需要小心确保数据只在社区层面收集,以保护个人隐私。

现有的人口调查方法有两个问题:

【编辑推荐】

  1. 需要花高昂的成本,比如美国社区调查这样的项目,每年要花掉2.5亿美金,还需要大量工作人员登门走访;
  2. 获得结果的周期很长,有时甚至需要几年的时间(大多数时间用在路上了吧,我猜),所以呢,调查完了,社会状况也已经改变了。

新的方法是否能弥补这些问题呢?

  1. 新方法直接使用网上公开的数据,谷歌街景是免费的,AI算法也有现成的,这篇论文也能免费下载到;
  2. 人工标注那些汽车可能比较花时间,但标注完可以重复利用,也不会要几个月的时间才能完成这个任务。人工智能算法可以说是秒出结果,而且即便搞错了,重来的成本也很低;

还有其他因素需要考虑么?有的。

走访调查不能排除掉个人偏见导致的统计偏差。比如被调查者不愿公开自己的情况或者说谎;调查者无法到治安差的地方做登门调查。这些因素应该被考虑进去。但是仔细想想,即便考虑到这些问题,如何测量,如何量化呢?本来就没办法统计到,必然也没办法放到统计公式里面计算。而且这类问题是所有问卷调查共有的,并不只是人口统计才会遇到。很多网络调查已经从问卷调查转变成监控用户行为了,当然这种方法应该获得用户同意。

但新方法也有明显的缺点。单单依靠一个人开什么车就判断它的政治倾向也太武断了吧!因为这样的原因,新方法不应该直接替代旧方法,不过它有继续挖掘的潜力。

虽然论文的正式发表时间是2017年11月28日,但是作者早在2017年2月就将预印本发表在网上了,所以还有两个疑问等待解答:

  1. 是否已经有政府部门考虑使用这一技术了?效果如何呢?
  2. 是否有类似的技术被开发出来呢?

本文作者将关注接下来的发展。(编辑:Steed)

参考文献

  1. An artificial intelligence algorithm developed by Stanford researchers can determine a neighborhood’s political leanings by its cars, Stanford News
  2. Geo Guessr, 猜街景游戏
  3. Using deep learning and Google Street View to estimate the demographic makeup of neighborhoods across the United States, Timnit Gebru, doi: 10.1073/pnas.1700035114

本文由澳门新葡萄京娱乐网站发布于基础资源服务,转载请注明出处:人工智能新突破,如何用AI提高全国调研的效率

关键词:

最火资讯