洞察
上周,TechCruch 拿到了一个中国智能城市项目的数据库,原文在这里。透过这个数据库,可以一窥当下智能城市光鲜的宣传语背后,隐藏了哪些不可告人的秘密。
这个数据库首先是安全研究员 John Wethington 在公网上发现,然后他将数据库信息交给了 TechCrunch(以下简称为 TC)的记者。
TechCrunch 发现,该数据库托管在阿里云平台,数据量巨大,而且还有近几个月的人脸识别信息。当记者向阿里云求证时,阿里云给出了三个明确的回答:其一,该数据库并非阿里云的城市大脑项目;其二,阿里云拒绝透露该数据库的所有者,但已经通知了相关利益方;其三,阿里云无权访问客户数据库里的内容。
阿里云的回应并没有问题,作为公共云服务商,不碰客户数据也是第一准则,而此事值得关注的地方也并非该数据库归谁所有,而是就像 TC 记者所言:这给了我们一个观察所谓智能城市运作的好机会。
首先,关于面部数据的采集与处理。这个泄露的数据库主要监测北京东三环附近的两个住宅小区,这也可以部分说明,该数据库并非是一个用于商场的监控系统。
该数据库通过多个数据采集点形成采集网络,采集点都配有面部识别的监控摄像头。
这些摄像头收集的面部数据非常细致,比如一个人的面部表情(微笑还是其他)、是否有胡子、是否佩戴太阳镜或口罩、嘴巴是否张开等等,甚至还会标记这个人的大致年龄与民族成分。
其次,面部识别数据与警方记录的联动。TC 也发现,该数据库会从警方那里获取数据,利用警方的数据来匹配实时的面部识别数据,TC 也通过这点指出,这个数据库的真正客户是政府。
而在具体操作层面,每当面部识别系统检测到人时,数据库会自动开始「记录」,包括具体的时间、位置以及相应的注释,注释主要为了指出这些识别对象的身份。不过在下面这个截图里,「VillageName」字段里的「怒晴湘西」,我并没有在北京找到这个小区,我还用「怒晴」、「湘西」等关键词搜索,也未找到相关信息。
我推断有两种可能:其一,这个字段用了代号进行加密,尤其是「湘西」指代的可能是一个具体小区;其二,这个数据库并非生产环境的数据库,可能是一个测试数据库,里面混淆了诸多不同地区的数据,但我也未在全国其他地方找到名叫「怒晴」、「湘西」的小区,因此第一种可能性比较大。
撇开该数据库里的这个疑问,我们已经可以相对清晰地勾勒出一副智能城市里的监控图景:你的一举一动、面部表情与面部遮挡都在被记录,并实时匹配来自警方的数据,及时发现所谓「坏人」,保护「好人」的「安全」。
类似的场景,BBC 记者 John Sudworth 两年前体验贵阳的监控摄像头后感叹,借助布满整个城市的摄像头以及背后强大、实时的数据分析能力,生活在这个城市的人已经无处可藏,视频链接在这里。
然而在数据,尤其是面部数据收集、处理的过程里,谁来确保数据不泄露?谁来定义数据的使用权限?谁来制定面部识别里的偏见?所有这些疑问都不会有答案。(完)
视野
苹果
Bloomberg 爆料了 iOS 13 可能更新的内容,包括新 App 以及 iPad 的全新桌面,消息非常可靠。
库克接受 CNBC 采访。
微软
微软年度开发者大会 Build 正式开幕,这篇来自VB的总结很详细。
Wired 一篇长文,介绍了纳德拉时代的微软,涉及到微软对于 AI、开源的态度以及公司文化转变。
Bloomberg 专访微软云和 AI 副总裁 Scott Guthrie,谈及 Azure 与 AWS 的竞争以及 AI 的发展方向。
阿里巴巴
IDC 的数据显示,阿里云继续在 2018 年继续领跑中国公有云市场。
阿里巴巴正在重新评估印度电商市场,新战略或将关注垂直领域电商的投资。