108:截止到 2017 年 9 月,他们所说的人工智能到底发展到哪里了?

2017 年已经过去了 9 个月,互联网领域围绕人工智能的讨论和炒作已开始步入理性化。不过必须看到,这种理性化的状态与曾经所谓人工智能寒冬还不一样,毕竟,此次人工智能领域的集体爆发,得力于硅谷互联网巨头对于深度学习算法的高度认可,由此引发了工业界、学术界的连锁反应。

这其中,云计算带来的普惠、随时可取的计算能力以及海量的数据训练资料,加速了基于深度学习的人工智能的快速普及,并在推陈出新的应用场景里体现出了深度学习的能力和局限性,逐步形成了一个良性的认知循环,使得越来越多的从业者对深度学习、机器智能有了更清醒的认识。

从人工智能的落地场景来说,分别在企业级市场和消费级市场不同的体现。

先来看企业级市场。过去十年,企业级 IT 市场变革的主旋律是上云,亚马逊 AWS 用了将近 10 年时间引导整个 IT 市场的购买者通过公有云服务实现 IT 转型乃至企业的数字化转型。AWS 的不懈努力也让其成为全球最大的公有云服务提供商,同时成为亚马逊旗下一块举足轻重的业务,下图展示了 AWS 三年来的强劲增长势头。

img

而以深度学习为代表的人工智能概念出现后,企业级市场的反应是相对滞后的。这并不难理解,深度学习目前最成熟的技术在用语音、图像识别和再处理,这些单点技术的突破可以在面向消费者的市场,比如语音助理的应用上,可以直接给消费者带来体验的改善,但对企业级市场而言,在面对纷繁复杂的业务架构、供应链体系以及 IT 体系的挑战下,这些炫酷的技术几乎没有用武之地。

华为 IT 产品线总裁郑叶来在被问及这个问题时感叹,如何将人工智能的单点技术应用到企业的复杂场景中是个挑战。事实上,自 2016 年开始,包括亚马逊、Google、微软都在其公有云产品里提供人工智能产品模块,或者准确地说,是基于机器学习的产品模块,比如在去年亚马逊的 Re:Invent 开发者大会上,亚马逊发布了一系列机器学习产品,包括图像识别、语音识别和聊天交互等应用场景。

img

上述这些公司的做法,都是将人工智能的竞争放在公有云市场的竞争环境中,这意味着企业级市场的人工智能之战,本质上还是云计算厂商的战争。而他们所谓的人工智能产品或服务,其实提供的是机器学习算法与云端计算能力封装之后的产品模块。换句话说,企业级市场的人工智能服务依然是云服务,不管是公有云市场还是私有云市场,人工智能这个全新的云服务都在被大肆宣传,大肆推广。

正如上文所言,由于深度学习的突破主要局限在语音、图像领域,这也导致其在云端服务中的局限性。在国内,阿里云提出的智能城市解决方案「城市大脑」,强调的是应对城市交通摄像头采集到海量图像数据后的处理能力;上周华为发布的一系列企业智能服务里,有一项是突出其图像识别上的精准性。

这些尝试依然没有走出深度学习算法的限制,无法在语音、图像之外找到新的技术创新。

所以,企业级的人工智能应用还处在一个相对初期的阶段,依然需要思考将人工智能的单点技术植入企业应用场景中,但这背后的推动力,则是云端大数据的处理能力,从这个角度上说,云、大数据和人工智能,可谓三位一体,离开谁都无法构成云计算厂商的核心竞争力。

而在个人消费者领域,人工智能的处理能力正在从云端下沉到设备。

这一切离不开消费设备(应用)提供商对于用户体验孜孜不倦的追求,2015 年 5 月,Google 发布一款相册产品 Google Photo,该产品的核心功能就是智能化处理照片,这得力于 Google 在深度学习算法上的优化改进,可以实现人脸识别、关键词搜索、图片分类、自动分组、图片自动优化等一系列功能。

img

Google Photo 的每一个功能都会让人感叹技术进步的伟大,但 Google Photo 的问题也显而易见——这一切处理过程都是在云端非实时完成。也就是说,你需要首先将照片上传到 Google Photo,然后等待若干小时甚至几天时间,才会出现「神奇反应」。

2016 年,一款名叫「Prisma」的拍照应用风靡全球,这是一个基于深度学习算法,将任意一张普通照片「改造」为世界名画的应用,其最后的处理效果令人惊艳。

img

不过,随着用户群体的扩大,该应用的用户体验却备受指责,原因就在于,Prisma 的所有处理能能力都在云端,用户每一次上传原图、处理、下载都需要和云端服务器连接,如果你体验过 Prisma,一定会对其缓慢的处理过程印象深刻。

而当时间来到 2017 年,事情正在发生着变化。长期跟踪苹果公司动向的 Bloomberg 记者 Mark Gurman 在 5 月份的一篇独家爆料文章中称,苹果正在为 iPhone 秘密研发专属的人工智能芯片:

Apple is working on a processor devoted specifically to AI-related tasks, according to a person familiar with the matter. The chip, known internally as the Apple Neural Engine, would improve the way the company’s devices handle tasks that would otherwise require human intelligence – such as facial recognition and speech recognition, said the person, who requested anonymity discussing a product that hasn’t been made public. Apple declined to comment.

这个消息的可靠性也在随后 WWDC 大会发布的 iOS 11 里得到更进一步的证实。即去年发布可创建基本卷积神经网络的 Metal CNN 和 BNNS 之后,此次借助 iOS 11,苹果又引入了一个新的计算机视觉开发机构以及 Core ML,后者的作用就是让机器学习的训练模型集成到开发者的应用程序里。

Croe ML 的出现,也让外界看到苹果对于未来人工智能应用在 iOS 上的想象空间,与此相呼应的则是新一代 iPhone 在硬件上如何集成相应的芯片。尽管最近两周,新一代 iPhone 的爆料几乎让明天早上的发布会失去悬念,但一个有趣的细节则是,所有的爆料都没有指出新 iPhone 在人工智能应用,比如语音、图像(拍照)上改进,尤其是专属机器学习芯片能否给 iPhone 体验带来全新的提升。而这,才是苹果以及新 iPhone 的真正竞争力。

类似地,华为也在做这样的尝试。9 月初华为发布的麒麟 970 芯片,就集成了一个用于机器学习的神经网络处理单元,尽管目前尚不可知其具体的应用场景,但考虑到目前深度学习的局限性,基本也是围绕图像(包括拍照、相册整理、AR 应用)、语音(智能助理)、自然语言交互(文本—语音,语音—文本)这几个场景。

目前,苹果、华为之外,还没有其他厂商宣布类似的计划,但不说并不代表没在做,尤其是中国广大安卓厂商的竞争已经进入白热化阶段,任何一个有差异化的市场,比如从双摄到全面屏,都会迅速变成红海,,接下来,2017 的下半年以及 2018 年的上半年,围绕人工智能手机芯片的竞争,会更具观赏性。

当手机被内置了专属的人工智能处理能力,对于普通消费者的使用体验会带来显著的提升,在语音交互、图像处理,尤其是利用双摄像头硬件的潜力,充分满足拍照和照片处理的巨大需求。但另一方面,则是用户设备数据的争夺会不断引发新的冲突,上月华为荣耀手机与腾讯微信之间的争议就是一个代表。

《华尔街日报》最早披露了这起争议

华为技术有限公司(Huawei Technologies Co.)正在通过其荣耀Magic智能手机收集用户活动信息,以打造其人工智能功能,例如使手机能够基于用户的短信内容推荐餐厅。其收集的信息包括热门社交应用微信(WeChat)的聊天信息。* >
知情人士透露,微信的所有者腾讯控股有限公司(Tencent Holdings Ltd. ,0700.HK)认为,华为的上述做法实际上夺取了腾讯的数据,并侵犯了微信用户的隐私。知情人士称,腾讯已要求中国政府介入此事。

华为称,所有用户数据都属于用户,而不属于微信或是荣耀Magic,该公司在荣耀Magic设备上处理用户数据之前经过了用户的授权。

这场冲突最后的结局尚未公开,但这起事件构成了手机人工智能数据争夺战的前戏。任何围绕机器学习的应用场景都离不开用户设备数据,涉及到下面三大利益相关方的博弈:

  1. 系统供应商,如苹果 iOS、华为 Emui、小米 miui;
  2. 硬件供应商,如 iPhone、华为 Mate 系列、小米手机;
  3. 第三方应用供应商:如微信、Facebook;

任何一个利益方都在觊觎用户的数据,都希望将这些数据作为「改善用户体验」的一部分,更希望通过数据挖掘形成壁垒优势。这其中,苹果通过软硬件的绝对掌控能力,相对而言占据了一定的先机,不过,在中国市场,中国厂商无所不用其极的「智谋」,或许也能多多少少实现手机上的人工智能体验。

遗憾的是,这个博弈过程与普通用户无关,你所能做的,只剩下了「用」还是「不用」两个选项以及在「1984」与「美丽新世界」的两个精神状态里来回切换。