华为 P20 的样本效应、FB 的自救措施、银行业 AI 的处境以及 TED 2018 的 AI 议题

TL;DR。 本周的「人工智能商业内参」,你会看到:

  • 华为 P20 如何成为 AI 与智能手机结合的样本产品?
  • FB 的人工智能自救措施为何没人买账?
  • 人工智能在银行业的现实与梦想;
  • TED 2018 上的人工智能;

号外:以拍照来看,华为 P20 是 AI 与智能手机结合的样本

根据 Canalys 的中国智能手机市场报告,2017 年中国智能手机销售额出现历史上首次下滑,同比 2016 年下滑了 4%。

而自 2017 年下半年以来,人工智能与智能手机的结合,成为整个手机行业的一剂强心针。2017 年 9 月初,华为率先发布一款集成神经网络处理能力的麒麟 970 处理器;9 月中旬,苹果推出的新一代 iPhone 里,也加入了神经网络引擎;10 月,搭载麒麟 970 的 Mate 10 全球发布,由此也开启了人工智能驱动智能手机变革的全新故事章节。

不过值得注意的是,撇开市场宣传的各种话术,人工智能带给智能手机的变化还非常局限。一方面,受限于手机硬件的性能和功耗,不可能完成大规模的机器学习处理。另一方面,则是如何将机器学习和手机应用场景结合起来。

目前来看,手机拍照依然是各家的重点领域。

本周,华为在国内正式发布了 P20 系列手机,在这场名为「眼界大开」、长达两个小时的发布会上,智能手机部分的介绍至少有一个半小时,而介绍 P20 的拍照,又占据了其中的一个小时。

事实上,在上月海外发布之后,社交媒体上对于 P20 拍照性能有了诸多讨论,很多人会关注 P20 的三个摄像头,并以「底大一级压死人」的行话来凸显 P20 此次相机的硬件提升,但有一点却被忽略了,那就是去年那颗麒麟 970 处理器给拍照带来的算法优势。

我曾在麒麟 970 发布现场体验到这款处理器的拍照算法,他们给出的测试环境也是一个密闭的房间,模拟城市夜景环境,用一台搭载麒麟 970 的工程机(看不出型号)和一台 iPhone 8P(那时 iPhone X 还未发货)来对比夜拍效果,其结果如下图显示,麒麟 970 完胜。

img

由于当时外界还在期待 Mate 10 系列手机,现场很多人,也包括我,误以为这是 Mate 系列的特性。不过随后的 Mate 10 系列尽管拍照有了较大提升,但在硬件层面——无论是镜头还是感光器件——都没有真正意义的更新。直到 P20 发布,华为将硬件(三镜头加手机行业目前最大的感光元件)与软件(麒麟 970 里的图像处理能力)结合起来,最终成就了这款或许是目前为止可应对各个场景的拍照手机,

有评论指出华为 P20 的最大成绩其实是做成了手机拍照的标杆,我更愿意将其作为智能手机与人工智能结合的样本——只有实现软硬件的结合,才能真正释放人工智能在移动设备上的各项能力。类似地,在本周另一场围绕人工智能与智能手机结合的沟通会上,高通和 Vivo 也表达了类似的看法,在目前高通的产品线中,「AI Engine」被加入到多个处理器里,比如骁龙 660,爱范儿的报道:

虽然架构没有变化,但基于芯片中的 CPU、GPU 以及一系列 SDK ,高通选择将 AI 应用中的任务分配给芯片中的不同部分,以有效帮助开发者对自己的 AI 程序进行优化。
……
有了高通这套方案,哪怕去年的骁龙 835 和 660 这一批芯片均没有真正意义上的人工智能协处理器,但现在第三方开发者和手机厂商都可以在这些芯片上运行 AI 应用了。

高通这种做法,对于 Android 开放生态来说更加取巧,也可以更灵活地处理多家手机品牌的弹性需求。

高通的 AIE 的软件(算法)之外,Android 厂商则全力研发硬件,或在感光元件或在镜头上作出更多创新,这也会成为 2018 年 Android 市场的特有图景。

那么问题来了,下半年新 iPhone 会带来怎样的软硬件结合后的拍照体验呢?

业界:FB 与今日头条的自救、Open AI 新纲领

本周 Facebook 和今日头条都迎来一个「艰难时刻」,当大洋彼岸的扎克伯格坐到美国参议院听证会时,张一鸣的那一夜一定难熬,就像他在「道歉信」里所言的「一夜难眠」。

作为都是依托算法的内容平台,FB 和今日头条所做的自救措施则有些许不同。扎克伯格在听证会上表示会持续推进人工智能应对仇恨言论的研发工作

Zuckerberg said that the company is increasingly developing AI tools to flag hate speech proactively, rather than relying on reactions from users and employees to flag offensive content. But according to the CEO, because flagging hate speech is so complex, he estimates it could take five to 10 years to create adequate A.I. “Today we’re just not there on that,” he said.

但对于当下,扎克伯格承认,还需要大量人类员工来解决这类问题:

For now, Zuckerberg said, it’s still on users to flag offensive content. “We have people look at it, we have policies to try and make it as not subjective as possible, but until we get it more automated there is a higher error rate than I’m happy with,” he said.

为此,FB 将在今年年底将内容审核人员扩充到 20000 人。这同样也是今日头条本周所承诺的改进计划,张一鸣表示,「强化总编辑责任制,全面纠正算法和机器审核的缺陷,不断强化人工运营和审核,将现有6000人的运营审核队伍,扩大到10000人。」

不过,针对 FB 的人工智能优化计划,并没有多少人买账,Quartz 的报道指出,扎克伯格的承诺并不靠谱:

“Mark Zuckerberg is being realistic when he says ‘we will have A.I. tools that can get into some of the nuances’ in 5-10 years, but there are a lot of nuances and not all of them will be able to be automated away,” Babakar says.

Other researchers disagree on Zuckerberg’s timeline, with the disclaimer that technological predictions are always difficult to make.

而在 MIT 科技评论看来,这项计划面临三项难题,其中谈到,这本身就是一个军备竞赛:

Even if progress is made in natural-language understanding, the purveyors of hate and misinformation could well adopt some of the same tools in order to evade detection.

同样在本周,OpenAI 发布新的研究纲领,这份并不算太长的宣言,包括人工智能研究的出发点、长远研究的安全措施以及开发合作的基调,其核心是再一次强调,人工智能是一项全人类的福祉

OpenAI’s mission is to ensure that artificial general intelligence (AGI) — by which we mean highly autonomous systems that outperform humans at most economically valuable work — benefits all of humanity. We will attempt to directly build safe and beneficial AGI, but will also consider our mission fulfilled if our work aids others to achieve this outcome.

尾巴:Google 利用深度学习分离声音、阿里继续「买赛道」、AI 与银行

Google 两位工程师本周发布了基于视觉、声音识别模型的论文,通过利用深度学习结合人脸动作识别,可以将两个同时说话的声音提取出来。这项研究的落地场景非常多,比如应对多人同时发言时的语音识别和自动翻译。

商汤科技本周完成一笔 6 亿美元的融资。此次融资中,阿里巴巴集团领投,新加坡主权基金淡马锡、苏宁等投资机构和战略伙伴跟投。目前商汤科技在人脸识别、图像识别、医疗影像以及深度学习算法上拥有不小的影响力。外界普遍认为,投资商汤科技,将是阿里巴巴又一次「买赛道」的战略部署,要知道,阿里巴巴系的蚂蚁金服也投资了商汤科技的竞争对手旷视科技。

人工智能与银行。《金融时报》报道了人工智能在银行的应用前景,这句话可以说是点睛之笔:「The industry is taking a cautious approach in spite of excitement about new technology。」

TED 2018,人工智能成了与会者的消极论据。本周的 TED 2018 上,面向人类未来的几个重大议题都少不了人工智能的身影,《人类简史》作者 Yuval Noah Harari 描述了人工智能带给政府和大企业的无穷能力:

The greatest danger that now faces liberal democracy is that the revolution in information technology will make dictatorships more efficient than democracies,” Harari says. With the rise of AI, centralized data processing could give dictatorships a critical advantage over relatively decentralized democracies. So what can we do to prevent this possibility?

而今年人工智能畅销书《Life 3.0》的作者 Max Tegmark 也进一步强调了人类需要认真面对人工智能:

As he sees it, humanity has two options as we move closer to a world where artificially intelligent machines can do everything better and cheaper than we can. Option #1: We could be complacent and not worry about the consequences as we build our technology. Or, Option #2: We could be ambitious and envision a truly inspiring future, then figure out how to steer towards it.

颇为遗憾的是,没有一位演讲者拥有人工智能从业背景,他们的很多观点并不新鲜,而论据的选择,也有点「心机」,其最终传递出来的结论,或许并不足以证明人工智能的对与错。