「人工智能智能内参」旨在提供一份中文互联网领域权威、可读的人工智能商业化应用邮件列表。本期你将看到 麒麟 970 的战略和战术、英伟达与英特尔加剧人工智能芯片厮杀、医疗影像争夺战、亚马逊扩充 Echo 家族的寓意、起底 Anthony Levandowski、计算机视觉的中国式故事 ……点击这里查看过往内容。
号外:麒麟 970 亮相国内,华为人工智能的战略与战术
华为消费者业务过去几年的宣传运作都是「先国际,后国内」的策略,不管是 Mate 还是 P 系列手机都贯彻了这一原则。本月,麒麟 970 处理器的出场方式也同样如此,即月初亮相慕尼黑之后,本周一,华为麒麟 970 处理器正式在国内发布,那么这款本月初一度占据科技新闻头条的处理器到底有多大提升,尤其是在 A11 几乎碾压一众处理器的行业背景下,麒麟 970 真的能带来产业震动吗?
答案并不乐观。
在这场全程两个半小时的媒体沟通会上,华为 Fellow 艾伟详细介绍了麒麟 970 的几个亮点。尽管 PR 明确表示处理器的演示效果和最后终端的效果不会完全一样,但在下一代 Mate 手机下月就要发布的语境下,我们有理由相信这次来自麒麟 970 的处理器的诸多亮点也是下一代华为旗舰手机的特点。或者更进一步,这也是华为对于移动设备演化方向的判断。
在华为看来,麒麟 970 所带来的优势包括以下几个方面:
- 通话、上网的体验的改进;
- 强调设备智能与云端智能的协同;
- 押注摄像头,所谓「慧眼」;
- 开放智能生态,寻求更多合作伙伴加入;
仔细去看,除了第四点外,整个 Keynote 都在强调两个字:「体验」。从通话清晰度、上网是否流畅、设备与云端的无缝协同到拍照好坏,这一系列的优化、提升都在围绕用户体验来做文章,联想到上半年华为对 P10 系列手机的内存混用风波的回应,其理念也是一脉相承:即无论用怎样的方式方法,华为手机在体验方面是有保障的。
但很显然,麒麟 970 所带来所谓人工智能体验并没有突破语音、图像的范畴。语音方面,通过一个深度神经网络可以大大降低通话过程中的噪音,而图像方面的改进更多还是停留在图像识别与改善拍照质量层面。不过,华为一直强调其手机图像识别速度远远快于苹果 A11 处理器,但这个特性需要第三方开发者来调用并开发出优质的 App 才能被用户所感知, 至于改善拍照质量,还需要摄像头模组的搭配和调教,这一系列不确定的事情都让麒麟 970 的图像提升之说成为一个未知数。
综合上述要素,麒麟 970 更像是华为对于智能手机行业的一次战略性部署,而非成熟产品的落地。
这个战略背后是智能手机行业下一个十年变革的开场序曲,作为第一个十年里的主角,苹果已经构筑了一条完整的软硬一体化的护城河,其新一代 iPhone 里的诸多核心技术都是自主研发。也就在本周,TechCrunch 根据多方消息源指出,苹果又收购了一家以图像识别为主打的创业公司 Regaind:
Regaind has been working on a computer vision API to analyze the content of photos. Apple added intelligent search to the Photos app on your iPhone a couple of years ago. For instance, you can search for “sunset” or “dog” to get photos of sunsets and your dog.
In order to do this, Apple analyzes your photo library when you’re sleeping. When you plug your iPhone to a charger and you’re not using your iPhone, your device is doing some computing to figure out what’s inside your photos.
华为,则希望成为第二个登场的主角,麒麟芯片研发历史已近 10 年,直到最近几年才被人认可,而华为智能手机也是从三年前才真正爆发,利用资金、研发形成对软硬件的全局掌控,会成为智能手机行业下一个十年的重要看点,这远比全面屏、金属还是陶瓷重要太多了。
最近另外一则被媒体忽视的新闻是东芝出售旗下芯片部门,根据本周最新的消息,东芝已经签署协议,将芯片业务以 180 亿美元卖给贝恩资本牵头的财团,而这个财团的一个重要参与者就是苹果,这意味着苹果依然加大对于芯片业务的布局。事实上,全新 iPhone 的 NAND 内存芯片主要来自三个厂商:东芝、海力士,以及美光。倘若这笔收购完成,对于苹果强化其在内存芯片上的话语权意义重大。
从这个角度去看,华为麒麟 970 的高调亮相也仅仅是一个开始,未来围绕整个产业链的收购、投资都将对中国智能手机市场产生重大影响。比如本周华为流出了一份任正非的讲话,其中就谈到围绕人工智能的人才战略:
重视使能工程部,迅速扩大人工智能使能者队伍,做公司变革的战斗队,做诺亚方舟人工智能的战略预备队。
一个特别有趣的现象,华为 PR 此次特别嘱咐不要提及寒武纪在麒麟 970 研发中的作用,或许,华为已经开始自主研发下一代麒麟处理器的神经网络处理单元了。
行业:人工智能芯片厮杀加剧
英伟达本周在北京举办了一场声势浩大的 GPU 峰会,不仅发布了全球首款可编程的人工智能推理加速器,更频繁向中国的巨头公司们示好,以求将 GPU 作为人工智能时代的硬件标准。
这个所谓可编程的人工智能推理加速器的目的是实现机器学习框架与硬件的衔接,将诸如 Google TensorFlow、Facebook Caffe2 的框架与英伟达的 CPU 硬件,如 Tesla V100、DRIVE PX 2 联系起来,从而提升算法运行的效率。
另一方面,英伟达与中国 BAT 的云服务建立合作关系,将 NVIDIA Volta GPU 应用到这些云厂商的云服务器中,同时还和华为、浪潮、联想等服务器厂商展开合作。
此次英伟达的诸多产品和合作,展现出人工智能领域越发激烈的芯片话语权争夺战,就目前来看,包括 CPU、GPU、FPGA 都是备选者,这种胶着状态或许还会持续一段时间。同样是在本周,CPU 大厂英特尔发布了一个还处在研究阶段的神经形态形片 Loihi,根据英特尔的官方介绍吗,这个芯片能够通过从环境中获取的数据学习来模拟大脑功。这款芯片试图通过自己的数千个硅芯片「神经元」来解决问题,就像你的神经元一样,它们可以调整它们之间的联系来应对新的任务。
应用场景方面,英特尔表示,该芯片在视频分析方面能耗降低显著,同时还能适应本地分析的需求,这也有助于隐私和数据安全。
然而这款神经芯片何时量产、何时真正应用还有诸多不确定性,这也从另一个侧面说明了人工智能芯片的混乱战局。我们也有理由期待,更多形态的芯片出现在市场上。
巨头在行动:医疗影像争夺战、亚马逊扩充 Echo 家族的寓意
本周钛媒体报道了腾讯医疗人工智能产品「觅影」负责人吴明柱的一个演讲,详细介绍了腾讯在这个产品上的技术积累和产品愿景,具体来说:
腾讯觅影整合了腾讯内部几个顶尖的AI的团队,包括我们的互联网+部门,包括腾讯的腾讯优图实验室和架构平台部,可以说是汇集了腾讯最精英的人工智能技术团队。
从觅影产品的后端来看,是有一个AI医学实验室,在这个医学实验室里面除了有这些顶级的人工智能算法专家之外,我们也请了全国顶级的一些医疗影像科的医生和很多的全科医生,同时也会跟很多的医疗机构和医学院校以及各个地方政府共同去合作,来打造我们的觅影产品。
吴明柱透露,腾讯在AI医学实验室当中,「差不多有将近五十名AI科学家,也都是在博士以上的水平,也有400多个AI开发工程师……」
让人工智能实现医疗影像自动化处理的产品非常多,国外的 IBM Watson、国内的阿里云、海信等巨头都有类似的产品,都是通过训练机器对于正常器官影像的认识,来快速识别有问题的医疗影像,从这个角度上说,腾讯觅影并不具有多大创新性。而且,技术层面的数据更多是一种实验室的结果,如何能在真实的医疗诊断中得以修正和改善,才是人工智能医疗应用落地的关键。
事实上,与巨头们抢夺医疗影像市场的还有诸多创业公司,其中依图自 2016 年发力亿了后,「其开发的胸部 CT 影响辅助诊断产品已经在浙江深人民医院、复旦大学附属肿瘤医院等数十家三甲医院部署,报告采纳率超过 90%。」
另一个与新技术落地相关的消息来自亚马逊,本周,亚马逊发布一系列围绕 Alexa 的 Echo 设备,在科技媒体 BI 看来,这是亚马逊推行「Alexa everywhere」重要组成部分,过去三年来,亚马逊成功实现了语音交互的落地实践,下图展示 Alexa 的技能成长速度。
此次 Echo 发布会上有几个细节:其一,亚马逊宣布公司目前有 5000 多名员工从事 Alexa 技术的研发,而且,其招聘页面上还有大概 1000 个职位开放,这些巨大的人力投入展现出亚马逊对于语音交互的重视程度。
其二,相比于 Echo 设备,其「操作系统」Alexa 才是亚马逊真正的杀器。此次发布会上,亚马逊更是将 Alexa 带到了宝马汽车上,一年后,美、德、英三国的宝马新车将拥有 Alexa,为此,宝马将为自己添加远场麦克风,车载显示屏上会直接显示 Alexa 输出的影像内容。
与 Google 一样,亚马逊同样是一家信息触达的公司,如果懂得这句话也就不难理解亚马逊不断扩充 Echo 产品线,Google 再次开始研发、设计智能手机。对这些公司来说,硬件所承担的任务就是信息触达用户的开始,而语音、图像的交互则进一步增加了用户的粘性,从而更好地售卖服务。
人物:Anthony Levandowski
Wired 本周发布了一篇关于 Anthony Levandowski 的长文,此君曾是 Google 自动驾驶团队的核心成员,后离职创业,接着其卡车自动驾驶公司被 Uber 重金收购,Anthony Levandowski 也进入 Uber 自动驾驶部门,但随后 Google 自动驾驶公司 WayMo 发起诉讼,指控他在 Google 工作期间窃取了重要机密文件。
这篇文章的标题为God is a Bot, And Anthny Lnevandowski is His Messengner,文章开头就提到一个关于 Levandowski 的「秘密」:
In September 2015, the multi-millionaire engineer at the heart of the patent and trade secrets lawsuit between Uber and Waymo, Google’s self-driving car company, founded a religious organization called Way of the Future. Its purpose, according to previously unreported state filings, is nothing less than to “develop and promote the realization of a Godhead based on Artificial Intelligence.”
从标题到这个「秘密」基本要给这篇文章定了基调,这是一个相信技术、相信奇点一定会来临,相信技术会终结人类苦难的硅谷精英的故事,比如他在 Uber 的邮箱名为「robot@uber.com」,而根据诉讼文件显示,Levandowski 与 Uber 创始人 Kalanick 的短信也充满了满满的技术崇拜情节:
In Kalanick, Levandowski found both a soulmate and a mentor to replace Sebastian Thrun. Text messages between the two, disclosed during the lawsuit’s discovery process, capture Levandowski teaching Kalanick about lidar at late night tech sessions, while Kalanick shared advice on management. “Down to hang out this eve and mastermind some shit,” texted Kalanick, shortly after the acquisition. “We’re going to take over the world. One robot at a time,” wrote Levandowski another time.
尾巴:计算机视觉的中国式故事、中国人工智能初创企业都在做什么
虞喵喵在微信公众号「KnowingAI知智」上系统回顾了中国计算机视觉创业公司过去 5 年的恩怨情仇:
2013 年新广告法还没实行,旷视科技为 Face
2014 年是「格灵深瞳」的天下,纸媒、门户、科技媒体争相邀其登上头版。据说徐小平、冯波和沈南鹏曾就其市值激烈争论,「最后妥协在了3000亿美元这个『中间数』上」。
2015 年,偏居重庆的周曦悄悄创立云从科技,将目标定为「只做人脸,深耕金融和安防」。这一年商汤开始经历从学术到商业的激烈转型,还与几家「小巨头」深度绑定,成立了合资公司。
2016 年,旷视拿到建银国际和富士康集团的 1 亿美金融资。一向低调的依图同年将业务从车辆、安防,向医疗、城市数据拓展。
如今,云从的初心仍未改变,业务已渗透到四大国有银行;依图拿到 3.8 亿 C 轮融资,商汤则破天荒融到 4.1 亿美元,距上市更进一步。
这是属于中国 CV(计算机视觉)公司的五年,这是属于他们的时代。
通过爬取国内人工智能创业公司的数据,西关大数据茶馆得出一个产业分布图:
通过数据我们也看到了一个接近纺锤体的产业形态,大多数AI初创企业集中于通用AI技术,及成为了投资热点的消费级终端(智能机器人、无人机、智能硬件)上。行业场景应用方面虽然公司的绝对数量不少但过度集中于自动驾驶、智慧医疗和智慧金融上面,三者占了场景应用层65%的企业数量,融资金额更是占绝对多数。这反映了当前AI产业所面临的一个事实——在本轮AI创业浪潮之中,优秀资源(科学家、资金)集中在通用AI技术上,当然扎根技术在AI产业成熟的今天是无可厚非的事情,但风险点在于通用AI技术的成果是否能转化为商业应用场景,而非实验室式科研成果,这对于每一家拿到了大融资的通用AI技术初创公司均是逃离不了的考验。