「保卫手机」的MWC、Google Clips 的梦想与现实、微软认知计算成绩单、阿里继续押宝东南亚

从本期「人工智能商业内参」开始,会员通讯邮件的标题将使用文章的关键字或小标题,便于大家随后检索。

「保卫手机」的 MWC

本周一开始,MWC 如约而至,与 1 月份的 CES 不同,MWC 作为移动互联网行业的盛会,更多的关注点还是围绕移动互联网以及移动通信的未来,会议的主角既包括移动通信软硬件供应商(如华为、爱立信)、电信运营商(如中国移动、中国电信),也包括众多手机厂商,比如三星、VIvo、黑莓、诺基亚等。

在今年的 MWC 上,「保卫手机」成为行业内心照不宣的议题。所谓「 保卫手机」,是在智能手机 10 年之痒之后到底路在何方的大背景下,整个行业——从运营商到手机制造商——为之探寻的解决方案。

其一,5G 的路线图更清晰。从字面意义上看,5G 似乎就是 4G 的升级版,但无论是技术架构还是应用场景,5G 带来的变革都将是革命性的,这种革命性的变革为智能手机带来了全新的发展机遇。

比如 5G 更快的网速可以进一步释放智能手机作为移动终端的网络性能,这意味着你能更快的下载到音视频、看到更高清的在线电影、玩更流畅的网络游戏。与此同时,5G 低延迟的特点,还可以让手机的 AR 、VR 应用变得更简单,体验更好。

这些应用场景的想象空间足够诱人。也促使各方,从华为、英特尔、高通这样的底层技术供应商,到各国电信运营商,都不断加大对 5G 的投入。以华为为例,此次 MWC 上,华为发布了基于 3GPP 标准的端到端全系列 5G 产品解决方案,这个端到端的解决方案,涵盖了核心网、传输、站点乃至基带、终端的整个 5G 产品链条。

高通则发布了 5G 模组解决方案,这个模组里有 1000 多个组件,包括数字、射频、连接等组件,能够大大降低终端设计的复杂性,从而降低 5G 的门槛。高通希望,利用自身在移动终端的影响力,快速推进 5G 模组的部署,让更多的合作伙伴加入到开发 5G 终端的阵营中。

尽管理念略有差异,但华为、高通基本有一个共识:2019 年推出 5G 手机

其二,为手机加入人工智能。这个思路也是 2017 年智能手机发展趋势的延续,其重点则是目前人工智能发展最成熟的机器视觉,也就是利用机器视觉提升拍照体验。

智能手机也成为国内各大机器视觉供应商的一笔大生意。

旷视科技创始人印奇在接受腾讯专访时表示,未来至少五年内,甚至十年里,最核心的个人智能硬件设备仍然会是手机。而变革的机遇,就是摄像头。

此次 MWC 期间,三星发布的 S9 智能手机,虽然从基本参数上没有太过亮眼的提升,但三星依然在机器学习的帮助下,为新一代旗舰手机提供了两个「杀手级」的功能:

  1. AR Emojis:可以捕捉超过100种面部特征来呈现一个3D的模型,实时模拟用户的表情;
  2. 相机可以拍摄每秒 960 帧的「超慢动作」;

对三星以及整个手机行业而言,AR Emojis 的意义更大,一方面,作为 Android 所有者的 Google 已经看到了 AR 之于智能手机的应用场景,MWC 开幕前,Google 正式发布了 ARCore 1.0,并推出首批 13 款适配机型;另一方面,三星坐拥全球 Android 市场老大的地位,扮演着对抗苹果的首要角色,此次 AR Emojis 也是对苹果 Animoji 的直接宣战。

三星 S9 系列搭载的也是高通今年力推的骁龙 845 处理器,这一代处理器也会像苹果 A 11 那样具有单独的神经网络处理能力。与此同时,联发科也在本周发布了新一代处理器 P60。根据联发科的官方介绍,P60 在图像处理方面同样加入人工智能处理能力:

Those image enhancements come courtesy of the newest feature to grace the Helio line, MediaTek’s NeuroPilot AI accelerator. Like similar functional units in other companies’ SoCs, NeuroPilot is a DSP intended to accelerate AI inferencing.

 

MediaTek suggests that besides improving pictures, NeuroPilot could also be used for real-time overlays and AR acceleration. NeuroPilot supports Android’s NNAPI as well as the TensorFlow, Caffe, and Caffe2 AI frameworks.

凡此种种,让今年的 MWC 具备了太多「救主」 意味,不过有一个令人无法回避的事实,尽管 2017 年 iPhone X 的「刘海全面屏」备受嘲讽,可在 MWC 期间以及之后一段时间,一大堆标榜「比 iPhone X 刘海小」的手机会层出不穷,比如华硕的新品手机:

img

再比如传闻中,也基本被坐实的华为 P 系列:

img

至此,2018 年的移动互联网大戏正式开场了。

Google Clips 的梦想与现实

本周,Google Clips 正式在美国发布,这个售价 249 美元的相机是 Google 去年 10 月发布 Pixel 手机时发布的,搭载了 f/2.4 光圈、130 度超广角的镜头。

img

这款产品当时被很多人忽视,但在我看来,这是一个重要风向标产品。我在当时的一篇会员计划里引用了 The Verge 主编 Dieter Bohn 的观察:

Dieter Bohn 看来,Clips 的发布是 Google 对于人工智能思考的一次转型,这是因为,尽管这款人工智能相机能够依靠机器学习识别用户脸部、表情和环境,并自动记录短片,但所有这些操作是在本地进行的,这对 Google 的人工智能产品无疑是一件重大的转变,要知道,过往 Google 几乎所有标榜人工智能的应用都是基于云端——这也是长期以来被苹果公司所鄙视的行为。

Dieter Bohn 进一步写道:

Clips is the kind of thing Pichai wants Google to do more of. “I made a deliberate decision to name the hardware product with [a] software name,” he says. “The reason we named it Clips is that the more exciting part of it is … the machine learning, the computer vision work we do underneath the scenes.”

随着该产品正式发布,美国科技媒体抢先对其作了测评,但并没有太过积极的评价,比如 The Verge 这样写道:

The camera’s ultra-wide-angle field of view (it captures something similar to what a 10mm lens on a full-frame DSLR sees) makes it easy to position without a screen and be assured that you’ll get something in frame, but it’s bad for pictures of people, as it distorts facial features in an unflattering way. Likewise, anything near the sides of the frame is wildly distorted. Your subjects also have to be within roughly 10 feet of the camera, lest they be tiny in the resulting image. But the Clips’ fixed-focus lens has a range of about three feet to infinity, so nothing close to the camera is ever sharp. Even then, subjects within its range never really look sharp, either.

而在 TechCrunch 和 ZDnet 看来,Clips 是一个可以被「调教」的新家庭伙伴,这意味着,你可以成为 Clips 的老师,ZDnet 的评价中,有这么一段话:

The first few times I used it, I found myself continually going into the Clips app and looking at what had been captured, then trying to adjust positioning or using the shutter button to force a photo.

 

It wasn’t until after a basketball game when I was reviewing the various moments it had captured, I realized I needed to let go and trust Clips. I now have GIFs of my daughter playing defense and going up for rebounds, all the while I sat and watched the game without reaching for my phone to take photos (or check Clips).

透过这些评价,我们可以发现,Google Clips 所代表了是一种专属计算设备趋势,和智能音箱所扮演的角色无异。

这个全新的人工智能相机,没有单反相机拍的清晰,也没有手机相机如此智能,但基于终端智能的理念以及人机互动的方式,倘若它的不完美、不成熟,可以在人机互动中得以优化和提升,那么,Google Clips 俨然具备了新家庭成员的资格。

我曾在去年 7 月以智能音箱这样的专属设备为例,探讨了万能设备消失以及专属设备正流行的现实:

上周,阿里巴巴正式加入智能音箱大战行列,推出一款名叫天猫精灵的智能音箱。至此,全球范围内的互联网巨头们,都已经有了属于自己的智能音箱。在后智能手机时代,语音被看作是全新的「输入方式」,有可能开创一个全新的万亿市场。

 

过往,我们习惯性地将人机交互的演化作为论证语音入口或智能音箱的可行性,但这个思考更多还是基于「用户为中心」,倘若站在计算设备发展的角度去看,几乎所有这些音箱都是一种面向未来的计算设备,或者准确地说,是一台台专属计算设备。

 

不久前《纽约时报》有一篇文章就提出了这个有趣的观察角度,文章以亚马逊 Echo 和 Echo 为例,来探讨未来计算设备的可能性,其核心就是,亚马逊对于未来计算设备的定义从来不是万能设备,而是成为一台专属设备:

There’s a whole lot the Echo Show won’t do. It won’t do email. It won’t do the web. It won’t play first-person shooters. It is emphatically, purposely not a general-purpose computer. But what it does do — play music and videos, make video calls, tell you the news, tell you the time and weather, and shop at Amazon — it does with such surpassing ease that it feels like a magic trick.

Google 、微软以及阿里云的人工智能新动作

本周,Google 本周发布了一个面向各行各业的人工智能教育产品「Learning With Google AI」,整合了 Google 内部大量的人工智能学习资源,可以满足不同阶段的用户需求。

img

其中,「机器学习速成课程」作为免费版正式上线,这套课程包含 25 节课程,40 多项练习和案例,共计 15 个小时的课程,所有课程免费,还支持中文。

这一系列动作展现出 Google 对于人工发展的基本理念,即提供更普惠或者更民主的人工智能技术,让人人都具备接触人工智能的能力。

而微软也在本周发布了其在认知计算领域的阶段性进展。微软将人工智能的各项能力,比如计算机视觉、语音、自然语言处理、知识图谱和搜索方面的技术和能力,都整合在认知计算服务部门,某种意义上说,这个部门就是微软人工智能的核心部门,根据微软副总裁 Joseph Siosh 在其官方博客的介绍,微软的认知服务得到全球开发者和企业的支持:

To date more than a million developers have already discovered and tried our Cognitive Services, and many new customers are harnessing the power of AI, such as major auto insurance provider Progressive best known for Flo, its iconic spokesperson. The company wanted to take advantage of customers’ increasing use of mobile channels to interact with its brand. Progressive used Microsoft Azure Bot Service and Cognitive Services to quickly and easily build the Flo Chatbot—currently available on Facebook Messenger—which answers customer questions, provides quotes and even offers a bit of witty banter in Flo’s well-known style.

和 Google 一样,微软的认知计算服务同样基于云端,利用 Azure 向开发者提供服务,还有两个月时间,微软一年一度的开发者大会又将召开,届时,微软会将认知计算、云和企业级应用如何整合,值得持续关注。

本周另一则巨头动作来自阿里云。根据「天下网商」的报道,阿里巴巴宣布与新加坡南洋理工大学成立联合研究院,重点项目就是人工智能领域的合作。

此次合作的意义有两点:其一,随着东南亚市场成为阿里巴巴整个集团的重要海外市场,阿里会在东南亚展开更多形式的布局,从技术落地到学术合作再到商业投资,未来还有更多。

其二,从人工智能战术层面来看,阿里巴巴将新加坡作为吸引海外人工智能人才的重要基地,公开资料显示,新加坡南洋理工大学的工程学院在全球范围内名列前茅:

2017年QS世界大学排名中,新加坡南洋理工大学工程技术学院在全球排名第四。同年,由日经和Elsevier联合汇编的报告显示,2012年至2016年,南洋理工大学在人工智能领域研究论文被引用排行榜中仅次于微软,位居全球第二,而论文被引用次数通常被视为衡量学术研究质量的一项重要指标。

尾巴:数据分析哪家强

最后,补充一个来自 Gartner 发布的大数据分析平台魔力象限,如下图所示,这个魔力象限代表了面向数据分析的名次表,Gartner 将「面向分析的数据管理解决方案(DMSA)」定义为「支持和管理一个或多个文件管理系统(通常是数据库)中数据的完整软件系统。」

img

这个象限的横轴代表着前瞻性(Completeness of Vision),包括厂商或供应商提供的产品底层技术基础的能力、市场领导能力、创新能力和外部投资等等;纵轴则代表着执行能力(Ability to Execute)包括产品的使用难度、市场服务的完善程度和技术支持能力、管理团队的经验和能力等。

纵观今年的魔力象限,「领导者」象限里的亚马逊 AWS 在纵轴上已接近 Oracle;而华为、阿里云都入围了「利基市场」象限,两者差距不大,但还没有跑到「挑战者」象限。

Zhao Saipo

View posts by Zhao Saipo
赵赛坡,科技博客作者、资深科技观察家、付费科技评论 Dailyio 创始人、出品人,覆盖 3000+ 付费用户。 曾担任 TechTarget 中国区记者、频道主编、AI 自媒体「机器之心」前联合创始人。