最近有两个与钱相关的事件发生。一是 Snap 公司正式向美国联邦证券交易委员会提交 S–1 文件,这意味着该公司已正式启动上市计划;二是老牌汽车公司福特斥资 10 亿美元收购一家自动驾驶创业公司 Argo 的大部分股份。
我曾在较早前的多期会员通讯里对于 Snap 或 Snapchat 的价值进行过分析,它的成功,更像是以「摄像头即键盘」的新一代移动互联网产品的重要代表;而后者,福特的这笔大投资,也充分展现了其对未来自动驾驶的乐观预期。据了解,Argo 要做的就是为福特的自动驾驶汽车添加一个「机器大脑」,从而帮助福特能在 20121 年实现全自动驾驶汽车的目标。福特 CEO Mark Field 这样表示:
我们的观点是,未来会有一些(汽车)公司需要这套系统…..市场不会只有一个赢家。我们可以向其他公司提供这样的方案,这并不会损害我们的竞争优势。我们认为这是一个巨大的机会,为公司创造价值。
上述两件事情看似毫无关系,毕竟,一个是一家相机或社交媒体的上市,另一个是传统汽车厂商押注自动驾驶的投资。但背后,都指向了一个方向:动态影像即将「吃掉」世界。
一
事实上,在 Snap 和自动驾驶启动之前,我们的世界已然布满了各色摄像头,有意或无意地记录着人类的生活、工作:
- 卫星和无人机:过去几年,小卫星公司的出现大大降低了通过卫星进行拍摄的成本,比如 Google 就收购了了一家叫 Skybox Imaging 的小卫星公司,随后将其改名为 Terra Bella,其商业模式就是向商业机构售卖卫星图像;而民用无人机的出现和逐步普及,也开启无人机的一系列企业级、消费级的应用浪潮。
- 家用监控摄像头:过去动辄上千甚至几万块的监控摄像头越来越多地进入家庭,与价格下降成反比的则是家庭监控摄像头的拍摄精度大幅提升,1080p 的视频早已普及;
- 消费级摄像机:智能手机逐步支持 4K 视频拍摄,类似 Gopro 这样的运动相机越来越流行,与之相对的一组数字:目前 Youtube 上每天有多达 400 百万小时的视频被上传。而不管是国内的直播还是国外的 Snapchat 、Facebook,都在鼓励大家拍摄更多的影像。
接下来还会有两个变化:
- 增强现实的影像:早前我曾在会员通讯里明确指出,Snap 其实是在开发一种增强现实产品——尽管这种所谓「增强」仅仅是将拍摄的影像添加了滤镜而已,但在社交效应的影响下,随着用户不断增加他们拍摄的影像,一个以增强现实影像记录的世界正在形成。
- 自动驾驶的普及将带来真正意义上高分辨率、360 度的影像。对当下自动驾驶的玩家来说,计算机视觉或者说汽车视觉,不仅影响了自动驾驶的体验,也对驾驶安全又不小的隐患,这也意味着,未来一段时间内,自动驾驶的竞争,将集中在如何让汽车更好识别物体层面。现有的激光雷达或许能解决一些问题,但价格昂贵的激光雷达,对于自动驾驶真正普及没有多大意义,因此,自动驾驶所带来的真正改变,或许就是让汽车成为一个个高速移动的高清摄像机,记录人、车的行为轨迹,也记录城市和世界的变化。
二
而在过去二十多年内,计算机视觉也迎来不小的发展,尤其是在如今海量数据的喂养下,一些大众并不熟知的技术在处理大量影像数据方面有着不俗的表现。
- 视频即麦克风(Videos as Microphones):这个提法听起来有点不明白,简而言之,就是通过算法还原出某些高精度静音影像的声音。在这个视频里,研究者们可以通过对一盆花里的叶子震动效果来实现周围说话人声音的还原,实验的效果足以理解交谈的内容。假如这项技术逐步成熟,这也意味着当下监控摄像头所面临的最为头疼的声音嘈杂问题有望解决。
- 自然语言处理的进步:事实上,机器对语音识别的准确率已然超过人类,随着数据量的继续增加,准确率还将继续提升;另一方面,Google 在实时翻译上的突出进展也十分令人鼓舞,下图来自《经济学人》:
- 脸部识别的进步:2015 年夏天,Facebook 人工智能实验室主任 Yann LeCun 表示,FB 的程序可以在 Flickr 上 4 万张图片的识别准确率达到 83%。当然,这种单纯谈论所谓识别率的说法没有太大意义,但毕竟提出了一个观察当下脸部识别发展状况的坐标;而进一步来说,相对于静态图像识别,机器对于动态图像的识别更精确,下图来自 2016 美国大选辩论的实时动态影像分析:
三
从 Snap 到自动驾驶,不管是社交应用还是交通工具的革命,最终带来的结果,都是让世界步入一个动态影像的世界,也将催生一批新的应用场景。
前几天,国内科技圈也有几个与视频相关的新闻:梨视频摄像无证经营,被有关部门约谈后开始转型,从一家以动态影像报道新闻的社区即将变成类似心灵鸡汤的「影像读者文摘」;另一个新闻则是今日头条收购山西一家视频公司,从而可以合法化开展网络视听业务,如果再加上春节期间收购的美国短视频社区 Flipagram,今日头条在国际化和视频领域完成双重部署。魏武挥在一篇评论里讨论了视频对今日头条的作用:
对于头条来说,最强劲的,是微信平台。虽然张小龙有可能根本无意做头条的竞争者,但大量内容生产者主要趴在微信后台上琢磨粉丝增长,完成用户互动,将图文作为首发地是确凿无疑的。
…..
这就是头条为什么要全力进军短视频的原因。它甚至跑到海外全资收购了美国移动短视频创作者社区Flipagram。
一是防止对手在这个领域上把它超越最终翻盘,二是要完成自己的继续高增长。
视频对头条的急迫性已经大到,即便是无牌经营,也要先干了再说。先上车,后补票,反正这种事在中国互联网,不是什么新鲜事。
如果只是允许头条号作者将腾讯也好优酷也好上的视频,嵌入到头条号页面上,对于头条的意义非常小(可以增加用户时长,但仅此而已),因为这种做法,头条并不能投放视频贴片。
魏武挥敢指出今日头条的野心,却没有指明梨视频非法经营的潜台词——这是一个管制的禁区,当局更害怕这些来自民间的大量动态影像影响社会稳定,事实上也佐证了动态影像的巨大威力。桑塔格就曾对比过照片和影像的功能:
照片可能比活动的影像更可记忆,因为它们是一种切得整整齐齐的时间,而不是一种流动。电视是未经适当挑选的流动影像,每一幅影像取消前一幅影像。每一张静止照片都是一个重要时刻,这重要时刻被变成一件薄物,可以反复观看。像在一九七二年刊登于世界大多数报纸头版的那幅照片——一名刚被淋了美军凝固汽油的赤裸裸的越南女童,在一条公路上朝着相机奔跑,她张开双臂,痛苦地尖叫——其增加公众对战争的反感的力量,可能超过电视播出的数百小时的暴行画面。
这种对比并不客观,原因就在于桑塔格时期的影像与现在的影像并非一个概念,当下,所谓的影像,既是当事人,比如直播主、直播受众的所经历的时间流[1],也是喂养机器的「食物」。作为个体的我们,早已无法承受动态影像背后意义的重量,这件事情,还是交给机器吧。
- 推荐一部话剧《爆米花》 ↩