本月初,新华社与搜狗公司共同发布了一个「AI 合成主播」,引发行业热议,并从人工智能领域延伸到新闻领域。透过全球主流媒体的报道,这个「AI 主播」更是得到欧美民众的关注,但与国内几乎一致的「厉害了我的国」声音形成对比的,国外媒体的声音比较多元化,比如英国《卫报》就提及社交媒体上的担忧:
For Xinhua’s already tightly-scripted and controlled state news presenters, the AI anchors take things a step further. Video of the Chinese anchor quickly spread on social media in China, with many viewers impressed as they were alarmed. “A little bit horrible,” one said, to which another responded: “Really scary.”
其次,「AI 主播」到底是不是中国人工智能领域的又一次创新呢?不妨先来看看这个「AI 合成主播」。根据新华社官方透露的消息,这位主播模仿的是新华社主持人邱浩,从外形、声音、眼神到脸部动作,都与真人十分相似。

新华社的新闻稿还指出:AI 合成主播是开了「外挂」,因为真人主播每天工作 8 小时,而这个「分身」却能不知疲倦地工作 24 小时……
虽然目前尚无法确认这个 AI 主播到底用了什么「黑科技」,但如果将当下的 AI 主流技术一一对照,也可以大概得出一个结论。
首先,利用图像生成引擎,通过对人类主播脸部图像、动作的抓取,生成「AI 主播」的脸部动作特点;其次,通过人类主播大量语音数据的训练,并将韵律、情感等多维度的特征加入其中。
最后,通过图像、声音的多模态合成,最终形成一位 AI 主播。雷锋网在一篇分析里指出:
……AI合成主播的核心技术是搜狗分身技术。
搜狗分身技术是搜狗人工智能推出的多模态合成技术,可以基于少量真实音视频数据,快速迁移生成虚拟的分身模型。使用时输入一段文本,即可生成与真人无异的同步音视频。
但不管是新华社还是搜狗,都有意无意在避开一个事实:这个「AI 主播」到底没有「智能」。
答案也显而易见,没有。
从技术上看,「AI 主播」的技术含量的确不错,尤其是能在少量数据的支持下实现快速生成。但由于新闻这样的特定领域,所谓「主播」的工作定义就是播新闻,尤其在中国这个更特殊的新闻环境里,新闻机构的新闻内容更是严格把控,这也意味着,即便是人类主播,其自主性的概率也几乎为零,那这样一个「AI 主播」也无法具备自主决策的能力,也从根本上决定了这个「AI 主播」 的地位:不过是官方新闻里的虚拟形象罢了。
海外媒体的确很关注「AI 主播」,但他们同样看到了其背后隐藏的缺陷。比如《MIT 科技评论》高级编辑 Will Knight 在接受 CNBC 采访时表示,场景化的设置以及虚拟形象的创造,让这个「AI 主播」具备了很大欺骗性,真正的 AI 主播应该是这样的:
If it were to get a bunch of reports, take some phone calls and then reproduce it, that would be incredible, but that’s way beyond what machines can do
伦敦帝国学院 AI 机器人助理研究员 Ali Shafti 则进一步指出:
What actually creates those images and the movement of the lips and the voice of this anchor is using algorithms that are related to artificial intelligence. But to call this an AI anchor is slightly overselling it
自此,所谓「AI 主播」的噱头也就清理干净了。
过去几年,人工智能的红火,引发了全球范围的炒作,从巨头到创业者,从资本市场到大众媒体,无一例外投入到这场「事关未来人类命运」的运动中去,Elon Musk 的「人工智能邪恶论」、波斯特罗姆的「超级智能」,这些鼎鼎大名的公众人物成为贩卖焦虑的主力军,我曾多次在会员通讯和社交媒体上强调一点:是否封杀 Elon Musk,是判断一家人工智能是否专业的重要标准。
对普通消费者,面对一窝蜂的所谓「人工智能产品宣传」,又该如何判断呢?《MIT 科技评论》一位作者手绘了一张图,用于帮助大家分析某个产品是否使用了人工智能。

与消费者所面临的情况相比,企业需要解决的 AI 焦虑更多。过去的三年时间内,各个行业都感受到了 AI 带来的「压力」,不久前我曾在会员计划里分析了德勤的企业人工智能适应报告,其中就提到,尽管远期来看,每个行业都会从 AI 技术中获益,但每个行业的回报肯定是不一样的,尤其是在目前这个初级阶段。

那么,对于企业而言,是否应该选择人工智能呢?在日前举行的 VentureBeat 峰会上,一位企业家也手绘了一张图,试图帮助企业回答这个问题,如下图所示,这是一个看起来简单、却也是最难的企业发展方向思考框架。

以新闻行业为例,人工智能能带来价值吗?当然可以!《纽约时报》与 Google 合作,利用计算机视觉技术来分析《纽约时报》过去一百多年里积累的 500 多万张照片,通过将照片识别、归类,帮助人类记者在写稿时可以更好地利用历史照片。
另一个案例里,新闻网站 Quartz 也在将人工智能纳入新闻生产发行的多个环节。早先 Quartz 曾利用自然语言处理的技术,打造了一个聊天机器人,如下图所示,通过和用户的对话来推荐相应的新闻。

本周,Quartz 宣布成立 AI 工作室,更进一步推进机器学习在新闻生产中的应用,比如利用机器学习算法,帮助人类记者在复杂的材料、数据中寻找到基本线索,从而提升记者的工作效率。
但即便是 Quartz 也承认,机器学习并不适合每一个新新闻报道的制作,而且,对于未来一年的发展前景也非常保守,Quartz 计划在未来一年通过机器学习的帮助,完成 6 篇新闻报道。
上述这些宣传噱头与产业困境是中文人工智能领域每天都在上演的故事,不由得用这样一句烂大街的话来结尾:这是人工智能最好的时代,也是人工智能最坏的时代……