本期导读:
- 学术:ICML 2019 看点、Alexa 如何理解同一种语言的地区差异;
- 观点:在「超级 AI」觉醒前,「弱智 AI」如何以人类的方式毁灭我们?
- 案例:平安银行的 AI 落地探究、脸部识别技术帮助儿童;
- 产品:以色列创业公司的芯片、日历日的智能等;
「弱智 AI」如何以人类的方式毁灭我们?
本期的「学术」部分提到 Adobe 研究人员通过深度学习模型来检测图片是否被 PS,这与 Adobe 长期以来在图片领域展现的强大修图能力形成了鲜明对照。事实上,Adobe 不仅在图片 AI 领域拥有深厚的技术积累,同时还在声音领域有不少创新。
2016 年,Adobe 在其年度 MAX 大会上展示了一个名叫 Project VoCo 的产品,这个工具可以让用户像修改图片一样地修改声音,用户也可以添加一些原本不属于音频文件的声音元素,一如使用 PS 修图时增加的图片元素一样。
这也意味着,由于潜在的被「PS」的可能性,声音记录变得不再可靠,或许是担心被滥用,这款工具在「惊艳」亮相后就再也没有出现过。
但人类对于声音的探索却还在继续。Google 旗下的 DeepMind 在 2017 年打造了一个名叫 WaveNet 的声音生成引擎,其结果非常接近真人发音,甚至在 DeepMind 的论文里,通过使用音乐文件来训练深度学习模型,还可以生成高保真的音乐片段。
本月,Facebook 展示了其在声音领域的进展,根据Verge 的报道,FB 研发的声音模型 Melnet,通过一个大概 450 小时 TED 演讲的数据集进行训练后,可以模拟比尔·盖茨等名人的声音。
当「眼见」与「耳听」都不可靠时,文字的信任也正在崩塌……
您的试读已经结束,请订阅「AI Insider」获取全文。
[rpt name=”ai-insider”]