泰达宏利中小盘伪造声音与面貌-悦智网

作品分类:全部文章 2015-02-21

伪造声音与面貌-悦智网

━━━━
1963年,美国总统约翰?泰达宏利中小盘F?肯尼迪在发表自己为访问达拉斯而准备的演讲前被刺杀。2018年3月,一家公司利用肯尼迪自己的声音片段进行合成索斯兽 ,再现了肯尼迪原本计划要发表的演讲。
谷歌、百度和Adobe等技术公司最近资助了根据演讲样本或影片片段制作音频或视频的工作天宫律舞。包括Voicery和Lyrebird在内的初创公司已经开发了可定制的人声(由专业配音演员录制的音频构建而成),可以通过编程说出任何内容。这些公司还发布了“自己动手”的软件,让你可以从1分钟的录音中合成自己的声音(或经过许可的其他人的声音)酒便利。构建这些程序的开源工具可以在Github上找到。
工作结果现在很令人信服,因此引发了对这些工具可能落入不法之徒手中的担忧。“在现在的情况下,认为你可以用这种技术欺骗一大群人的担忧并非毫无道理。”软件评论网站G2 Crowd的首席研究官迈克尔?福赛特(Michael Fauscette)说道。
有人可能会用合成的声音骗过经过训练以识别个人“声纹”的仪器,或是生成假视频用于勒索。制作世界领导人的声明中华战士,或是发布首席执行官的虚假视频,可能产生问题的速度比揭穿虚假视频的速度要快得多。
为了合成音频或视频,专家们主要关注两种依赖于机器学习的技术:文本到语音(TTS,通过带注解的录音生成类似人类的语音),以及风格转换(其中一段内容的风格,例如梵高1889年的画作《星夜》,被应用于照片或视频中)。
━━━━
Mitre公司的机器学习研究人员米克尔宗长青 ?罗德里格兹(Mikel Rodriguez)说,用来制作视频的算法是长期以来用于图像分类的技术的转折,其中人造神经元学习使用大量被称为滤波器的数值矩阵对图像中的像素赋值神纹战记。
传统上,这些程序使用这些数值来得出针对图像内容的结论——例如,一幅照片显示一条狗,或不显示一条狗黑眶蟾蜍。罗德里格兹解释道,在新版本中无敌铁骑士,吴幼坚“基本上你不再说‘给我答案,’而是说‘给我像素’刘姓的来源丹书铁卷。”
这类系统正在迅速改进。2017年12月,谷歌研究人员发表了一篇论文,描述了一种基于神经网络的TTS系统——Tacotron 2,它能够生成听起来很自然的语音,就像人们的录音一样。2018年2月,百度描述了Deep Voice 3,这是一种训练速度能够比原来的Tacotron版本更快的TTS系统。1个月之后,谷歌又发表了两篇论文景岛乐,旨在改善Tacotron传达类似于人类表达(如声调、重音和节奏)的能力,以匹配其合成语音的内容巨蛛怪。
这些公司认为,合成声音或视频所需的工具,也可能成为有价值的产品。合成肯尼迪演讲的公司CereProc已经为因病失声的人创建了100多种定制声音。Adobe在关于其beta TTS项目(称为VoCo)的一项声明中声称陈学亨,播客制片人或广告商可以使用VoCo对节目或配音进行最后编辑古龙酱文化园。
为了避免误解绿云仙路,创作者可在其制作的任何合成媒体中嵌入数字水印。但不能保证每个人都遵守同样的规则,并且也没有好的办法来独立判断视频或录音是否已遭篡改军嫂进化论 。“现在没有任何工具能保证一直有效孙之鸿 。” 罗德里格兹说道。
2017年12月,布莱斯?古德曼(Bryce Goodman)在神经信息处理系统会议上与他人共同组织了一个关于机器欺骗的研讨会小武凉皮,他担心这类程序会造成更大程度的信任缺失:“我认为,我们仍然处在这样一个时期:人们不一定从长远考虑他们研究或爱好的影响。”
作者:Amy Nordrum

IEEESpectrum
《科技纵览》
官方微信公众平台

往期推荐
脑部疾病的数字指纹
怎样成功经营一个移动众包项目
石油国家试图利用阳光生产淡水
意见反馈