随着AI语音技术的迅猛发展,如何在确保技术创新的同时规范Deepfakes成为行业关注的焦点。ElevenLabs的联合创始人兼CEO Mati Staniszewski近日在接受《大西洋月刊》采访时,提出了通过给合成声音添加数字水印来应对音频Deepfakes的设想,他强调这将是一场技术与欺诈之间的“猫鼠游戏”。
ElevenLabs自去年推出测试版以来,凭借其在AI生成逼真音频剪辑方面的技术实力,一跃成为价值亿美元的公司。该公司提供的服务包括文本转语音配音、29种语言的配音以及声音克隆等,用户在过去一年内已经生成了超过100年的音频内容。然而,随着技术的广泛应用,立法者和公众对这项技术可能带来的滥用风险表示担忧。
AI的进步与电话诈骗的增加有着密切关系,诈骗者利用声音克隆技术冒充他人进行欺诈活动,给社会带来了严重的安全隐患。拜登政府的人工智能主管布鲁斯·里德甚至表示,“声音克隆”是他夜不能寐的问题之一。去年,有4chan用户利用ElevenLabs的工具生成了名人Deepfakes视频,内容充斥着种族主义和跨性别歧视,引发了广泛的社会关注。
然而,Staniszewski对ElevenLabs的技术持乐观态度。他认为,这项技术不仅可以促进患有神经退行性疾病如肌萎缩侧索硬化症(ALS)的患者在失去说话能力后依然能够用自己的声音交流,还有助于跨越文化和语言障碍进行沟通。纽约市市长埃里克·亚当斯就曾利用ElevenLabs的技术,用普通话、意第绪语和海地克里奥尔语拨打电话,与更多非英语母语的市民建立联系。
为了充分发挥这一潜力并防止欺诈行为的发生,Staniszewski提出了对AI合成声音进行数字水印处理的设想。他认为,这是“真正的解决方案”,通过给合成声音添加特定的数字标记,人们可以轻松地识别出真假声音。这一技术不仅可以保护用户的隐私和安全,还可以为执法机构提供有力的证据来打击欺诈行为。
Staniszewski强调,这项技术的实现需要行业内外的广泛合作。ElevenLabs已经与包括AI、Anthropic、Google和Meta在内的多家人工智能公司签署了一项协议,共同打击2024年选举中的Deepfakes。他呼吁更多的公司和组织加入到这一行列中来,共同维护一个安全、可信的AI环境。
AI旋风认为,Staniszewski的设想为应对音频Deepfakes挑战提供了新的思路。通过给合成声音添加数字水印,不仅可以提高人们识别真假声音的能力,还可以为打击欺诈行为提供有力的技术支持。然而,这一技术的实现需要行业内外的广泛合作和共同努力。我们期待看到更多的公司和组织加入到这一行列中来,共同为AI技术的发展和应用贡献智慧和力量。