本文转自:浙江日报浙江新闻客户端见习记者 涂佳煜 通讯员 柯溢能我们的一段声音|浙大推出新型语音信息掩蔽技术 量“声”定制反窃听系统

本文转自:浙江日报
本文转自:浙江日报浙江新闻客户端见习记者 涂佳煜 通讯员 柯溢能我们的一段声音|浙大推出新型语音信息掩蔽技术 量“声”定制反窃听系统】浙江新闻客户端见习采访人员涂佳煜通讯员柯溢能
我们的一段声音 , 究竟包含着多少有关个人的信息?
交谈的内容 , 可能透露出说话者生活细节、个人隐私;声音本身作为人最基本的自然生物特征 , 能够标记身份 , 用于声纹识别;说话的音色、语调、停顿 , 以及更多细微的声音特征 , 还可能揭示出一个人的性格、心情、习惯等等 , 尤其在人工智能的介入下 , 用声音创建一份“个性档案” , 已不再是天方夜谭 。
然而 , 互联网时代 , 无处不在的智能设备时常如同“隔墙有耳” , 未经允许收集用户语音信息的案例也层出不穷 。 如何保护好我们的声音信息安全?一款有效的防窃听设备 , 或能筑起第一道防线 。
近期 , 浙江大学网络安全学院任奎教授团队设计了一款基于人类语音结构和超声波隐蔽传输的语音防窃听系统“InfoMasker” , 相关论文被国际顶级信息安全会议NDSS录用 。 研究团队成员 , 论文第一作者、浙大网安学院博士生黄鹏 , “百人计划”研究员巴钟杰和求是科创学者薛峰共同向我们介绍了这项成果 。
“InfoMasker防窃听的方式很容易理解 。 ”黄鹏告诉采访人员 , “就是往麦克风里注入一种干扰噪声 , 使得设备即便录了音 , 也无法从中获取任何关于用户的信息 。 ”
本文转自:浙江日报浙江新闻客户端见习记者 涂佳煜 通讯员 柯溢能我们的一段声音|浙大推出新型语音信息掩蔽技术 量“声”定制反窃听系统
文章图片
InfoMasker的工作场景
注入干扰噪声是反窃听常用的手段 。 不过 , 团队在设计InfoMasker时希望达成两个现有设备无法“两全”的目标:第一 , 是在防窃听的同时确保用户的“无感” , 第二 , 则是让注入的噪音无法被后期“剥离” 。
巴钟杰解释 , 主流的干扰手段大多是发射一些高能量噪声将原声盖过去 , 这种“简单粗暴”的方式存在不少弊端:如果发射的是白噪音 , 就好比播放了一段嘈杂的背景音乐 , 必然打扰到用户正常交谈;如果发射的是高能量超声波 , 不仅对设备能量支持提出了很高的要求 , 还可能对人体健康产生不利影响 。
“此外我们测试了市面上很多款产品 , 发现人工智能算法都能把注入的噪音剥离 , 这样一来 , 干扰就是无效的 。 ”黄鹏说 。
为了解决这些问题 , 一方面 , 团队仍选择以超声波作为载体 , 把噪声调制到人耳听不见 , 但能够被麦克风自动解调出来的超声波频率范围上 。 另一方面 , 他们进一步设计了一款新型的基于音素的噪声干扰方案 。
本文转自:浙江日报浙江新闻客户端见习记者 涂佳煜 通讯员 柯溢能我们的一段声音|浙大推出新型语音信息掩蔽技术 量“声”定制反窃听系统
文章图片
InfoMasker的工作流程
音素 , 是根据发音动作划分出的最小的语音单位 , 比如 , 普通话的音素一般来说就是汉字的声母和韵母 。 在语音识别技术中 , 计算机需要将每帧声音组合为音素 , 再组合为字词 。 试想 , 如果能将音素打乱 , 计算机就无法将其组合、匹配为具有含义的单位 , 声音便失去了意义 。
沿着这一思路 , 团队制作出了一种噪音 , 它能用其他音素覆盖录音中原有的音素 , 或者在两个音素间插入干扰项 , 打乱录音人声的语音结构 , 使窃听到的语音信号无法被正常分析 。
更巧妙的是 , 干扰音素是依据用户的声音量“声”定制的 。 使用者只需要录制5秒左右的音频进行注册 , 系统就可以提取用户的音色 , 基于注册语音进行语料的匹配与增广 , 构建高效的音素噪声 。