混进iOS 14.3!网友爆出苹果CSAM检测技术出现哈希冲突

混进iOS 14.3!网友爆出苹果CSAM检测技术出现哈希冲突
文章图片
新智元报道
来源:Reddit
编辑:Priscilla好困
【新智元导读】苹果计划推出在iOS15中应用的CSAM检测系统备受争议 。 近日 , 一位Reddit用户发现CSAM算法竟被悄悄地「埋在了」iOS14.3里 。 而算法公开几小时后 , 一位英特尔实验室的研究员就发现了其存在的缺陷:哈希冲突 。
苹果偷偷将CSAM检测技术算法放进iOS14.3里!
前段时间 , 苹果宣布计划推出CSAM检测技术 , 能够扫描所有存储在iCloud上的照片 , 找出符合虐待儿童、儿童色情内容的照片(CSAM) 。
该功能本该在今年9-10月份上线 , 却被Reddit网友发现CSAM检测技术的算法NeuralHash已经混进了现在的系统里 。
即便苹果的初衷是好的 , 但在大多数人眼里 , 苹果是在监视用户的一举一动 。
混进iOS 14.3!网友爆出苹果CSAM检测技术出现哈希冲突
文章图片
新闻一发布 , GitHub上就有超过6000多家组织和个人签署联名信 , 强烈谴责苹果这项侵犯个人隐私的新技术 。
混进iOS 14.3!网友爆出苹果CSAM检测技术出现哈希冲突
文章图片
而德国有关部门也致信库克 , 希望苹果能够重新考虑CSAM检测计划 。
但现在苹果却想要试图蒙混过关了吗?!
网友发现算法早已存在
昨日 , Reddit用户AsuharietYgvar表示:
在iOS14.3里 , NeuralHash就已经隐藏在混淆类名里了 。
Ygvar对隐藏的API进行了一些挖掘和逆向工程 , 成功将MobileNetV3模型导出到ONNX 。
还在Python中重建了整个NeuralHash算法 , 甚至可以在Linux上测试NeuralHash 。
混进iOS 14.3!网友爆出苹果CSAM检测技术出现哈希冲突
文章图片
苹果的NeuralHash是一种基于神经网络的图像感知哈希方法 , 并且可以不受对图像大小的调整和压缩的影响 。
混进iOS 14.3!网友爆出苹果CSAM检测技术出现哈希冲突
文章图片
https://github.com/AsuharietYgvar/AppleNeuralHash2ONNX
哈希算法的步骤:
将图像转换为RGB 。
混进iOS 14.3!网友爆出苹果CSAM检测技术出现哈希冲突】调整图像大小为360x360 。
将RGB值归一化为[-1,1]范围 。
对NeuralHash模型进行推理 。
计算96x128矩阵与所产生的128个浮点的向量的点积 。
对产生的96个浮点数向量应用二进制步骤 。
将1.0和0.0的向量转换为比特 , 得到96位二进制数据 。
AsuharietYgvar则列举了这就是苹果所采用的算法的证据 。
混进iOS 14.3!网友爆出苹果CSAM检测技术出现哈希冲突
文章图片
首先 , 模型文件的前缀是NeuralHashv3b- , 与苹果的文件中的术语相同 。
(https://www.apple.com/child-safety/pdf/CSAM_Detection_Technical_Summary.pdf)
其次 , 苹果对算法描述的细节也与Ygvar的发现相同:
混进iOS 14.3!网友爆出苹果CSAM检测技术出现哈希冲突
文章图片
「第二 , 描述符被传递到一个哈希方案 , 将N个浮点数转换为M位 。 这里 , M远远小于这里 , M远远小于表示N个浮点数所需的比特数 。 」
从下面这两段代码中可以看到 , N=128 , M=96 。
混进iOS 14.3!网友爆出苹果CSAM检测技术出现哈希冲突
文章图片
混进iOS 14.3!网友爆出苹果CSAM检测技术出现哈希冲突
文章图片
此外 , 如果调整图片的大小或压缩图片 , 这个脚本产生的哈希值几乎没有变化 , 这又和苹果的文件中描述的一样 。
值得注意的是 , 不同设备生成的哈希值会有几位的差异 。
这是由于神经网络基于浮点计算 , 精度在很大程度上取决于硬件 。