PhotoDNA的不良图片检测技术

来源:互联网 发布:上海华师大网络教育 编辑:程序博客网 时间:2024/04/30 17:54

PhotoDNA是微软的研发团队和达特茅斯学院的一个研发小组共同开发的,这里面使用了一种名为“robust hashing”的技术,可以精确识别出经过编辑的图片。

 

目前PhotoDNA的主要用来识别互联网上的色情图片,已经在Facebook及微软的多款产品上得到应用。PhotoDNA利用到了类似杀毒软件的病毒特征库的机制来识别色情图片。据微软的测试,识别率达到99.7%20亿次检测中仅有一次误报。

 

不过PhotoDNA并不是通过图片的内容特征来判定图片是否是色情图片,而是提取图片的数字指纹,并将该指纹与其服务器中的色情图片的数字指纹进行比对。因此PhotoDNA从理论上讲只能防止色情图片的二次传播。不过还好,毕竟互联网上传播的色情图片大部分都是二次或多次传播;即便是原创,色情图片也大都是那几种类型,只要服务器上有足够多的色情图片数据,估计原创的也会跟库里面已有的指纹比较相似;更何况服务器还会不断更新。

 

从目前现有的资料上还不能知道PhotoDNA采用的指纹是由哪些特征组合来的。

0 0