你的福利是咋被百度云盘给和谐的

来源:互联网 发布:js 二维数组push数据 编辑:程序博客网 时间:2024/04/28 13:48

从快播案到今,百度云盘也被各路淫秽色情内容所攻占,从而被大量群众所举报,后经有关部门调查认为举报属实,责令百度进行整改。

    

    百度号称加强了审核力度,力争创建绿色网上环境,确实也呈现出了一定的效果。那么问题就来了!!有没有人像博主一样开始感到好奇,百度是如何审核用户上传的文件、视频等的呢?不至于用耗时又耗力的人工审核吧?

    通过博主不断的网上搜集、调查,当然也缺不了牛逼的各路网友,现整理出几种可行性比较高的审核方式:

(1)违规关键字分析、比对。这是最简单的一种方式,通过关键字,能将一些明显的违法、涉黄的内容直接删选出来干掉。自然这个做好,能净化一半的云盘网络。

(2)MD5比对。就像人类的DNA一样,文件的MD5有较强的识别性,但前提是网盘得事先建立涉黄文件的MD5数据库,之后可将用户上传的文件自动进行MD5比对。

(3)违规文件的hash值比对。具体方式其实和(2)差不多,只是进行比对的值不同而已。

(4)特定帧图像分析。将视频自动截取一部分的缩略图进行比对,鉴别图片是否违法,进而鉴别该视频是否违法。

(5)定点分析访问量高的文件。因为访问量高是涉黄的特征之一,这时候加入人工鉴别作用会事半功倍。

    不过话又说回来,是不是将视频压缩了再上传可以破除以上部分限制呢?因为压缩完了的关键字、hash值啥的肯定是变了。(⊙o⊙)…额,博主没有试过,有兴趣的就......

    

欢迎关注有点料的:懂点IT不丢人。

0 0
原创粉丝点击