下一步,用拼音搜索屏蔽词?
来源:互联网 发布:qq for mac os10.8 编辑:程序博客网 时间:2024/05/01 10:34
最近,国外的Twitter、国内的饭否相继遭墙,与此相似的一些网站也都组织调整。
比如“做啥网”表态准备上线搜索屏蔽词功能,就是类似 baidu 和 g.cn 的“据当地法律法规和政策,部分搜索结果未予显示。”
这我让回忆起以前逛论坛时看的帖子,很多论坛(例如DVBBS)都自带屏蔽敏感词功能,如果帖子中有词组与后台敏感词数据库匹配得上,就用‘*’来代替。我尤记得周杰伦的《听妈妈的话》被系统自动改成《听妈**话》。
但他们也提到:现在的网友也很厉害,会运用谐音啊或者自己创造一些词语,婉转表达敏感信息。理论上需要每条信息人工审核后才能发布,不过限于人力,目前“做啥”还没有准备这样做。
这我在想起很多年前用WinTC时里面自带了一个点阵字模工具,除了能将一个汉字转换成点阵字模,还会用这个汉字的拼音来做数组名。当时很好奇,就去找了一点相关了资料,才知道像GBK、Unicode等编码本身就是和拼音相关的。撇开这些不算,即使直接对65536个汉字建立映射表,假设汉字2个字节,拼音最长的zhuang算6个字节,整个映射表也不到1MB的空间。
所以,为相应有关部门的号召,也许不久的将来论坛、微博等会采用拼音来搜索敏感词汇的工具来。到时候“草泥马”此类神兽通通都得贴上和谐标签。
版权声明
本博客所有的原创文章,作者皆保留版权。转载必须包含本声明,保持本文完整,并以超链接形式注明作者“redraiment”和主站点上的本文原始地址。
我的邮箱,欢迎来信(redraiment@gmail.com)
我的玩具箱(子清行)
我的百度空间(梦婷轩)
- 下一步,用拼音搜索屏蔽词?
- 拼音搜索
- 拼音搜索
- 拼音搜索
- android 拼音搜索
- SQL 拼音搜索函数
- 下一步
- 下一步
- 下一步
- 下一步
- 屏蔽百度爬虫搜索
- jquery拼音转汉字搜索
- iOS_21团购_拼音搜索
- 如何屏蔽百度搜索推广
- C#将汉字转换为拼音(按照拼音搜索)
- Android 通讯录按拼音分组显示,以及拼音搜索
- C#将汉字转换为拼音(按照拼音搜索)
- iOS 中文输入屏蔽拼音获取高亮部分
- C# 操作 Excel 如何设置格式
- .Net三层架构
- 用户 'NT AUTHORITY/NETWORK SERVICE' 登录失败。
- DHTMLX Tree示例
- mysql导出数据
- 下一步,用拼音搜索屏蔽词?
- 2009.7.16
- GNU Autotools的研究
- 用户sa登录失败,该用户与可信sql server连接无关联
- 局域网联机一起过关的游戏
- 摘一些GIS地图的基础知识(学习学习)
- 2008年诺贝尔和平奖得主阿赫蒂萨里的主要成就
- struts1.x环境配置及登陆例子
- Linux实验