Jsoup的clean

来源:互联网 发布:人工智能是什么意思 编辑:程序博客网 时间:2024/06/06 05:10

最近在学习Jsoup,发现里面有一个clean方法,该方法用来消除不受信任的HTML (来防止XSS攻击) ,至于什么叫xss跨站脚本,请参考http://publish.it168.com/2007/0704/20070704004201.shtml


Jsoup里面内置了一些常见的白名单规则,可以帮开发者转换html,以免html被植入恶意代码


String unsafe =   "<p><a href='http://example.com/' onclick='stealCookies()'>Link</a></p>";String safe = Jsoup.clean(unsafe, Whitelist.basic());

unsafe的html代码,只要点击该连接,将会触发恶意代码,比如获取用户的cookies,cookies一般会存储用户的用户名和密码

进行白名单过滤后,unsafe的html代码变成

// <p><a href="http://example.com/" rel="nofollow">Link</a></p>

原创粉丝点击