如何防止页面中的敏感信息被提取

来源:互联网 发布:58淘宝客服兼职靠谱吗 编辑:程序博客网 时间:2024/05/02 02:51

公布到网页上的Email经常会被一些工具自动提取,一些非法用户就会利用所提取的Email大肆发送垃圾邮件。这些工具大多都是查找链接中“mailto:”后面的信息或是“@”前后的信息来达到提取Email的目的。我在看DotNetNuke(以下简称DNN)的源代码时发现了一个不错的方式来防止这些信息被自动提取。

 

在DNN中有这么一段函数(Globals.vb中):
Public Function CloakText()Function CloakText(ByVal PersonalInfo As String) As String

    If Not PersonalInfo Is Nothing Then
        Dim sb As New StringBuilder

        @# convert to ASCII character codes,将字符串转换成ASCII编码字符串形式
        sb.Remove(0, sb.Length)
        Dim StringLength As Integer = PersonalInfo.Length - 1
        For i As Integer = 0 To StringLength
            sb.Append(Asc(PersonalInfo.Substring(i, 1)).ToString)
            If i < StringLength Then
                sb.Append(",")
            End If
        Next

        @# build script block
        Dim sbScript As New StringBuilder

        sbScript.Append(vbCrLf & "<script language=""javascript"">" & vbCrLf)
        sbScript.Append("<!-- " & vbCrLf)
        @#fromCharCode 方法:从一些 Unicode 字符值中返回一个字符串。
        sbScript.Append("   document.write(String.fromCharCode(" & sb.ToString & "))" & vbCrLf)
        sbScript.Append("// -->" & vbCrLf)
        sbScript.Append("</script>" & vbCrLf)

        Return sbScript.ToString
    Else
        Return Null.NullString
    End If

End Function

该段代码先将需要加密的信息转换成ASCII编码字符串形式,然后用javascript中的document.write方法写到页面。

我测试了以下效果,还不错。大家也可以试试。
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<title>测试信息加密</title>
</head>

<body>
可以被提取的链接:<a href="aaa@163.commailto:aaa@163.com">aaa@163.com</a><br>
不能被提取的链接:
<script language="javascript">
<!--
   document.write(String.fromCharCode(60,97,32,104,114,101,102,61,34,109,97,105,108,116,111,58,120,120,120,64,116,111,109,
46,99,111,109,34,62,120,120,120,64,116,111,109,46,99,111,109,60,47,97,62))
// -->
</script>
</body>
</html>