采集获取内容的方法

来源:互联网 发布:42u图腾网络机柜 编辑:程序博客网 时间:2024/04/30 09:39
<%
' ExpStr(vStr,vReg,sStr)
'
 返回正则匹配结果
'
'
 #####################################################
'
'
 vStr 为原始字符串
'
 vReg 为正则表达式
'
 sStr 为分隔符(尽量使用原始字符串中不会出现的字符串)
'
'
 #####################################################


Function ExpStr(vStr,vReg,sStr)
    
Dim Re,Matchs,Item,tStr
    tStr 
= ""
    
Set Re = New RegExp
    Re.Pattern 
= vReg
    Re.IgnoreCase 
= True
    Re.Global 
= True
    
If Re.Test(vStr) Then
        
Set Matchs = Re.Execute(vStr)
        
For Each Item In Matchs
            tStr 
= tStr & Item.Value & sStr
        
Next
        tStr 
= Split(Left(tStr,Len(tStr) - Len(sStr)),sStr)
    
End If
    
Set Re = Nothing
    ExpStr 
= tStr
End Function

%>
 以上是 在一段代码中,定义起始字符和结束字符,获取中间的代码段

以下是如何获取url里的代码方法
<%
Function getHTTPPage(url)
    
dim objXML
    
set objXML=createobject("MSXML2.XMLHTTP")
    objXML.open 
"post",url,false
    objXML.send()
    
If objXML.readystate<>4 then
        
exit function
    
End If
    getHTTPPage
=BytesToBstr(objXML.responseBody)
    
set objXML=nothing
    
if err.number<>0 then err.Clear 
End Function


Function BytesToBstr(body)
dim objstream
set objstream = CreateObject("adodb.stream")
    objstream.Type 
= 1
    objstream.Mode 
=3
    objstream.Open
    objstream.Write body
    objstream.Position 
= 0
    objstream.Type 
= 2
    objstream.Charset 
= "utf-8"  '编码方式 
    BytesToBstr = objstream.ReadText 
objstream.Close
set objstream = nothing
end Function
%
>
原创粉丝点击