给初学者:VB如何操作WEB页的浏览提交———五:如何对网页内容进行解析?
来源:互联网 发布:淘宝素材包 编辑:程序博客网 时间:2024/05/16 15:26
无聊中,写一段
当我们获取到网页以后,可以通过Document对象来获取其源文件:
假设在WebBrowser2中打开的网页,(如果是其他形式,例如上一篇中提到的获取后的对象,只需要修改WEBBROWER2为相应对象即可.)
WebBrowser2.Document.body.createtextrange().htmltext就是网页的源码了!怎么处理呢?如下:
思路:源码是一个字符串,我们将其分割即可,一般利用以下办法:
Dim mTextArr() As String '接受分割后的字符串
Dim mTextHtml as string '网页源码
mTexthtml=WebBrowser2.Document.body.createtextrange().htmltext
mTextArr() = Split(mText, vbcrlf) '按行分离,实际上,我们只需要将vbcrlf替换为"特征字符"即可简化操作,例如
'mTextArr() = Split(mText, "IMG height=12 alt=")
'到这里,我们就得到了被分离后的源代码,接下来历遍它,提取出我们需要的字符即可,这里介绍两个技巧
1、利用多个变量,来过滤无关字符,简化代码注意特征字符(分割符)的设置,适当的设置可以滤掉很多字符,如下面代码
mTextArr() = Split(mText, "IMG height=12 alt=")
2、利用INSTR函数识别字符串,
3、将结果保存到LIST控件,以便排序(直接设置按字符大小排序即可)
4、利用Right等函数进行格式化字符,如某格式化字符代码:
tmp2 = Right("00000000" & Left(mTextArr(i), InStr(1, mTextArr(i), "票") - 1), 8)
关于字符处理就写这些,
再写点其他的,某些情况下,一个页面(FORMS)里面有很多个FORM,导致我们打开指定页后发现没有需要的部分,这时你只需要打开你要浏览的页面,在你需要的部分最近的空白处点右键,选择"属性"即可看到真正的页面,有些情况下某部分页面无法直接显示,那么我们调用相应的页面内函数即可,例如百度贴吧里面的验证字符串,只有点了输入框才出现,实际上,我们只需要调用页面内的check_img等函数即可显示,另例:在前面的跑跑卡丁车那个示例中:
WBDocument.body.All("chkemail").onclick '以下两句同本句功能
'WBDocument.body.All("chkemail").Checked = 1
'WBDocument.parentWindow.execScript "showEmailOrNot(userReg)", "javascript"
也体现了如何显示出一个"隐藏"的项目:
或者调用相应事件或者调用相应JAVA程序.
没了,先写这些.
- 给初学者:VB如何操作WEB页的浏览提交———五:如何对网页内容进行解析?
- 给初学者:VB如何操作WEB页的浏览提交———二:自动填写更多内容
- 给初学者:VB如何操作WEB页的浏览提交———六:如何获取发生在网页内部的事件
- 给初学者:VB如何操作WEB页的浏览提交———八:获取网页上的链接、图片指向地址
- 给初学者:VB如何操作WEB页的浏览提交———三:学会拨号和断开,内容想发就发,别拿IP限制我!
- 给初学者:VB如何操作WEB页的浏览提交———一:在百度中自动搜索
- 给初学者:VB如何操作WEB页的浏览提交———九:给感觉看HTML代码去找对应对象费劲的朋友的工具
- 给初学者:VB如何操作WEB页的浏览提交———四:如果是已经打开的IE页怎么办?
- 给初学者:VB如何操作WEB页的浏览提交———七:题外话,关于小甜饼和不打开新IE窗口问题
- 给初学者:用VB写外挂 ———— 如何给外挂定义一组热键:红色警戒五项属性修改器VB版
- 如何对网页内容进行合理的分块分析
- WINCC6.2 VB脚本如何对变量进行位操作?
- WINCC6.2 VB脚本如何对变量进行位操作?
- [VB.NET]如何实现对 RichTextBox 内容的选定、复制?
- 也许他是对的 —— 给初学者的一封信
- 对提交给mysql语句内容进行防错处理
- 制作网页中的表单并在提交时对输入的内容进行检验
- 给初学者:用VB写外挂 ———— 实战五:虚拟人生2修改器
- 每日一句2007-01-09
- Java源程序编译为.exe文件
- 保护系统 用SVS为Windows穿上“层层”防弹衣
- Groovy in Action新鲜出炉!
- J2ME中文教程之J2ME技术概述
- 给初学者:VB如何操作WEB页的浏览提交———五:如何对网页内容进行解析?
- 在oracle中字段类型LONG的使用注意事项
- 投影机写码软件
- 常用的正则表达式
- Liferay 常用基础类 —— com.liferay.util.StringUtil
- 【转】怎么使用正则表达式
- java程序员必备书籍(转载)
- 写完程序一定要查询游标
- 再发布一个Vista Gadget-"墙纸精灵"