HTML::Parser
来源:互联网 发布:淘宝培训有用吗 编辑:程序博客网 时间:2024/05/01 19:55
解析HTML。本例为找出一个html文本中的所有图片的地址。(即IMG标签中的src)
子程序start中的“$tag =~ /^img$/”为过滤出img标签。
如果换为“$tag =~/^a$/”,即是找出所有的链接地址。
#!/usr/bin/perl use LWP::Simple; use HTML::Parser; my $url = shift || "http://www.chinaunix.net"; my $content = LWP::Simple::get($url) or die("unknown url\n"); my $parser = HTML::Parser->new( start_h => [&start, "tagname, attr"], ); $parser->parse($content); exit 0; sub start { my ($tag, $attr, $dtext, $origtext) = @_; if($tag =~ /^img$/) { if (defined $attr->{'src'} ) { print "$attr->{'src'}\n"; } } }
0 0
- HTML parser
- html parser
- HTML::Parser
- HTML Parser 源代码
- The Swing HTML Parser
- HTML::Parser 简单解释
- html parser 入门
- Java HTML Parser应用
- Html parser 访问好友
- HTML::Parser 简单解释
- android html parser
- HTML and URL Parser
- Python中的html.parser
- HTML and URL Parser
- HTML Parser 替代品 jsoup
- HTML Parser
- Jericho Html Parser初探
- 跨平台C++ Html Parser
- importError:No module named 'urllib2' in Python 3.x
- [Java笔试面试知识点自整理系列]Struts1与Struts2的区别
- List::Util, max(), min(), sum(), maxstr(), minstr()...
- Chrome扩展插件
- 说谢谢
- HTML::Parser
- 关于Storm Tick
- 转:支持向量机: Kernel
- Prime Distance(两次筛素)
- Fibonacci趣题
- Android 四大组件——内容提供器 跨程序共享数据
- Mail::Sender
- 使用typedef定义函数指针
- ISCC 2016 逆向部分 writeup