HTML::Parser

来源：互联网发布：淘宝培训有用吗编辑：程序博客网时间：2024/05/01 19:55

解析HTML。本例为找出一个html文本中的所有图片的地址。（即IMG标签中的src）

子程序start中的“$tag =~ /^img$/”为过滤出img标签。

如果换为“$tag =~/^a$/”，即是找出所有的链接地址。

#!/usr/bin/perl use LWP::Simple; use HTML::Parser; my $url = shift || "http://www.chinaunix.net"; my $content = LWP::Simple::get($url) or die("unknown url\n"); my $parser = HTML::Parser->new(          start_h => [&start, "tagname, attr"],          ); $parser->parse($content); exit 0; sub start {    my ($tag, $attr, $dtext, $origtext) = @_;       if($tag =~ /^img$/)    {          if (defined $attr->{'src'} )       {          print "$attr->{'src'}\n";          }    } }

0 0

HTML parser
html parser
HTML::Parser
HTML Parser 源代码
The Swing HTML Parser
HTML::Parser 简单解释
html parser 入门
Java HTML Parser应用
Html parser 访问好友
HTML::Parser 简单解释
android html parser
HTML and URL Parser
Python中的html.parser
HTML and URL Parser
HTML Parser 替代品 jsoup
HTML Parser
Jericho Html Parser初探
跨平台C++ Html Parser
importError:No module named 'urllib2' in Python 3.x
[Java笔试面试知识点自整理系列]Struts1与Struts2的区别
List::Util, max(), min(), sum(), maxstr(), minstr()...
Chrome扩展插件
说谢谢
HTML::Parser
关于Storm Tick
转：支持向量机: Kernel
Prime Distance（两次筛素）
Fibonacci趣题
Android 四大组件——内容提供器跨程序共享数据
Mail::Sender
使用typedef定义函数指针
ISCC 2016 逆向部分 writeup