列出一个HTML文件的所有标签
来源:互联网 发布:大数据为什么在贵阳 编辑:程序博客网 时间:2024/04/30 22:04
libxml 列出一个HTML文件的所有标签。
#include <cstdio>
#include <libxml/HTMLparser.h>
#include <libxml/tree.h>
#include <iostream>
#include <cstring>
using namespace std;
static void print_element_names(htmlNodePtr a_node)
{
htmlNodePtr cur_node = NULL;
for (cur_node = a_node; cur_node!=NULL; cur_node = cur_node->next) {
printf("node type: Element, name: %s\n", cur_node->name);
print_element_names(cur_node->children);
}
}
int main(int argc, char **argv) {
htmlDocPtr doc;
htmlNodePtr root_node;
doc = htmlReadFile(argv[1], NULL, 0);
root_node = xmlDocGetRootElement(doc);
print_element_names(root_node);
xmlFreeDoc(doc);
xmlCleanupParser();
return 0;
}
编译 g++ `xml2-config --cflags --libs` dom_html_libxml_test.cpp
文出 http://zh-cn.w3support.net/index.php?db=so&id=807171
libxml 其他介绍
http://www.blogjava.net/wxb_nudt/archive/2008/01/29/161340.html
- 列出一个HTML文件的所有标签
- 列出一个文件夹下面的所有文件
- 列出一个目录下的所有文件
- 算法:递归列出一个目录下面的所有文件
- Java_IO_列出一个目录的所有文件和目录
- 1.1 列出一个目录下的所有文件
- 自制JS小工具:列出指定HTML标签的所有属性和事件
- 01列出一个目录中的所有文件
- 列出一个目录中的所有文件
- hbase 列出一个表所有的rowkey
- 列出某个目录下的所有文件
- 列出磁盘下的所有文件
- 列出目录下的所有文件
- 递归列出目录下的所有文件
- python列出目录下所有的文件
- 列出webroot下所有的jsp文件
- C++ 列出文件夹下的所有文件
- java列出目录下的所有文件
- delphi 中实现当期日期 减去 若干小时的方法
- spring中的Bean配置注意的地方
- Solaris quota命令
- uvaoj 488 - Triangle Wave
- 用汇编编写DOS下的内存驻留程序
- 列出一个HTML文件的所有标签
- ClojureScript通过Javascript将Clojure引入到浏览器端
- 使用"adb install"命令无法在真机上安装Google maps demo的解决办法
- ZK Server Push实现数据主动推送
- Linux内核定时器
- 分析mtk6516如何加入自己的驱动
- 用java语言解释爱情
- 创建TreeView控件,响应NM_CLICK消息得到当前点击的节点的信息(SDK版本)
- 在VMware中为RedHat Enterprise Linux 5安装VMware tools