SgmlReader使用小记
来源:互联网 发布:sql注入的步骤 编辑:程序博客网 时间:2024/05/20 18:44
SgmlReader可以用来解析HTML/SGML,并能把不规范的Html转换成规范的XHtml
string SgmlTranslate(string input){var reader = new SgmlReader();reader.DocType = "HTML";reader.WhitespaceHandling = WhitespaceHandling.None;reader.CaseFolding = Sgml.CaseFolding.ToLower;reader.InputStream = new StringReader(input);var output = new StringWriter();var writer = new XmlTextWriter(output);writer.Formatting = Formatting.Indented;while (reader.Read()){if (reader.NodeType != XmlNodeType.Whitespace&& reader.NodeType != XmlNodeType.Comment)writer.WriteNode(reader, true);}writer.Close();return output.ToString();}
仿照官方给出的示例代码写的,
另外,更改了这一句,可使得生成的XML有缩进
reader.WhitespaceHandling = WhitespaceHandling.None
最后,记得一定要把Comment类型的NodeType排除了···
昨儿险些被一个注释害死
- SgmlReader使用小记
- 使用SgmlReader将HTML转换为合法的XML
- sgmlreader-1.8.4
- 利用SgmlReader来解析HTML
- 获取HTML网页内容SgmlReader
- NUnit使用小记!
- Display Tag使用小记
- TreeView使用小记
- Ubuntu使用小记
- VC6使用小记
- junit初步使用小记
- sudo使用小记
- Display Tag使用小记
- autoconf 使用小记
- Display Tag使用小记
- 使用ObjectDataSource 小记
- Display Tag使用小记
- AQtime使用小记
- cmd下如何运行.exe文件
- poj 1002 487-3279(基础模拟题)
- HDU 2553 N皇后问题 深搜-dfs
- 数据挖掘导论课后习题第二章习题,此篇不断更新中直到本章所有习题全部完成
- 获取HTML网页内容SgmlReader
- SgmlReader使用小记
- 黑马程序员-IO
- STM32 时钟分布
- 我的人生-感悟
- java 动态代理
- Codeforces Round #165 (Div. 2)(完全)
- CodeBlocks中文版使用手册
- 《Algorithms》第8章:NP完全问题 学习笔记
- eclipse cdt 优化设置