关于xml解析错误的杂记
来源:互联网 发布:头发毛躁 知乎 编辑:程序博客网 时间:2024/05/16 18:49
前段时间生成rss格式的文件,发现明明看似正确的文件,却就是解析错误。
编辑器打开xml文件,发现一些小方格的奇怪字符,删除这个字符了发现就可以正确解析了!
网上查了一下,原因如下:
根据W3C的标准,以下16进制的字符是不被允许出现在XML文件中的,即使放在<![CDATE[]]> 中,也不能幸免遇难,会引起 Solr 对 XML 处理的错误,从而导致创建索引失败,所以在提交数据之前把这些字符过滤掉。\x00-\x08, \x0b-\x0c, \x0e-\x1f在 PHP 可以用这个方法 return preg_replace(’@[\x00-\x08\x0B\x0C\x0E-\x1F]@’, ”, $string);另外,在给 Solr 提交数据的时候要注意提交的 xml 文件/数据大小,如果太大可能会出现各种莫名奇妙的问题,Solr 会说你的 XML 格式不正确,缺少闭合标签,解析不了。
最后,总结一下方法:
function toXmlStr($str){ return preg_replace("/[\\x00-\\x08\\x0b-\\x0c\\x0e-\\x1f]/",'',$str);}
- 关于xml解析错误的杂记
- 关于XML的解析
- 关于XML的解析
- 关于XML的解析
- xml解析时的错误
- xml解析出现的错误
- 关于XML解析错误后返回error解析
- 关于xml的错误经验
- 关于xml的解析方法
- 关于XML解析的测试
- android关于xml的解析
- 关于xml解析的资料
- android 用pull解析xml的错误~!!
- 关于XML的解析的问题
- XML解析错误
- DWR XML解析错误
- 解析xml文件错误
- dom4j解析xml错误
- 多线程示例代码
- Win32 API编程笔记(转)
- java调用SAP RFC函数 2
- POJ 3608 Bridge Across Islands(两个凸包最近距离,旋转卡壳)
- IOS 自定义 UIDatePicker 背景图片
- 关于xml解析错误的杂记
- linux下设置Tomcat自启动
- 基于C/S的网盘设计(JAVA)
- Android 十大调试方法
- jquery插件的写法
- js、document.createElement()的用法
- struts2 iterator标签详解
- ASP.NET常见模块:在线文件管理模块的设计与开发
- java读取propertie配置文件