Nutch中的乱码完全解决方案
来源:互联网 发布:帝国cms 全站搜索模板 编辑:程序博客网 时间:2024/06/08 09:34
页面乱码与Tomcat的配置有关。
<Connector port=”8080″
maxThreads=”150″ minSpareThreads=”25″ maxSpareThreads=”75″
enableLookups=”false” redirectPort=”8443″ acceptCount=”100″
connectionTimeout=”20000″ disableUploadTimeout=”true”
URIEncoding=”UTF-8″ useBodyEncodingForURI=”true” />
缓存乱码的解决:修改Cache.jsp中的代码行
String encoding = (String) metaData.get("CharEncodingForConversion"); if (encoding != null) { try { content = new String(bean.getContent(details), encoding); } catch (UnsupportedEncodingException e) { // fallback to windows-1252 content = new String(bean.getContent(details), "windows-1252"); } } else content = new String(bean.getContent(details)); } %> Content =new String(bean.getContent(details),"GBK"); 注意:经过以上处理,部分UTF-8的页面依然会出现乱码。要想彻底解决,需要将Content 内容先做判断,如果Meta标签中有charset="utf-8"标志,则 Content =new String(bean.getContent(details),"utf-8"); 经过以上处理,基本上不会有乱码的缓存页面存在。
- Nutch中的乱码完全解决方案
- java中文乱码完全解决方案
- 发布程序中文乱码完全解决方案
- Ubuntu中乱码完全解决方案(整理)
- JSP项目中文乱码完全解决方案
- Jmeter响应中的乱码解决方案
- nutch-乱码解决
- nutch网页快照乱码解决方法
- 在LINUX AS3 下安装 oracle9i 中文乱码完全解决方案
- AJAX传输数据的中文乱码之完全解决方案
- [原创]CAS 3.2 中文帐户乱码问题完全解决方案
- Visual Studio utf-8 代码 中文乱码完全解决方案
- JavaEE应用中MySQL中文乱码完全解决方案
- Asp.net utf-8 编码中文乱码完全解决方案
- JavaEE应用中MySQL中文乱码完全解决方案
- QT发布程序中文乱码完全解决方案 Qt for Windows
- Qt发布程序中文乱码完全解决方案 Qt for Windows
- AJAX传输数据的中文乱码之完全解决方案
- 著名网站系统架构设计
- Delphi application Send Data to C# application
- 1、将数组中的元素再定义为特殊的名字方便程序中使用
- 关于谷歌云计算
- 计算机专业毕业生如何面对就业寒冬
- Nutch中的乱码完全解决方案
- Breaking Changes for ASP.NET 2.0 applications running in Integrated mode on IIS 7.0
- qmail-smtpd run script
- 浅析Hibernate下数据批量处理方法
- java手机机型对应表
- 1、Matlab一维数组合并学习
- JSR规范大全
- 关于各种牌子手机的字体问题
- Perl的特殊符号