关于 Nutch 的一个问题: 中文乱码
来源:互联网 发布:淘宝网如何修改评价 编辑:程序博客网 时间:2024/05/17 13:42
关于 Nutch 的一个问题: 中文乱码
网址:http://www.dbanotes.net/web/nutch_garbled_code.html
很多朋友都遇到 Nutch 0.6 输入中文会出现乱码的问题。这个问题其实和 Nutch 关系不大,主要原因是使用 Tomcat 5.0 的问题。解决办法是修改 Tomcat 的 server.xml 文件的 connnector:
<Connector port="8080"
maxThreads="150" minSpareThreads="25" maxSpareThreads="75"
enableLookups="false" redirectPort="8443" acceptCount="100"
connectionTimeout="20000" disableUploadTimeout="true"
URIEncoding="UTF-8" useBodyEncodingForURI="true" />
其中 URIEncoding="UTF-8" useBodyEncodingForURI="true" 是需要新增的。否则搜索栏输入的字符默认编码将不能正确解析。
注:这个小 Hint 本来是写在站点的首页页面的,今天把他整理一下放到这里.
BTW: "乱码"用英语如何翻译?
- Scrambled code/characters
- Illegible contents/characters/codes
- Truncated words/contents
- Garbled character/code 最后一个似乎更好
本页地址:
- 关于 Nutch 的一个问题: 中文乱码
- 关于nutch 网页快照的中文问题
- 关于中文乱码的问题
- 关于中文乱码的问题
- 关于中文乱码问题
- 关于中文乱码问题
- 关于中文乱码问题
- 关于jsp中文乱码的问题
- 关于mount中文显示乱码的问题~~
- 关于JSP页面中文乱码的问题
- 关于中文参数乱码的问题
- 关于中文乱码问题的一些解决方案
- 关于解决中文乱码问题的总结
- 关于QT的中文乱码问题
- 关于TOMCAT中文乱码问题的总结
- 关于mysql中中文乱码的问题
- 关于web开发的中文乱码问题
- cygwin中关于中文乱码的问题
- 你把 English 读成了什么?
- WEBLOGIC性能参数
- jsp+sql2000 使用top分页
- 化镜无组件上传的类
- 存储过程分页,这段代码太复杂了。不过值得借鉴
- 关于 Nutch 的一个问题: 中文乱码
- XP SP2对raw socket所做的改动
- 利用IP组播技术传输视频信息
- 去除XP SP2对raw socket的一些限制
- jsp+sql2000 使用绝对定位分页
- BREW的Widget实现分析(一)
- 简单选择排序
- 红帽子Linux 9.0简体中文版 下载地址
- 跟我一起写 Makefile