"&#"开头转中文
来源:互联网 发布:php试题库管理系统 编辑:程序博客网 时间:2024/05/16 13:44
最近在写爬虫时遇到"&#"或者 "&#x"开头的 编码,在浏览器是可以正常打开的,但是爬取下来时却,显示 中国农业银行 在尝试了 utf-8 或者GBK,GB2312等等的编码都行不通的情况下, 在网上也找不到太多的资料,这让我很苦恼,而且百度搜索居然没法直接搜索符号,还是大谷歌好用, 通过http://tool.chinaz.com/tools/unicode.aspx 发现其实这个只是普通的unicode编码.但是却有不同的格式 比如\u开头的,"&#"或者"&#x"开头. 我们在 https://www.zhihu.com/question/21390312 找到了 问题的答案.
其实 \u 开头和 &#x 开头是一样的 都是16进制 unicode字符的不同写法,&# 则是 unicode字符的10进制的写法.知道这个之后我们写代码就容易多了.
public static String unicode2String(String unicode) { StringBuffer string = new StringBuffer(); if (unicode.startsWith("&#x")) { String[] hex = unicode.replace("&#x", "").split(";"); for (int i = 0; i < hex.length; i++) { int data = Integer.parseInt(hex[i], 16); string.append((char) data); } }else if(unicode.startsWith("&#")){String[] hex = unicode.replace("&#", "").split(";"); for (int i = 0; i < hex.length; i++) { int data = Integer.parseInt(hex[i], 10); string.append((char) data); } } return string.toString(); }
阅读全文
0 0
- "&#"开头转中文
- 中文转拼音开头以及五笔开头
- 关于解决'\u'开头的字符串转中文的方法
- mysql 查询中文首字母开头
- python3 把\u开头的unicode转中文,把str形态的unicode转中文
- 开头
- 开头
- 开头
- 开头
- 开头
- 开头
- 开头
- 开头
- 开头
- 怎样提取中文的开头字母(会提取每一个中文字的开头字母哟)
- JAVA中文件指针复位到文件开头
- Abap-Smartforms中如何去掉开头的中文文本
- 十六进制“\u”开头字符串的转码
- effective c++ Item 12: 拷贝一个对象的所有组成部分
- Ubuntu Docker安装及用户分组授权与Docker hub账号使用
- 8.数据库探测方法
- Android开发常见的第三方框架汇总
- zookeeper的watcher机制及其在集群管理(sheepdog)中的使用
- "&#"开头转中文
- 使用C语言制作简单的IP扫描器
- 9.搭建平台的探测方法
- HDU-2212 DFS
- Java 学习之IO类基础(一)
- 10.服务器系统探测
- BZOJ 1024-生日快乐(DFS)
- Oracle11g数据库Windows8.1系统安装配置图文教程
- unity 一些向量