获取网页编码的方法
来源:互联网 发布:淘宝联盟不能使用红包 编辑:程序博客网 时间:2024/06/05 21:35
获取网页编码的方法,参照了http://huwanting000.blog.163.com/blog/static/49925122201110297549998/里的方法。
private static String getCharset(HttpURLConnection urlConnection) {final Pattern char_pattern = Pattern.compile("<meta[^>]+charset=(.+?)\"");String strencoding = null;BufferedReader in = null;String type = urlConnection.getContentType();try {if (type != null) {int pos = type.indexOf("charset=");if (pos != -1) {strencoding = type.substring(pos + 8).trim();return strencoding;}}Matcher char_matcher = null;String line = null;in = new BufferedReader(new InputStreamReader(urlConnection.getInputStream()));while ((line = in.readLine()) != null) {char_matcher = char_pattern.matcher(line);if (char_matcher.find()) {String str = char_matcher.group(1);str = str.trim();strencoding = str;return strencoding;}}} catch (Exception e) {e.printStackTrace();} finally {urlConnection.disconnect();}if (strencoding == null) {strencoding = "GBK";}return strencoding;}
- 获取网页编码的方法
- python获取网页编码的方法
- 获取指定网页的源码,自动识别编码
- 获取网页字符编码的正则表达式
- Python获取网页编码的两种方法——requests、chardet
- 获取网页编码
- Java获取网页编码
- C#获取网页编码
- 爬虫获取网页编码
- 记录 -- C# 获取网页源码,判断编码格式方法
- 网页编码识别的方法 - charset
- 查看网页编码方式的通用方法
- 通过jericho获取网页编码
- uurlib.riquest获取网页编码
- 用IdHTTP获取UTF-8编码的网页
- VB Inet获取UTF-8编码的网页乱码
- asp.net 获取网页源文件的方法
- Android获取网页数据的方法总结
- ContentProvider的使用
- Struts1.x和Struts2.0的Action的区别
- SET Transaction Isolation Level Read语法的四种情况
- Android学习启动篇
- 句柄是什么?
- 获取网页编码的方法
- cannot open file "mfc42u.lib"
- SQL的优化与监视(SQL Server Profiler)
- 在android中使用jsoup解析页面链接
- org.apache.harmony.xml.ExpatParser$ParseException: At line 1, column 0: unknown encoding
- Ant找不到rt.jar
- Android Animation学习笔记
- android Icon 常用尺寸
- 获取正在显示的activity名称