python字符编码的判断
来源:互联网 发布:网络七层协议工作原理 编辑:程序博客网 时间:2024/05/16 18:26
最近需要使用字符串来解决一些问题,中间牵涉到使用url,而url的编码方式往往又是不同于平时所使用的编码方式的,这里就需要检测一下url所使用的编码方式,然后将url的编码方式转换为所需要的编码方式,然后再参与后续的运算
使用python自带的字符串编码方式判断函数isinstance(字符串,编码方式),可以判断字符串string是否为给定的编码方式。
也可以使用python的一个常用的模块chardet来进行检测,使用方法也是很简单的,实地操作了一下感觉还是很不错的
chardet的安装也是很简单的:pip install chardet即可
直接上代码
# !/usr/bin/python
#-*-coding:utf-8-*-
import chardet
def detection(path = 'dataset/black.txt'):
f = open(path)
f_list = f.readlines()
result = []
for url in f_list:
url_dict = {}
url_dict = chardet.detect(url)
if url_dict['encoding'] != 'ascii':
print url, url_dict
result.append(url)
print 'result is :', result
#print url, chardet.detect(url)
detection('dataset/all.txt')
学习后感觉很棒
0 0
- python字符编码的判断
- Python 字符编码判断
- Python 字符编码判断
- Python 字符编码判断
- Python 字符编码判断
- Python 字符编码判断
- Python 字符编码判断
- Python chardet 字符编码判断
- Python chardet 字符编码判断
- Python的字符编码
- Python中使用chardet判断字符编码
- python使用模块chardet判断字符编码
- Python判断字符串、文件字符编码
- python 处理中文遇到的编码问题总结 以及 字符str的编码如何判断
- [Python]判断系统编码和字符编码chardet
- 判断字符窜的编码与转换字符窜编码
- Python的字符编码问题
- Python字符编码的几个问题
- 编程常用缩写
- 第十六周项目2---大数据集上排序算法性能的体验
- JQuery Datatables 在IE浏览器表头显示错乱问题
- graviry与layoutgravity的区别---Android开发中
- Android快速实现仿美团选择城市界面,微信通讯录界面
- python字符编码的判断
- 一个可爱的picture wall
- Material Design动画(一)
- JavaSE学习(9) 二进制、位运算符、移位运算符
- 多重处理系统中,处理死锁的办法
- C语言OJ项目参考(2305)你就成了我
- Espresso UI自动化测试 一
- POJ 2010 Moo University - Financial Aid 已被翻译
- Docker 常用管理命令——上