用python完成的第一个工作: 将URL码转换成中文
来源:互联网 发布:sentinel ldk c 源码 编辑:程序博客网 时间:2024/06/05 19:42
终于用到python了。
从后台splunk里面导出了几万条用户搜索记录(.csv格式),但全是百分号那种url码(GBK码),想把它转成中文看看都是什么。搜了一圈网上的工具,发现都只能一条一条转。好像可以用VB在excel里面写个程序但是好麻烦....而且也不懂。于是干脆看看python能不能帮忙。
举例:
把 这种字符串 "%E6%9C%8D%E5%8A%A1%E5%8C%BA" 转化成汉字
答案是 "服务区"
验证方法 将以下URL
http://www.baidu.com/s?wd=%E6%9C%8D%E5%8A%A1%E5%8C%BA
输入到地址栏回车,会显示出:
原始文件 03042015.csv,内容长相:
在powershell里面运行程序 forunicodeutf8.py
代码
# -*-coding: utf-8 -*-# -*- coding=gb2312 -*-import urllib, sysf=open("03042015.csv") #打开文件inidata=f.read() #读文件内容到内存final=urllib.unquote(inidata) #解url码为unicodef.close() #关闭文件f2=open('03042015result.csv','w')#建立新文件f2.writelines(final) #写入新文件f2.close() #关闭文件
执行结果 03042015result.csv,内容长相:
一堆问号是因为这是解码为unicode,需要utf-8重新编码即可成为中文可读字。这里只需要用excel即可。
1. 新建EXCEL空白表格
2. 选择[数据data]选项卡-->选择[从文本from text]
3.选择需要编码的.csv文件-->03042015result.csv
4.在导入向导第一步对话框中选择65001:Unicode(UTF-8),下一步
5. 在导入向导第二部对话框 选择逗号comma,下一步
6. 在导入向导第三步对话框中 选择文本Text, 点击完成
7.选择A1单元格,确定
导入结果如下:
--------------------------------------工作完成----------------------------------------
0 0
- 用python完成的第一个工作: 将URL码转换成中文
- 完成第一次工作的第一个任务
- python中文URL的转换
- 将中文转换成URL编码
- Python中文转换url编码
- python中文转换url编码
- python中文转换url编码
- QT 将中文转换成GB2312百分号URL编码字符串
- 用Python将字符串里的英文双引号转换成中文双引号
- Python 中文转换url编码的实际操作步骤介绍
- python中文与url编码之间的相互转换
- 自动将汉字转换成拼音第一个字母
- 将汉字转换成拼音第一个字母
- 将第一个换行符转换成’\0’
- Mysql把第一个中文转换成字母。
- JavaScript 将字符串第一个字母转换成大写其余的均为小写
- 用python查看URL编码的中文
- 第一个月的工作
- 使用IPTABLES实现对特定IP,端口流量的精确统计
- Xcode6中segue弃用push与modal选项后新增的解决办法
- 一些好用的Xcode插件
- 使用PSSH批量SSH操作Linux服务器
- android 开发经验
- 用python完成的第一个工作: 将URL码转换成中文
- hibernate 二级缓存 @cache注解
- Appium 项目的源码目录结构分析
- apache+tomcat集群session共享-redis服务器
- BZOJ 2333 SCOI 2011 棘手的操作 可并堆
- 【LeetCode】Balanced Binary Tree
- 友盟工具使用笔记
- NYOJ--58(搜索)-题目-----------------------------最少步数
- DBlink详解 (转载)