Python 中文转换url编码的实际操作步骤介绍

来源:互联网 发布:淘宝实名认证怎么注销 编辑:程序博客网 时间:2024/05/05 00:24

url编码具有十分强大的功能,以及具有十分简捷的运用技巧,那么如果在Python中文转换url编码你对其有所了解吗?以下是文章的相关内容的介绍,希望你浏览以下的文章会有所收获。

今天修改一个天气预报的东西,但输入城市不能得到天气预报,感觉是编码不对,因为你输入一个城市(比如‘杭州’),url的地址编码却是'%E4%B8%BD%E6%B1%9F',因此需 要做一个转换。这里我们就用到了模块urllib。

  1. >>> import urllib  
  2. >>> data = '杭州' 
  3. >>> print data 

杭州

  1. >>> data  
  2. '\xe6\x9d\xad\xe5\xb7\x9e'  
  3. >>> urllib.quote(data)  
  4. '%E6%9D%AD%E5%B7%9E' 

那我们想转回去呢?

  1. >>> urllib.unquote('%E6%9D%AD%E5%B7%9E')  
  2. '\xe6\x9d\xad\xe5\xb7\x9e'  
  3. >>> print urllib.unquote('%E6%9D%AD%E5%B7%9E') 

杭州细心的同学会发现贴吧url中出现的是%C0%F6%BD%AD,而非'%E4%B8%BD%E6%B1%9F',其实是编码问题。百度的是gbk,其他的一般网站比如google就是utf8的。所以可以用下列语句实现。

  1. >>> import sys,urllib   
  2. >>> s = '杭州' 
  3. >>> urllib.quote(s.decode(sys.stdin.encoding)
    .encode('gbk'))  
  4. %BA%BC%D6%DD  
  5. >>> urllib.quote(s.decode(sys.stdin.encoding)
    .encode('utf8'))  
  6. '%E6%9D%AD%E5%B7%9E' 

以上的相关内容就是对Python中文转换url编码的详细介绍。

原文地址:http://developer.51cto.com/art/201003/190800.htm

原创粉丝点击