google 翻译python版本

来源:互联网 发布:thinkphp防止sql注入 编辑:程序博客网 时间:2024/06/01 22:05

进来,想搞个python 版本的google翻译。

看了下网页,是一个get请求,不禁大喜,深入研究后,发现这里携带的参数其中包含一个“tk” 应该为token的缩写吧,其用到搜索的字符通过js函数的计算的到。

可是未曾入坑js,看上去颇为烧脑。而我又是一个求甚解的人,想要等了解js后再去突破。

还有什么其他方式,选择ios客户端看看有什么突破。

使用charles 抓包发现,也是get,并且不包含‘tk’参数,遂又大喜,
倒弄半天,发现请求下来的数据并不和客户端抓包数据相同。

思考十秒,认为ios客户端必然是做了处理,不是简单的对结果的排版,而是对结果进行了运算处理。

脚本请求的数据都是包含”definition_id”:”m_en_us1226340.004”
这种字段,而客户端抓包却看的到实实在在的明文翻译。

naive! 想来这样是可以的。一定是哪里出了问题。

等等,我是如何请求数据的

import requestsget_url='https://translate.google.cn/translate_a/single'data={"client":"it","dt":"t","dt":"rmt","dt":"bd","dt":"rms","dt":"qca","dt":"ss","dt":"md","dt":"ld","dt":"ex","otf":"1","dj":"1","q":"big","hl":"zh_CN","ie":"UTF-8","oe":"UTF-8","sl":"en","tl":"zh-CN"}headers={         'user-agent': 'GoogleTranslate/5.9.59004 (iPhone; iOS 10.3.1; zh_CN; iPhone8,1)',         }result = requests.get(get_url, params=data, headers=headers)print result.contentprint result.url

机制的我发现这样的data 数据有问题,因为python 中是不允许相同的key值存在的!
使用print result.url 确实证明了,get请求的参数缺少了。

直接写入get请求中不是不可以,但是参数太长,非常的丑陋,不利于维护,也不专业。

参考了文档 http://docs.python-requests.org/zh_CN/latest/user/quickstart.html#url

这里明确的说明可以使用list 表达相同的key 对应不同的value.

payload = {‘key1’: ‘value1’, ‘key2’: [‘value2’, ‘value3’]}

r = requests.get(‘http://httpbin.org/get‘, params=payload)
print(r.url)
http://httpbin.org/get?key1=value1&key2=value2&key2=value3

修改这几个相同的key为一个列表

"dt":["t","rmt","bd","rms","qca","ss","md","ld","ex",]

这样就解决了返回值不正确的问题。也推翻了我人为的app内部进行逻辑处理的猜测。

阅读全文
0 0
原创粉丝点击