'Joe是这样背单词'第一步之——利用爬虫爬获有道字典
来源:互联网 发布:ubuntu 14 3306 开放 编辑:程序博客网 时间:2024/04/27 19:13
目的:CSDN上下载分数没有了,所以自给自足,用python写个爬虫,扒一扒有道字典的所有网页词汇数据
话不多说,代码如下:
# -*- coding:utf-8 -*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import urllib
import json
content = input(u"翻译的内容,比如'Hello':")
url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=http://www.youdao.com/'
data = {}
data['type'] = 'AUTO'
data['i'] = content
data['doctype'] = 'json'
data['xmlVersion'] = '1.6'
data['keyfrom'] = 'fanyi.web'
data['ue'] = 'UTF-8'
data['typoResult'] = 'true'
data = urllib.urlencode(data)
response = urllib.urlopen(url, data)
html = response.read()
target = json.loads(html)
result = target["translateResult"][0][0]['tgt']
print(u"翻译的结果:%s" % (target["translateResult"][0][0]['tgt']))
话不多说,测试如下:
当前完成的事情:利用有道词典的后台翻译引擎进行单词,短句或者句子的翻译
下一步该做的事:将爬虫扒获的数据整合成一个离线的单词数据集/ 或者考虑做一个利用有道后台引擎的在线字典
目标:利用深度优先搜索算法进行英语词汇的重新整合,使得背诵着背的是一串相关性极强的英语词汇网络
- 'Joe是这样背单词'第一步之——利用爬虫爬获有道字典
- 'Joe是这样背单词'第二步之——英语单词的分类处理
- 单词这样背
- 单词可以这样背吗?
- 原来单词还能这样背.......
- 字典树(背单词,LA 3942)
- [BZOJ4567][Scoi2016]背单词 字典树+贪心
- 考研之路之背单词计划
- Python爬虫第一步之获取网页源代码
- 有道词典 PC端 手机端 单词 背 个数 不同步 解决
- 努力学英语——从背单词开始
- Trie——BZOJ4567/Luogu3294 [Scoi2016]背单词
- 英语学习——误区分析背单词(1)
- 网络爬虫:利用有道实现“语言翻译”功能
- 背单词
- 背单词
- 背单词
- 背单词
- 时间不多了
- 手机端不换行
- 第四课讲C语言程序设计之体验---项目一《求两个电阻R1和R2的阻值,求它们并联后的阻值R》
- 基础卷_异常篇 第12集 异常练习
- hdu 5671 Matrix(操作一个矩阵,交换行或者列,对行或者列加上一个值)
- 'Joe是这样背单词'第一步之——利用爬虫爬获有道字典
- [ZOJ 3682] E - Cup 3 (背包DP计数 + 滚动数组)
- IOS学习 绘图 UIBezierPath 绘饼状图
- optparse模块
- php面试中的经典问题
- 欢迎使用CSDN-markdown编辑器
- hdu 5671 String(求有多少个子串,包含有至少k(1≤k≤26)个不同的字母)
- [django]django 部署,gunicorn、virtualenv、nginx
- leetcode 60. Permutation Sequence