程序博客网 > 手机棋牌游戏平台源码

CS109 Lecture 7

来源：互联网发布：手机棋牌游戏平台源码编辑：程序博客网时间：2024/06/06 13:22

CS109 Lecture 7

Data Scraping

Sources

From a Web Sites
With An API

Copyrights and permission

Be careful and polite
Give credit
Care about media law
Don’t be evil

Useful tags

<h1></h1><p></p><br><a href = 'url'>Link</a>

Useful Libraries for Scraping

urllib
beautifulsoup
pattern
LXML

Get Data From Website

url = 'url'scource = urllib2.urlopen(url).read()

soup = bs4.BeautifulSoup(source)soup.findAll('a') # find <a><\a> tag

tag = soup.find('a')tag.get('href')

C = soup.findAll('p',{'class':'Event'})t=C[0] t.findNextSiblings

Get Data With An API

import json # JavaScript Obejct Notationimport requestsapi_key = 'mykey'url = 'url' + api_keyscource = urllib2.urlopen(url).read()

#---simple example--------a = {'a':1,'b':2}s = json.dump(a) a2 = json.loads(s) #-------------------------dataDict = json.loads(data)dtatDict.keys()

0 0

手机棋牌游戏平台源码

手机棋牌游戏平台源码

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子五线谱怎么学习叙事曲五线谱如何速记五线谱五线谱模版视唱五线谱五线谱之歌江河水五线谱孩子学五线谱啊我的太阳五线谱五线谱看调号认五线谱五线谱赞美诗长笛五线谱怎么看英语五线谱五线谱巧记我亲爱的五线谱怎样输入五线谱五线谱图案五线谱在线练习雪之梦钢琴五线谱五线谱升半音五线谱初级教程曲子五线谱我亲爱的五线谱遇见的五线谱拜厄五线谱教识五线谱小树叶五线谱小燕子儿歌五线谱小乌龟五线谱儿歌五线谱下载怎么制作五线谱天黑黑五线谱五线谱的基本知识两地曲五线谱简单五线谱如何认识五线谱你们可知道五线谱五线谱的简谱和五线谱五线谱和简谱