twitter API获取和使用(python tweepy库)

来源:互联网 发布:js object to xml 编辑:程序博客网 时间:2024/06/05 18:45

看《Python 数据挖掘与与入门》这本书的时候有几章的内容需要使用Twitter获取Twitter的数据,在书中作者使用的是Twitter 官方出的那个库,但是由于国内需要科学上网,这个库好像不支持使用代理,因此我就换了tweepy这个库.

首先你需要可以科学上网,装好tweepy这个库,去http://apps.twitter.com这个网址点Create New App 填写之后申请好你就有了下面的这些参数 

import tweepyimport jsonconsumer_key = "你的参数"consumer_secret = "你的参数"access_token = "你的参数"access_token_secret = "你的参数"auth = tweepy.OAuthHandler(consumer_key, consumer_secret)auth.set_access_token(access_token, access_token_secret)api = tweepy.API(auth,proxy='127.0.0.1:1080')
在ie浏览器->工具->Internet选项->连接->局域网设置检查你的代理的设置,否则就把代理给勾上(就这几个地方设置好应该就可以了,如果没好,请自行百度)

tweepy 这个库的资料比较少,我自己摸索着试了试,把代码发上来

一.按照关键字搜索Twitter的内容

#接上面的代码(q = 关键字 ,count = 返回的数据量 . 推特一次最多返回100条??)search_results = api.search(q='python',count=100)#对对象进行迭代for tweet in search_results:    #tweet还是一个对象,推特的相关信息在tweer._json里    #这里是检测消息是否含有'text'键,并不是所有TWitter返回的所有对象都是消息(有些可能是用来删除消息或者其他内容的动作--这个没有确认),区别就是消息对象中是否含有'text'键    if 'text' in tweet._json:        print(tweet._json['text'])        #这里是把内容给打印出来了,如果需要保存到文件需要用json库的dumps函数转换为字符串形式后写入到文件中        #例如 :output_file.write(json.dumps(tweet._json))

二.根据Twitter消息的ID批量获取消息

#其中id_list 是消息ID组成的list 长度也不要超过100search_result = api.statuses_lookup(id_list)




原创粉丝点击