社交网站的数据挖掘与分析

来源:互联网 发布:windows%20server%202008%20r2 编辑:程序博客网 时间:2024/04/30 17:45

 社交网站的数据挖掘与分析

基本信息

  • 原书名: Mining the Social Web
  • 原出版社: O'Reilly
  • 作者: (美)Matthew A.Russell    [作译者介绍]
  • 译者: 师蓉
  • 丛书名:O'Reilly 精品图书系列
  • 出版社:机械工业出版社
  • ISBN:9787111369608
  • 上架时间:2012-2-24
  • 出版日期:2012 年2月

     

    http://product.china-pub.com/199037

     

     

    内容简介

      《社交网站的数据挖掘与分析》介绍组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及那些你都不知道存在的有用信息。每个独立章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的python工具的意愿。主要内容包括:获得社交网络世界里的直观概要,使用github上灵活的脚本来获取社交网络api中的数据,学习如何应用便捷的python工具来交叉分析你所收集的数据,通过xhtml朋友网络探索基于微格式的社交联系,通过基于html5和javascript工具集的网络技术建立交互式可视化等。
       facebook、twitter和linkedln产生了大量宝贵的社交数据,但是怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?本书简洁而且具有可操作性,它将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网站数据、分析技术,如何通过可视化找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。
      《社交网站的数据挖掘与分析》每章都介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的python工具的意愿。
     
     

    目录

    《社交网站的数据挖掘与分析》
    前言 1
    第1章绪论:twitter 数据的处理 9
    python 开发工具的安装 9
    twitter 数据的收集和处理 11
    小结 24
    第2章微格式:语义标记和常识碰撞 26
    xfn 和朋友 27
    使用xfn 来探讨社交关系 29
    地理坐标:兴趣爱好的共同主线 37
    (以健康的名义)对菜谱进行交叉分析 41
    对餐厅评论的搜集 43
    小结 45
    第3章邮箱:虽然老套却很好用 47
    mbox:unix 的入门级邮箱 48
    mbox+couchdb= 随意的email 分析 54
    将对话线程化到一起 70
    使用simile timeline 将邮件“事件”可视化 79
    分析你自己的邮件数据 82
    小结 84
    .第4章twitter :朋友、关注者和setwise 操作 85
    rest 风格的和oauth-cladded api 86
    干练而中肯的数据采集器 90
    友谊图的构建 108
    小结 116
    第5章twitter:tweet ,所有的tweet ,只有tweet 118
    笔pk 剑:和tweet pk 机枪(?!?) 118
    对tweet 的分析(每次一个实体) 121
    并置潜在的社交网站(或#justinbieber vs #teaparty) 144
    对大量tweet 的可视化 155
    小结 163
    第6章linkedin :为了乐趣(和利润?)将职业网络聚类 164
    聚类的动机 165
    按职位将联系人聚类 167
    获取补充个人信息 183
    从地理上聚类网络 188
    小结 192
    第7章google buzz:tf-idf 、余弦相似性和搭配 194
    buzz=twitter+ 博客(???) 195
    使用nltk 处理数据 198
    文本挖掘的基本原则 201
    查找相似文档 208
    在二元语法中发buzz 215
    利用gmail 221
    在中断之前试着创建一个搜索引擎…… 225
    小结 226
    第8章博客及其他:自然语言处理(等) 228
    nlp :帕累托式介绍 228
    使用nltk 的典型nlp 管线 231
    使用nltk 检测博客中的句子 234
    对文件的总结 237
    以实体为中心的分析:对数据的深层了解 245
    小结 256
    第9章facebook :一体化的奇迹 257
    利用社交网络数据 258
    对facebook 数据的可视化 274
    小结 294
    第10 章语义网:简短的讨论 296
    发展中的变革 296
    人不可能只靠事实生活 297
    期望 301


     

    原创粉丝点击