用Mathematica爬取我的百度经验目录
来源:互联网 发布:java 打印byte数组 编辑:程序博客网 时间:2024/06/06 16:35
这里只爬取前10页的内容:
urlss = StringJoin[ "http://jingyan.baidu.com/user/npublic/?uid=\d1b612bceb0dc22ba8ffe137&pn=", ToString@#] & /@ Range[0, 602, 7];urls = Flatten[ Table[StringCases[URLRead[urlss[[n]], "Body"], "<a href=\"/article/" ~~ Shortest[x__] ~~ "\" title=" :> x], {n, 1, 10}]];网址 = (StringJoin["https://jingyan.baidu.com/article/", #] & /@ Drop[urls, {2, -1, 2}]);标题 = Flatten[ Table[StringCases[URLRead[urlss[[n]], "Body"], ".html\" title=\"" ~~ Shortest[x__] ~~ "\"" :> x], {n, 1, 10}]];Grid[Transpose[{标题, 网址}], Frame -> {All, False}, Alignment -> Right]
运行结果如下:
阅读全文
0 0
- 用Mathematica爬取我的百度经验目录
- 用python爬取我的百度经验目录
- 我的百度经验列表
- mathematica爬取豆瓣Top250
- demo_4.我的第一个爬虫,爬取百度贴吧中一个帖子的所有.jpg图片
- 我用百度、阿里的产品经验,总结成了这9个产品设计方法
- 我从百度来30万IP的经验
- 我用firefox的经验
- 爬取百度搜索的图片
- 爬取百度搜索结果的爬虫
- 用Mathematica寻找最相似的汉字
- 用Mathematica寻找最相似的汉字
- 用requests爬取百度搜索数据
- python用urllib爬取百度
- 百度云爬虫-爬取百度云/百度网盘所有的分享文件
- 我的经验
- 我的苦学经验
- 我的授课经验
- mysql 触发器的使用
- SpringMVC 配置 myBatis 简述
- Maven向本地仓库导入jar包
- czl蒟蒻的模板库1——Dijkstra
- Caused by: java.lang.ClassCastException: org.springframework.web.SpringServletContainerInitializer c
- 用Mathematica爬取我的百度经验目录
- 并查集问题
- Neural Networks and Deep Learning之中文翻译-关于本书
- Android中添加两个(多个)FileProvider节点问题
- 11.9考试爆炸记
- python库-numpy
- android-uevent 简记
- 高亮显示
- shell脚本循环建立文件夹的bug