R语言微博数据处理(2)

来源:互联网 发布:淘宝全球购网站 编辑:程序博客网 时间:2024/05/18 03:32

昨天完成了对@User的匹配,今天阅读了《30分钟学习正则表达式》,终于把#Hashtags#的匹配完成了。

#拿到所有的hashtag
x <- c("#第六期学术人生#有沵的牵挂","#同学你好#欢迎新同学")
m <- regexpr("#.*#", x, perl=TRUE)
regmatches(x, m)

查了很多相关的#的正则匹配,结果还是简单的才是好用的,满足自己需求的还是好使的。

0 0
原创粉丝点击