spacy-入门02-helloworld

来源:互联网 发布:mac dare you diva 编辑:程序博客网 时间:2024/06/05 02:23

下载模型

spaCy目前支持的语言有英语、德语、法语,中文已经在版本规划中未来会有,中文处理可以使用spaCy的自定义语言处理,中文问题可以解决只是需要更多时间罢了。入门学习可以先考虑已经训练好的英语模型,spaCy提供了各种方法下载该模型,我使用了最简单的下载方法。

打开cmd(需管理员权限),键入如下指令,系统会将模型下载至默认的目录也就是python程序的site-packges目录下。需要注意的是(因为是从github下载内网可能有下载超时的问题)
python -m spacy download en
下载完成后site-packges中会出现一个新的目录site-packges/spacy/data/en,spaCy提供了许多模型,每种模型的大小不同会影响标注或者语法分析,因为入门不追求精度我下载的是最小的版本50M,最大的有1.3G但是精度比50M的要高很多。

Hello spaCy

import spacy as spmodule_name = 'en' # 英文模型名称sentenc_line = u'Hello,spacy!.'sp.info(module_name) # spacy模型相关信息nlp = sp.load(module_name) # 加载模型doc = nlp(sentenc_line) # print([(word.text,word.pos) for word in doc]) # 打印单词及其词性
上述代码运行后就能看到简单的结果。
# 建立doc,默认会将四个处理管道放入nlp对象中# 可以通过不同的调用来处理句子# 比如使用词性标注 nlp.tagger(doc)doc = nlp.make_doc(sentenc_line)for p in nlp.pipeline:    print(p)
nlp.tagger(doc)print([word.pos for word in doc])
前两篇比较简单,第一篇的格式因为CSDN没有预览代码命令行格式有点问题大家请见谅,接下来我会详细介绍使用spaCy词性标注、命名实体、语法解析、中文处理等内容。

必须要吐槽,CSDN的BLOG的排版格式非常有问题,一个BLOG居然没有预览功能也是够可以的了。


原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 手机欠费了不用了怎么办 闲鱼恶意差评怎么办 淘宝买家账户体检中心违规怎么办 淘宝卖家账户体检中心违规怎么办 淘宝好评被删除评价怎么办 淘宝没收到货确认收货了怎么办 美团评论被删怎么办 拼多多恶意差评怎么办 淘宝评论被删了怎么办 淘宝买东西错怪店家了怎么办 淘宝骗删除差评怎么办 淘宝买家号虚假交易违规怎么办 淘宝商家一直不发货怎么办 淘宝商家不发货也不退款怎么办 淘宝买家恶意差评怎么办 淘宝评价完了忘截图了怎么办 12306app登录不上怎么办 淘宝换绑支付宝失败怎么办 淘宝和手机不兼容怎么办 换号之后微信怎么办 手机不兼容的应用程序怎么办 微信版本低登录不了怎么办 软件与系统不兼容怎么办 软件与手机系统不兼容怎么办 qq和手机不兼容怎么办 来个软件不兼容怎么办 安卓8.0不兼容app怎么办 两条内存不兼容怎么办 王者荣耀软件不兼容怎么办 冒险岛不兼容win7怎么办 百度网盘手机号换了怎么办 破解版游戏闪退怎么办 安卓手机软件不兼容怎么办 安卓8.0软件闪退怎么办 游戏与手机系统不兼容怎么办 耳机和手机不兼容怎么办 软件和手机不兼容怎么办 小米6开关键失灵怎么办 同步助手下载不了微信旧版本怎么办 闲鱼退货卖家拒收怎么办 闲鱼把联系人删了怎么办