自然语言处理(一)
来源:互联网 发布:网络端口号 编辑:程序博客网 时间:2024/05/11 14:37
概论
自然语言处理----利用计算机处理文本及声音。
应用领域:输入—输出;输入法; 拼写更正;机器翻译;evernote推荐系统; 英文写作助手;twitter重大事件分析;医疗诊断;体育赛事报道生成;
应用技术:语言模型,自动机,中文分词,文本对齐,模板匹配,分类器,相似度计算,local sensitive hashing,文本分类,关键词匹配,倒排索引,语法分析,找词根,社交网络,可信度分析,规则系统,深度学习,模板填充,同义词替换,文本对齐,
概率系统的工作方式:流程设计—收集训练数据—预处理—抽取特征—分类器—预测—评价
语言模型
xx模型——对某个语句打分
概率语言模型:Statistical language model
核心:通过打分告诉机器怎么说话。
N-gram:
HMM假设:未来的事件,取决于有限的历史。
N-gram LM 符合马尔可夫假设,N个状态相关
RNN LM 非马尔科夫假设 可计算无限多个假设
OOV解决办法:
把没有出现过的词统计为unk,用unk替换oov进行概率计算。
最大似然估计:
N-gram平滑:
back-up回退法:思路:自己有钱自己出,没钱爸爸出,爸爸没钱爷爷出。
trigram没有——> bigram没有——> unigram
Interpolate插值法:自己 爸爸 爷爷各出一点钱。
Absolute discount绝对折扣----劫富济贫,按爸爸的资产分配。
Kneser-Ney smoothing----有钱人交固定的税,按爸爸人脉分配。
Modified KN----有钱人交阶梯税,按爸爸人脉分配。
阅读全文
0 0
- 自然语言处理(一)
- 自然语言处理学习(一)
- 自然语言处理(一)基础
- python自然语言处理(一)
- 自然语言处理入门(一)
- 自然语言处理入门(一)
- NLP(一)--自然语言处理简介
- python自然语言处理-学习笔记(一)
- python自然语言处理入门教程(一)
- 《Python自然语言处理》学习笔记(一)
- 自然语言处理(一 神经网络背景介绍)
- Python 自然语言处理 一
- 自然语言处理模型(一):一文读懂TF-IDF
- 自然语言处理-nltk学习(一)
- 自然语言处理(NLP)—入门、下载数据(一)
- 黄聪:Python+NLTK自然语言处理学习(一):
- Python+NLTK自然语言处理学习(一):环境搭建
- Python与自然语言处理(一)搭建环境
- BZOJ
- 简化Presenter,Nucleus组件
- hexo 学习链接
- Android Studio导入项目非常慢的解决办法
- 对象池
- 自然语言处理(一)
- N(8)皇后问题
- [已解决]软件测试:Jmeter运行错误
- 闲说HeartBeat心跳包和TCP协议的KeepAlive机制
- Arduino小车PID调速前期准备——码盘测速精度的提高
- Vue折腾记
- Flask+SQLAlchemy入门使用
- 关于Android 出现65536,导致项目无法正常编译问题的解决
- hdu2067(卡特兰数)