程序博客网 > oracle sql列转行函数

《textanalytics》课程简单总结（2）：topic mining

来源：互联网发布：oracle sql列转行函数编辑：程序博客网时间：2024/05/21 18:48

coursera上的公开课《https://www.coursera.org/course/textanalytics》系列，讲的非常不错哦。

1、“term as topic”有很多问题：

2、Improved Idea: Topic = Word Distribution：

3、定义问题（Probabilistic Topic Mining and Analysis）：

4、解决问题之道（Generative Model for Probabilistic Topic Mining and Analysis）：

– Model data generation with a prob. model: P(Data |Model, λ)
– Infer the most likely parameter values λ* given a particular data set: λ* = argmaxλ p(Data| Model, λ)
– Take λ* as the “knowledge” to be mined for the text mining problem
– Adjust the design of the model to discover different knowledge

其中：λ=({ theta1, …, thetak }, { π11, …, π1k }, …, { πN1, …, πNk })

5、The Simplest Language Model（generative model）: Unigram LM

通过独立的生成每一个词进而产生文档，因此：
• p(w1 w2 ... wn)=p(w1)p(w2)…p(wn)
• 参数为: {p(wi)} ，且 p(w1)+…+p(wN)=1 (N is voc. size)
• Text = sample drawn according to this word distribution，例如：

p(“today is Wed”) = p(“today”)p(“is”)p(“Wed”) = 0.0002 * 0.001 * 0.000015

6、两种估计文本产生概率的办法：

•最大似然估计

“最好”意味着“样本数据的似然值达到最大”：。

问题是，样本一般较小。

• 贝叶斯估计

“最好”意味着“和‘先验’一致，同时能很好解释样本数据”，即Maximum a Posteriori (MAP) estimate。

问题是，如何定义“先验”。

7、多个Unigram Language Model混合（以两个为例）：

8、Probabilistic Topic Models: Expectation-Maximization (EM) Algorithm

例子：

9、Probabilistic Latent Semantic Analysis (PLSA)

本质思想：

数学关系：

PLSA中的EM：

11、LDA

内容参考：

http://blog.csdn.net/mmc2015/article/details/45009759

http://blog.csdn.net/mmc2015/article/details/45010307

http://blog.csdn.net/mmc2015/article/details/45011027

http://blog.csdn.net/mmc2015/article/details/45024447

1 0

oracle sql列转行函数

oracle sql列转行函数

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子成佛见性成佛 o成佛o作品成佛之道顿悟成佛如果说我若成佛你也别想逃脱穿成佛系文好命女配穿成佛系女配我若成佛天下无魔配图斗破之成佛系统如果说我若成佛我若成佛你也别想逃脱如果我若成佛你也别想逃脱地狱不空誓不成佛一念成魔一念成佛完整句子成俊成全成全歌词成全吉他谱成全原唱委曲成全成全简谱赵传成全成全下载成全歌曲成全钢琴谱成全了自己的碧海蓝天成全了我的碧海蓝天综恭喜达成全攻略成全妾心如水成全了你的潇洒和冒险牺牲自己成全别人的名言请成全我吧达西夫人坏蛋是怎样炼成的全本txt下载少年易老学难成全诗所有的遗憾都是成全 2018手机qq气泡怎么设成全透明 2018手机qq界面怎么设成全透明成兰成兰扮演者成兰铁路