布朗聚类
来源:互联网 发布:电脑编程用什么软件 编辑:程序博客网 时间:2024/04/27 18:02
算法
布朗聚类是一种自底层向上的层次聚类算法,基于n-gram模型和马尔科夫链模型。布朗聚类是一种硬聚类,每一个词都在切只在唯一的一个类中。
布朗聚类的输入是一个语料库,这个语料库是一个词序列,输出是一个二叉树,树的叶子节点是一个个词,树的中间节点是类别(中间节点作为根节点的子树上的所有叶子为类中的词)。
初始的时候,将每一个词独立分成一类,然后,将两个类合并,使得合并之后评价函数最大,然后不断重复上述过程,达到想要的类别数量为止。
评价函数:对于n个连续的词(W)序列能否组成一句话的概率的对数的归一化结果。于是,得到评价函数:
其中:n是文本长度,w是词
0 0
- 布朗聚类
- 布朗桥
- 布朗过滤器
- 丹.布朗的小说
- 布朗分形指数
- 勒布朗法则
- 布朗就任英国首相(组图)
- 《自我》书摘 【美】乔纳森 布朗
- 数字城堡 丹·布朗
- 勒布朗法则(LeBlanc)
- 布朗大学的编程语言教材,Free
- 布朗大学视觉课程CS143简介
- P3017 [USACO11MAR]布朗尼切片Brownie Slicing
- 布朗特克(Bron.tok)病毒专杀工具
- [双语阅读]英首相布朗获评最烦人演讲者
- 2010,没有比勒布朗更好的故事
- 勒布朗的四年,我的四年
- TED--脆弱之道——布琳布朗的“脆弱心经”
- VelocityTracker的简单研究
- Docker离线安装——centos7
- 朱军,感到无助与迷茫,关于这生活
- Asp.net 模板页、内容页和自定义用户控件
- jQuery中$(function(){})与(function($){})(jQuery)、$(document).ready(function(){})等的区别详细讲解
- 布朗聚类
- android 单例模式
- dubbo 学习笔记
- caffe之快速上手简明简明教程
- ORA-02062: 分布式恢复收到 DBID 430b6181, 要求为 cc638231
- thrift
- bootstrap学习笔记-按钮
- Android监听网络状态变化与WIFI移动网的判别
- 解压.tar