词性标注类函数
来源:互联网 发布:递归算法的应用 编辑:程序博客网 时间:2024/05/01 07:10
class CCoMatrix:public CObject
{
private:
int CorpusSize;//语料规模
int *TagFreqs;//每种词性标记的出现次数,一位数组
int *Matrix;//共现频度矩阵,用一维数组来模拟二维数组
public:
CStringArray *pTags;//词性标记集
CStringArray *pOpenTags;//开放标记集
BOOL Modified;//是否修改过词性标记集或语料库
CString FileName;//存放这个类的数据的文件名
CCoMatrix(){TagFreqs=NULL;Matrix=NULL;}//构造函数
~CCoMatrix(){Clean();}//构析函数
BOOL Ready(){return CorpusSize>0;} //是否已经读入词性标记集和训练语料
double GetCoProb(uchar tag1,uchar tag2);//获取标记转移概率
double GetWordProb(double wtFreq,uchar tag);//获取词语概率
void Create(CStdioFile& tagFile);//创建标记集、矩阵
void Clean();//清除原有内容
void AddCorpus(CStdioFile& trainFile);//增加训练词料
virtual void seriaHze(CArchive& ar);//序列化函数
uchar GetIndexOf(CString tag);//将词性标记转化为序号
CString GetTagOf(uchar i);//将序号转换为词性标记
int GetTagFreq(uchar i);//求某种标记的频度
}
词性标注的基本单位-Span
词性标注的对象是一个词串,我们的标注模型是寻找一条概率成绩最大的路径。
- 词性标注类函数
- 词性标注
- 词性标注
- 词性标注
- 词性标注
- 词性标注
- 词性标注(1)
- 一阶HMM词性标注
- 斯坦福词性标注Demo
- 词性标注说明
- 计算所词性标注集
- 词性标注POS tagging
- 北大词性标注集
- 中文词性标注
- Stanford Tagger 词性标注
- 结巴分词--词性标注
- ANSJ词性标注集
- LTP词性标注
- WideCharToMultiByte和MultiByteToWideChar函数的用法
- opengl学习笔记(4)
- 初识GCD和block
- android: Serializable 和 Parcelable
- php安装报错 ‘gdIOCtx’ 没有名为 ‘data’ 的成员
- 词性标注类函数
- unionfs安装到Linux内核
- 为什么程序员喜欢在深夜编程?
- IOS applicationDidEnterBackground
- eclipse+jbpm5+jboss的集成配置
- DundasWebChart在IIS7.5 windows2008 64位版发布时不能正常显示
- valgrind显示“x blocks are still reachable in loss record x of x”
- 利用脚本解放自己,让脚本帮我做事2 -- 帮自己寻找不在SVN控制中的文件
- give two sorted array, find the k-th smallest element of union of A and B