分词算法学习笔记之string::substr
来源:互联网 发布:淘宝网死飞自行车 编辑:程序博客网 时间:2024/05/16 05:44
百度百科的解释:
substr 方法
basic_string::substrbasic_string substr(size_type _Off = 0,size_type _Count = npos) const;
功能:从一个字符串复制一个从指定位置开始,并具有指定长度的子字符串。
参数:
_Off:所需的子字符串的起始位置。字符串中第一个字符的索引为 0,默认值为0.
_Count:复制的字符数目
返回值:
一个子字符串,从其指定的位置开始
备注:
如果 length 为 0 或负数,将返回一个空字符串。如果没有指定该参数,则子字符串将延续到字符串的结尾
举例:
//对纯中文句子s1的正向减字最大匹配分词string CHzSeg::SegmentHzStrMM(CDict &dict,string s1)const{string s2="";//保存句子s1的分词结果while(!s1.empty()){unsigned int len=s1.size();//如果待切分的句子大于最大切分单元//len=最大切分单元,否则len=句子的长度if(len>MAX_WORD_LENGTH)len=MAX_WORD_LENGTH;//取s1句子最左边长度len为的子句子string w=s1.substr(0,len);//判断刚刚取出来的子句子是不是一个词bool isw=dict.IsWord(w);//当w中至少有2个中文字&&不能构成字的时候,减去最右边的一个中文字while(len>2&&isw==false){///减去最右边的一个中文字len-=2;w=w.substr(0,len);//再次判断减字后的w是不是构成一个词isw=dict.IsWord(w);}s2+=w+SEPARATOR;//如果第二个参数为0或者负数,将返回一个空字符串。如果没有指定该参数,则子字符串将延续到字符串的结尾s1=s1.substr(w.size());}//end whilereturn s2;}
- 分词算法学习笔记之string::substr
- 分词算法学习笔记之fscanf函数以及EOF
- 学习笔记之string
- 中文分词算法笔记
- 中文分词算法笔记
- 常用分词算法笔记
- 中文分词算法笔记
- 常用分词算法笔记
- 中文分词算法笔记
- js操作string之substr方法
- php字符串学习之substr()
- string::substr
- string substr()
- string.substr
- 分词算法模型学习笔记(一)——HMM
- 分词算法模型学习笔记(二)——MEMM
- 分词算法模型学习笔记(三)——CRF
- 结巴分词学习笔记
- Extjs 学习 Ext.ListView、Ext.view.View 数据视图
- c++ boost 正则用法
- 黑马程序员_js常用函数总结
- 中国网管联盟 sql
- web.config connectionStrings 数据库连接字符串的解释(转载)
- 分词算法学习笔记之string::substr
- 使用计算列提高查询性能
- 判断内存已满
- Apache 2.2-SSL操作大全
- 内存动态分析工具Valgrind初探
- oracle 一行列转换问题
- MVC设计模式概览
- android usb挂载分析----vold启动
- Nutch如何读取CrawlDb中的<Text,CrawlDatum>键值对