我和我的输入提示--格式化输入文件
来源:互联网 发布:常用的网络拓扑结构是 编辑:程序博客网 时间:2024/05/21 09:10
把原始文件进行格式化处理。去掉一些噪声内容。
原始文件的格式为:
前缀,查询词,权重,过滤信息|扩展信息
其中:前缀就好比市编号。每个市下面有自己的数据。要查询的时候就要指定市。
查询词,要显示的内容。
权重,最后会把符合条件的结果按照权重进行排序。【可以为空】
过滤信息,一个short类型的数字,最后的显示结果可以根据这个值进行过滤。可以获取指定过滤信息值的结果,或者指定区间的结果等。【可以为空】
扩展信息,最后显示在结果中,让结果显示的更加丰富。【可以为空】
格式化后文件的格式为:
在原始文件的前面增加了一项,为格式化后的内容
格式化查询词后的结果,前缀,查询词,权重,过滤信息|扩展信息
#include "util/ConfigReader.h"
#include "util/ReadBigFile.h"
#include "util/WriteBigFile.h"
#include "util/XHStrUtils.h"
int CFormatFile::RunFormat(const string & strFileIn, const string & strPath, const string & strFileOut)
{
printf("path:%s; filein:%s; fileout:%s\n", strPath.c_str(), strFileIn.c_str(), strFileOut.c_str());
string strPathNew = strPath;
int iPos = strPath.size() - 1;
for(; iPos > 0; iPos--) {
if(strPath[iPos] != '\\') {
break;
}
}
if(iPos == 0) {
printf("error: RunFormat path error:%s\n", strPath.c_str());
return -1;
}
strPathNew = strPathNew.substr(0, iPos + 1);
m_strFileIn = strPathNew + "/" + strFileIn;
m_strFileOut = strPathNew + "/" + strFileOut;
return Process();
}
int CFormatFile::Process()
{
CReadBigFile fdR;
CWriteBigFile fdW;
CWriteBigFile fdWError;
string strError = m_strFileIn + ".error";
fdR.Open(m_strFileIn.c_str());
fdW.Open(m_strFileOut.c_str());
fdWError.Open(strError.c_str());
char *p;
map<string, int> mapHasCollected;
while(fdR.GetLine(p)) {
vector<string> vecSplit;
XHStrUtils::StrTokenize(vecSplit, p, ",");
if(vecSplit.size() < 2) {
string strErrMsg = "error:(less than 2 paramter)";
strErrMsg += p;
fdWError.WriteLine((const char *)strErrMsg.c_str());
continue;
}
string strValue = vecSplit[1];
XHStrUtils::FiltNoiseSymbol(strValue); //去除噪音
XHStrUtils::ToCase(strValue, false); //转换成小写
XHStrUtils::JoinMultiSpace(strValue); //把多个空格合并成一个
XHStrUtils::trim(strValue); //去除字符串两端的空格
if(strValue.size() < 2) {
string strErrMsg = "error:(after format, less than 2 charater)";
strErrMsg += p;
fdWError.WriteLine((const char *)strErrMsg.c_str());
continue;
}
string strPreAndValue = vecSplit[0] + "#" + strValue;
if(mapHasCollected.find(strPreAndValue) != mapHasCollected.end()) {
string strErrMsg = "error:(has collected key)";
strErrMsg += p;
fdWError.WriteLine((const char *)strErrMsg.c_str());
continue;
}
mapHasCollected[strPreAndValue] = 1;
string strResult = "";
//把格式化好的新的放到最前面
strResult = strValue + ",";
strResult += p;
fdW.WriteLine((const char *)strResult.c_str());
}
return 0;
}
0 0
- 我和我的输入提示--格式化输入文件
- 我和我的输入提示--需要的树结构
- 我和我的输入提示--写在前面
- 我和我的输入提示--树结构
- 我和我的输入提示----XHTree.h
- 文件格式化输入和输出
- 【我的Java笔记】标准输入和标准输出流
- 在磁盘中有一文件名为file.exe,当程序提示我输入文件名时我输入了file.exe,为什么总是打不开呢
- 格式化输入和输出
- 模拟google提示输入——牛刀小试,我的第一个Ajax应用
- 知道我之前输入的是什么吗?
- 我的uinput模拟输入设备
- JFormattedTextField组件和格式化输入
- 字符串和格式化输入/输出
- JFormattedTextField组件和格式化输入
- 字符串和格式化输入/输出
- 字符串和格式化输入/输出
- 字符串和格式化输入/输出
- ZOJ 3769 Diablo III
- 设计模式总结
- 进来看看吧
- C 语言指针与地址
- poj-2762-Going from u to v or from v to u?-tarjan算法求缩点+算是不是一字链
- 我和我的输入提示--格式化输入文件
- Ubuntu安装单机1.2.1hadoop与伪分布式模式进行WordCount实验
- hdu 1558 Segment set 线段相交+并查集
- Hadoop YARN配置参数剖析(4)—Fair Scheduler相关参数
- @InitBinder的使用
- 继承System.Web.UI.Page的页面基类
- 主设备号、次设备号
- 英语学习利器,后悔后知后觉了--------------------韦氏三宝
- POJ 2236Wireless Network