单词清洗与查找

来源:互联网 发布:帝国cms电影网站源码 编辑:程序博客网 时间:2024/04/28 14:05

总的介绍

  1. 必需的文件组成

a)可执行文件:extract.exe(用来萃取单词表里面的英语单词)和find.exe(用来查找单词的)。

b)配置文件(不要以为是什么高大上的东西,其实就是用来告诉程序哪些文件需要被处理的一个txt文本而已)。
总的有两个配置文件,一个是告诉程序要去哪些单词表里面查询,另一个是告诉程序要查找哪些题目。

如图1,这个是告诉程序要去哪些单词表里面查询的配置文件,每个文本对应一本书的单词表,只需要把想要加入查找范围的单词表文本的文件名加进来就可以了(建议每行一个文件名)。
books
图1 单词表的配置

然后,每个单词表文本其实就是图2这样的:
m1
图2 单词表长这样的

还有一个配置文件,是告诉程序要查找哪些题目,也是一样的格式,如图3:
tis
图3 要查找哪些题目

题目文本是长这样的:
exercise
图4 题目是这样滴

使用方法

  1. 首先,你应该写好上述的两个配置文件。

  2. 首次使用或者有新的单词表加入,需要运行extract.exe来清洗单词表(因为里面的中文和其他非法符号会影响查找结果)。

  3. 然后,只需要点击find.exe就可以了,查找的结果会被放在searchResult.txt里面。

查找的效果展示

效果
图5 最后的查找结果

相关的问题都在图片里注释了。。。

一些规定和约束

  1. 最好使用英文字符和符号来命名文件,因为原生的C++并没有对中文有太大的支持。
  2. 配置文件要写清楚,建议每行一个文件名,配置文件名固定为books.txt(告诉程序要去哪些单词表里面查询)和exercise.txt(告诉程序要查找哪些题目)。
  3. 全部文件都要放在同一个文件夹里面,比如像图6一样。
    files
    图6 同个文件夹下
1 0