StarDict格式辞典单词列表提取工具
来源:互联网 发布:淘宝客服子账号分流 编辑:程序博客网 时间:2024/05/24 03:45
今天一个朋友做了个Emacs的单词补全,特别好用,但是他自带的词库单词比较少,我就做了个单词提取工具,可以提取StarDict格式的辞典库。
StarDict的单词都存储在dictname.idx中,格式为:
每个单词后面跟着一个'/0'作为单词结束标志,再往后跟着8个字节用来描述单词在字典里的偏移和解释长度。
比如第一个单词a:
61 00 00 00 00 00 00 00 03 E4
我们需要的只是单词的字面值,后面的8个字节跳过就可以了。
代码如下:
调用的时候很简单,比如我们需要提取cdict-gb.idx,可以用:
这样就得到单词列表了,每个单词占一行。
- StarDict格式辞典单词列表提取工具
- 辞典 ubuntu Stardict
- ubuntu安装stardict辞典
- Ubuntu下安装Stardict辞典
- 给stardict添加本地辞典
- 信息提取工具资料列表
- 提取单词
- 在Stardict中查看单词网络
- stardict,一个真好用的单词翻译软件
- 自然语言处理工具NLTK——提取单词的主干
- 辞典
- ubuntu常用翻译工具stardict
- stardict
- StarDict
- Stardict
- Stardict
- stardict
- 提取英文中的单词
- c++ 在win32程序中打开控制台 并重定向输出
- VxWorks 集成开发环境
- Graham's Scan法求解凸包问题
- [原创]JAVA字符串池的个人理解,请各位高手指点!!
- HTML之meta
- StarDict格式辞典单词列表提取工具
- 异常:此数据库没有有效所有者,因此无法安装数据库关系图支持对象。 (SQL2000转到2005)
- 关于js
- JavaScript Cookies ,cookie 用来识别用户。
- linux下c语言连接mysql数据库
- 内核映射
- 正则表达式大全
- nchar,char,varchar与nvarchar区别
- matlab错误:One or more output arguments not assigned during call to