Android PinyinIME 源码笔记 -- 2. 底层服务启动

来源:互联网 发布:get软件是真鞋么 编辑:程序博客网 时间:2024/06/07 00:58
PinyinIME输入法启动过程介绍见“附A.1 输入法的启动http://blog.sina.com.cn/s/blog_4177a2e20100lsh0.html,从该文介绍可知当PinyinDecoderService创建时,初始化工作包括了收集系统静态字典文件信息以及用户字典路径信息,然后调用C++代码接口nativeImOpenDecoderFd完成底层服务的启动(另一个C++代码接口nativeImOpenDecoder也完成同样的功能,除了传递不同的参数)。

下图是C++函数nativeImOpenDecoderFd的原形如下:
JNIEXPORT jboolean JNICALL nativeImOpenDecoderFd(JNIEnv* env, jclass jclazz,
                                                 jobject fd_sys_dict,
                                                 jlong startoffset,
                                                 jlong length,
                                                 jbyteArray fn_usr_dict) {...}

函数的调用栈如下图示:
Android <wbr>PinyinIME <wbr>源码笔记 <wbr>-- <wbr>2. <wbr>底层服务启动

函数首先从Java虚拟机空间通过JNI接口取得静态系统字典文件描述符并克隆到本地C++程序空间文件描述符newfd和保存用户字典文件名的字节数组fud。然后与传入的静态字典文件开始位置的偏移startoffset和文件长度longth一起作为参数调用函数im_open_decoder_fd(),最后关闭newfd,并释放Java虚拟机分配的用来保存用户字典文件名的字节数组(调用JNI接口函数释放)

函数im_open_decoder_fd声明在文件include/pinyinime.h里,从注释可以看到,Android平台的系统静态字典是内嵌在整个应用程序的apk文件内:
  
  bool im_open_decoder_fd(int sys_fd, long start_offset, long length,
                          const char *fn_usr_dict);

题外话:
1. PinyinIME把系统静态字典文件是dict_pinyin.dat,在源码树中会放在目录res/raw/下。
2. 因为Android的工具aapt在生成apk文件时默认地会编译并压缩res/下的文件,而系统静态字典文件则不需要被压缩(否则在读取该文件时需要解压缩),在Android.mk文件需要指定以下选项告诉aapt工具不压缩所有.dat文件:
LOCAL_AAPT_FLAGS := -0 .dat
3. Java文件可以通过Resource类的函数openRawResourceFd读取apk内嵌在apk文件内的系统静态字典文件信息,返回到一个AssetFileDescriptor类对象实例(以下代码从apk文件读出res/raw/dict_pinyin.dat文件信息,参数不需要文件后缀名):
AssetFileDescriptor afd = getResources().openRawResourceFd(R.raw.dict_pinyin);
AssetFileDescriptor类包含3个关键信息,文件描述符,要读取的文件数据的起始偏移和该文件数据的长度,详情参考http://developer.android.com/reference/android/content/res/AssetFileDescriptor.html

现在回来看看函数im_open_decoder_fd的实现:
在文件share/pinyinime.cpp保存一个类型为MatrixSearch的全局变量matrix_search,当函数im_open_decoder_fd被调用的时候,创建新的atrixSearch对象,保存到变量matrix_search(如果变量在赋值前还保存着先前的实例,则要先删除以释放内存),然后对新建的实例对象调用init_fd函数,文件描述符,文件数据起始偏移和文件数据长度,还有用户字典文件名数组都作为参数传递到类MatrixSearch的成员函数init_fd。

类MatrixSearch在头文件include/matrixsearch.h里声明,它完成PinyinIME底层服务的核心功能,从接收/增加/修改输入的拼音序列,然后解析分组拼音序列,再到系统字典有用户字典中去查询匹配的汉字候选序列并返回给上层应用程序都在此类中完成。关于这个类及其相关的数据结构打算用独立的篇幅介绍,在此先略过,重点来关注它实例化以后的初始函数init_fd执行过程:
1)初始化,为类成员分配内存空间并初始化。包括创建下面用到的系统字典DictTrie实例和用户字典实例UserDict。
2)装载系统静态字典文件内容到字典树dict_trie(指针和对象类型均为DictTrie)
3)装载用户字典内容到user_dict_(指针和对象类型分别为AtomDictBase和派生的UserDict),然后应用用系统词频校对用户字典。
4)把状态清0,进入准备就绪状态。

0 0
原创粉丝点击