Windows9x系统下汉字输入法的基本原理

来源:互联网 发布:计算微分的软件 编辑:程序博客网 时间:2024/05/12 17:22
Windows系统下汉字输入法实际上是将输入的标准ascii字符串按照一定的编码规则转换为汉字或汉字串,进入到目的地。由于应用程序各不相同,用户不可能自己去设计转换程序,因此,汉字输入自然而然落到WINDOWS系统管理中。

一、输入法与系统的关系

     键盘事件  应用程序

       |    |

       Windows的USER.EXE

         |

       输入法管理器

         |

        输入法 

  系统的键盘事件有windows的user.exe软件接收后,user.exe在将键盘事件传导输入法管理器(Input Method Manager,简称IMM)中,管理器 再将键盘事件传到输入法中,输入法根据用户编码字典,翻译键盘事件为对应的汉字(或汉字串),然后再反传到user.exe中,user.exe再将翻译后的键盘事件传给当前正运行的应用程序,从而完成汉字的输入。

二、汉字输入法的组成

    微软Windows9x系统中汉字输入法的名称是"Input Method Editor" ,简称IME,输入法的程序名称为:*.ime,数据文件名称为*.MB,即通常说的输入法编码表(字典).

    实际上IME文件是一个动态连接库程序(DLL),它与dll文件没有区别,只是名称不同而已。

  一般汉字输入法都由三个窗口组成:

    状态窗口(Status Windows)-显示当前的输入法状态(中文还是英文等站环信息);

    编码输入窗口(Composition Windows)-显示当前击键情况;

    汉字选择窗口(Candidates Windows)-列出当前编码的全部汉字(串),供用户选择或查询。

    上述三个窗口由基本的用户接口(User Interface )函数管理着。

  现在我们用Dumpbin.exe打开微软提供的拼音输入法(WINDOWS/SYSTEM/WINPY.IME)看看它有什么组成(这里一WINDOWS98为例,并假定windows系统安装在c:盘下):

C:/Dumpbin  c:/windows/system/winpy.ime

Microsoft (R) COFF Binary File Dumper Version 6.00.8168
Copyright (C) Microsoft Corp 1992-1998. All rights reserved.


Dump of file WINPY.IME

File Type: DLL       //IME 实际为dll程序

Section contains the following exports for WINPY.ime

0 characteristics
34A37323 time date stamp Fri Dec 26 17:04:35 1997
0.00 version
1 ordinal base
19 number of functions             //共有19个函数
19 number of names     // 对应19个名称 

ordinal hint RVA name

1 0 0000A010 CandWndProc  //"选择汉字窗口"注册函数
2 1 0000E750 CompWndProc  //"输入编码窗口"注册函数
3 2 0000FB50 ImeConfigure  //配置当前ime参数函数 
4 3 0000FEC0 ImeConversionList//将字符或字符串转换成目标字符
5 4 0000FFA0 ImeDestroy   //退出当前使用的IME
6 5 000030D0 ImeEnumRegisterWord
7 6 0000FFB0 ImeEscape        //应用软件访问输入法的接口函数.
8 7 00003080 ImeGetRegisterWordStyle
9 8 0000E9A0 ImeInquire      //启动并初始化当前IME输入法
10 9 0000A800 ImeProcessKey    //IME输入键盘事件管理函数
11 A 00002C20 ImeRegisterWord      //向输入法字典注册字符串
12 B 000109A0 ImeSelect                         //启动当前IME输入法
13 C 000109E0 ImeSetActiveContext   //设置当前的输入处于活动状态.
14 D 0000C850 ImeSetCompositionString 由应用程序设置输入法编码
15 E 0000AEE0 ImeToAsciiEx    //将输入的键盘事件转换为汉字编码事件
16 F 00002F40 ImeUnregisterWord   //删除被注册的字符串.
17 10 0000CA90 NotifyIME   //IME事件管理函数
18 11 00005160 StatusWndProc //状态窗口注册函数
19 12 00002350 UIWndProc   //用户界面接口函数

Summary

5000 .ShareDa
7000 .data
2000 .idata
1000 .rdata
3000 .reloc
5000 .rsrc
2000 .sgroup
18000 .text

    从上述可以看出,IME程序共有19个出口函数组成,每一个函数都有特定的格式,它们担负着与windows 系统传递信息的作用,这些函数是供Windows系统调用的。

三、输入法的函数简介

    下面我们将介绍上述各个函数的功能及接口格式。

1.    BOOL ImeInquire(            //初始化IME
    LPIMEINFO

   如果该函数初始化成功,返回TURE,否则为FALSE

      用户应该搞清楚IMEINFO结构,特关系着你设计的输入法是否成功.有关该结构请看"结构"一章.

2.DWORD IMEConversionList(             // 将某字符或字符串转换成目标字符串
    HIMC
hIMC,                                   // 与当前输入法相关的应用程序句柄  
    LPCTSTR
lpSrc,                                             //     要转换的字符串  (也可能是结果串,可由uFlag指定)
    LPCANDIDATELIST
lpDst,          /// 转换后的字符串(也可能是源串,可由uFlag指定)
    DWORD
dwBufLen,                  //转换后有几个字符
    UINT
uFlag                          //指定结果的存放位置
)

如果成功,返回转换后的字符串长度

3.BOOL  ImeConfigure(       //用户设置输入法接口
    HKL 当前输入法句柄
    HWND 配置窗口的父窗口
    DWORD 配置什么
    LPVOID 用户设置的数据
)
hKL,                          //hWnd,                    //dwMode,              //lpData                 //

该函数的功能是提供给输入法使用者一个可以更改某些隐含设置的能力.

如果你用过别人的输入法,其中的"配置输入法..."功能既是也!

对于一个初写输入法的人,可以不予理它.

4.BOOL ImeDestroy(        //关闭当前输入法
    UINT 无用 (0)
uReserved             //  )

成功返回TURE,否则为FALSE

5.LRESULT ImeEscape(          //hIMC,                         //uEscape,                    //用户软件访问输入法内部信息的接口
    HIMC 当前的应用程序句柄
    UINT 设置函数功能

                                            //=IME_ESC_QUERY _SUPPORT

                                            //=IME_ESC_RESERVED_LAST   IME_ESC_RESERVED_FIRST

                                            //=IME_ESC_PRIVATE_FIRST   IME_ESC_PRIVATE_LAST

                                            //=IME_ESC_SEQUENCE_TO_ INTERNAL

                                            //=IME_ESC_GET_EUDC_ DICTIONARY

                                            //=IME_ESC_SET_EUDC_ DICTIONARY

                                            //=IME_ESC_MAX_KEY

                                            //=IME_ESC_IME_NAME

                                            //=IME_ESC_SYNC_HOTKEY

                                            //=IME_ESC_HANJA_MODE

                                            //=IME_ESC_GETHELPFILENAME(

                                            //=IME_ESC_PRIVATE_HOTKEY(w95

只适应 Windows 98Windows 2000)下不可用)

        LPVOID lpData                    //
当前功能所需的数据    )

 

有时,人们可以用此函数怀区输入法的名称、帮助文件名称等。当然,我们可以不提供这些功能。

 

6、

BOOL ImeSetActiveContext(    //激活或搁置当前的输入法
    HIMC 当前用户程序句柄
    BOOL 激活或搁置激活  =FALSE 搁置
)

成功返回TRUE,否则为FALSE

 

7BOOL ImeProcessKey(    //处理应用程序传入的所有击键事件,监测是否是当前输入法所需的
    HIMC 应用程序句柄
    UINT 需处理的虚键
    DWORD 击键消息参数
    CONST LPBYTE 当前键盘状态(256字节))

    如果此键是该输入法需要的,则返回TRUE,否则为FALSE

 

只有返回true的击键,IME才去处理

8、

 

=NI_OPENCANDIDATE 

=NI_CLOSECANDIDATE

=NI_SELECTCANDIDATESTR

 

          dwValue

=NI_CHANGECANDIDATELIST

 

          dwValue

=NI_SETCANDIDATE_PAGESTART

   被改变的编码列表序号新页的开始序号. 改变编码列表页的大小 此时:dwIndex当前编码页序号新的页大小更新应用程序的信息的输入法的信息:移动位置,设置模式,设置编码窗口,字体。此时:dwIndex只用于 dwValue=IMC_SETCONVERSIONMODE, IMC_SETSENTENCEMODE 可取由 WM_IME_CONTROL 发送的下列值:改变编码窗口中的编码 此时:dwIndex取下列值:CPS_COMPLETE 完成编码转换转换编码取消当前的编码清除编码,并关闭编码窗 不用

 

此函数成功,返回TRUE,否则为FALSE

9、

 

BOOL ImeSelect(             //初始化输入法
            HIMC 当前应用程序句柄
hIMC,                    //fSelect                 //        )返回:成功返回true,否则为FALSE

The ImeSetCompositionString function is used by an application to set the IME composition string structure with the data contained in the lpComp or lpRead parameters. The IME then generates a  message.

10BOOL WINAPI ImeSetCompositionString(        //将编码窗口中输入的编码保存的编码结构中,

                                        //同志发送编码完成的消息

                                        //WM_IME_COMPOSITION)给系统,
    HIMC 当前的应用程序句柄
    DWORD 设置此函数功能
hIMC,                                                           //dwIndex,                                                  //

                                                                                //=SCS_SETSTR

                                                                                //=SCS_CHANGEATTR

                                                                                //=SCS_CHANGECLAUSE

                                                                                //= SCS_QUERYRECONVERTSTRING

                                                                                //=SCS_RECONVERTSTRING

                                                                                //=SCS_SETRECONVERTSTRING


    LPCVOID
lpComp,                                                //dwCompLen,                                           //lpRead,                                                //dwReadLen                                            //
编码数据区
    DWORD 编码数据区长度
    LPCVOID 读入的编码数据
    DWORD 读入的编码数据长度

11、

UINT ImeToAsciiEx(               //转换编码称汉字(串)
        UINT 虚键
        UINT 扫描码
        CONST LPBYTE 用户定义的键盘状态
        LPDWORD 转换后的数据存放区
        UINT 活动菜单标志
        HIMC 当前的应用程序  )

返回:返回值表示有几个消息,可理解为:本编码对应的汉字串有几个汉字组成(当然,这并不相等)。lpszReading,      
        DWORD
dwStyle,
        LPCTSTR
lpszString
    )

12、

BOOL WINAPI ImeRegisterWord(
        LPCTSTR

13BOOL WINAPI  ImeUnregisterWord(
    LPCTSTR
lpszReading,
    DWORD
dwStyle,
    LPCTSTR
lpszString
)

14UINT WINAPI
ImeGetRegisterWordStyle(
    UINT
nItem,
lpStyleBuf
)
    LPSTYLEBUF

15UINT WINAPI  ImeEnumRegisterWord(
    hKL,
    REGISTERWORDENUMPROC
lpfnEnumProc,
    LPCTSTR
lpszReading,
    DWORD
dwStyle,
    LPCTSTR
lpszString,
    LPVOID
lpData
)

16DWORD WINAPI  ImeGetImeMenuItems(
    HIMC
hIMC,
    DWORD
dwFlags,
    DWORD
dwType,
    LPIMEMENUITEMINFO
lpImeParentMenu,
    LPIMEMENUITEMINFO
lpImeMenu,
    DWORD
dwSize
)

四.ime的版本信息(与普通DLL的区别)

VS_VERSION_INFO VERSIONINFO        代表字符                    含义
    FILEVERSION 4,0,0,950           //4.00.950                  95版
    PRODUCTVERSION 4,0,0,950                //4.00.950                   95版
    FILEFLAGSMASK 0x3fL                        
    FILEFLAGS 0xaL
    FILEOS 0x10004L                                  //VOS_DOS_WINDOWS32         WIN32软件,可在DOS下运行
    FILETYPE 0x3L                                      //VFT_DRV                                    驱动程序
    FILESUBTYPE 0xbL                //VFT2_DRV_INPUTMETHOD       输入法驱动程序
BEGIN
BLOCK "StringFileInfo"
BEGIN
BLOCK "080403a8"
BEGIN
VALUE "Comments", "/0"
VALUE "CompanyName", "唐码软件开发工作室/0"
VALUE "FileDescription", "唐码输入法 版本1.0/0"
VALUE "FileVersion", "4.00.950/0"
VALUE "InternalName", "唐码输入法 版本1.0/0"
VALUE "LegalCopyright", "Copyright (C) 唐码软件开发工作室 1999-1999/0"
VALUE "LegalTrademarks", "/0"
VALUE "OriginalFilename", "TM.IME/0"
VALUE "PrivateBuild", "/0"
VALUE "ProductName", "唐码输入法 版本1.0/0"
VALUE "ProductVersion", "4.00.950/0"
VALUE "SpecialBuild", "/0"
END

uVirKey,                              //uScanCode,                        //lpbKeyState,      //lpdwTransBuf,            //fuState,                              //hIMC                                 //句柄
            BOOL 是否初始化当前输入法TRUE表示初始化

              dwValue

=NI_SETCANDIDATE_PAGESIZE

 

          dwValue

=NI_CONTEXTUPDATED

   

              dwValue

                                 IMC_SETCANDIDATEPOS

                                 IMC_SETCOMPOSITIONFONT

                                 IMC_SETCOMPOSITIONWINDOW

                                IMC_SETCONVERSIONMODE

                                IMC_SETSENTENCEMODE

                                IMC_SETOPENSTATUS

=NI_COMPOSITIONSTR

 

                                        CPS_CONVERT    

                                        CPS_REVERT      

                                        CPS_CANCEL      

          dwValue

BOOL  NotifyIME(                      //输入法选择窗口状态管理函数:
    HIMC 当前的应用程序句柄
    DWORD 状态值
    DWORD 与状态值有关的序号
    DWORD 与状态值有关的值
)状态值说明:打开编码选择窗口关闭当前的编码选择窗 选摘编码此时:dwIndex被选择的编码列表序号. 被选中的编码在当前的编码列表中的序号改变当前的编码列表(按pageup等键操作)此时:dwIndex被选择的编码列表序号. 不用设置编码开始页号 此时: dwIndex
hIMC,                                    //dwAction,                          //dwIndex,                           //dwValue                           //
hIMC,                            //uVirKey,                         //lParam,                     //lpbKeyState //
=TRUE 
如果失败,返回0,否则有个功能决定hIMC,                                     //fFlag                                     //

lpIMEInfo,        //用于初始化该输入法的结构地址
    LPTSTR
lpszWndClass,        //当前输入法的名称
    LPCTSTR
或者dword lpszData             //系统信息,9X系列值为0,NT/2000下有实际值
    )
原创粉丝点击