aduadu

aduadu

0个粉丝

98

问答

0

专栏

45

资料

aduadu  发布于  2008-12-29 17:36:43
采纳率 0%
98个问答
4047

WinCE的手写识别技术1

 
WinCE从4.0开始,集成了手写识别输入法,可以识别繁体中文,日文和韩文.因此如果在WinCE下采用相应的API函数重写上述三种语言的手写识别输入似乎显得多此一举.但多余并不代表没有了解的价值,今天,就让我们抽丝剥茧来探究WinCE下的手写识别吧!
  大体上来说,调用WinCE自带的识别引擎进行文字识别需要经过如下十个步骤:
1.调用HwxConfig ()函数初始化识别引擎.在每个应用程序中,该初始化只需要调用一次.

2.调用HwxCreate()创建识别引擎句柄.
  函数原型为:HRC HwxCreate(HRC hrc).该函数有个形参hrc,保存的是已存在的识别引擎句柄.如果传入该形参,则可以根据已存在的引擎的设置来创建新的识别引擎.当然通常情况下我们仅仅是创建一个新的引擎,所以该函数更多情况下是不使用形参:
  
3.调用HwxSetGuide()函数来设置识别框的范围.
  设置该识别框范围的重要性不言而喻,因为如果设置不恰当,则直接导致识别出错甚至无法识别.
  该函数传入的形参是一个HWXGUIDE结构,该结构包含了识别框的一切信息:
typedef struct tagHWXGUIDE ...{
    UINT cHorzBox;
    UINT cVertBox;
    INT xOrigin;
    INT yOrigin;
    UINT cxBox;
    UINT cyBox;
    UINT cxOffset;
    UINT cyOffset;
    UINT cxWriting;
    UINT cyWriting;
    UINT cyMid;
    UINT cyBase;
    UINT nDir;
  } HWXGUIDE, *PHWXGUIDE;

  
  如果用文字来描述各个形参的含义,我实在没这个能力让语言读起来不觉得乏味,所以最简单最直接最直观的方法,我还是用图片来标识出各个参数的含义,至少应该不会让脑袋觉得发晕:
  xOriginy,Origin分别定义了识别框的起始坐标,而cxBox,cyBox则分别定义了识别框的长度和宽度.需要注意的是,这四个参数是以屏幕坐标为基准,如果我们获得的是应用程序窗口的坐标,在赋值之前,我们需要调用MapWindowPoints()进行转换.当然,相同的道理也同样运用于该结构的其它形参.
  
  nDir定义了书写的顺序,我们一般使用HWX_HORIZONTAL,表明书写方式是水平书写.当然,如果有特殊要求,我们还可以设置HWX_BIDIRECTIONAL或HWX_VERTICAL.

4.调用HwxALCValid()和HwxALCPriority()定义识别的标准.
  HwxALCValid()用来定义识别字符的范围,HwxALCPriority()则是定义返回字符的优先级.
  根据帮助文档,可以识别的字符文字为:简体中文,繁体中文,日文,韩文和英文.但在实际使用中,却是无法正确识别简体中文,这不能不说是一个遗憾.在平时应用中,我们一般只需识别一种文字,此时我们可以只是简单地设置HwxALCValid()即可:
  HwxALCValid(hrc,ALC_KANJI_ALL); //识别汉字
  
5.调用HwxSetContext()设置前文,提高文字识别率.如果没有前文,可以不调用该函数.

6.调用HwxInput()加入文字笔画.如果文字是多笔画,则应多次调用该函数.
  函数原型是:
  BOOL HwxInput(
          HRC hrc,
          OINT* lppnt,
          UINT upoints,
          DWORD timestamp
        );


        
  lppnt是输入的笔画坐标,upoints是坐标的个数,和HWXGUIDE的参数一样,这里的坐标也是屏幕坐标系.timestamp是时间,一般情况下,我们可以设置为0.
  
  需要注意的是,如果是多笔画的文字,最好不要一次性将所有笔画点阵通过HwxInput()输入,否则最后的识别结果将会大相径庭.因为识别引擎是一笔一划进行输入识别的,如果多笔画文字一次性输入,引擎可能将所有笔画当成一个笔画,从而导致识别结果异常不准确.      
  
7.调用HwxEndInput()告知引擎笔画输入结束,即将要进行识别部分.

8.调用HwxProcess()让引擎进行识别处理.

9.调用HwxResultsAvailable()获取识别的字符数.
  根据文档,HwxResultsAvailable()返回识别的字符数.然而在WinCE4.2中,调用hwxcht.dll的话,任何时候都是返回为0值,即使之后的函数能返回识别字符也依然如此.文档中描述,该函数如果返回的是-1,则代表调用失败,其它值代表可供使用的字符数.也许是WinCE4.2下识别引擎不完善的缘故,该函数根本没有发挥文档所描述的作用.
  
  
10.调用HwxGetResults()获取结果.
  INT32 HwxGetResults(
    HRC hrc,
    UINT cAlt,
    UINT iFirst,
    UINT cBoxRes,
    HWXRESULTS* rgBoxResults
  );

  初看起来,该函数形参似乎特别复杂,但实际上并非如此.
  
  根据文档,cAlt是期望的轮流返回的字符,iFirst是想要返回字符的索引,cBoxRes是返回的字符个数.但实际上,cAlt起主导作用,比如说cBoxRes设置为1,而cAlt设置为10,则返回的字符个数依然为10.所以我在平常使用中,一般是将iFirst设为0,cBoxRes设为1,而cAlt设为所需返回的字符个数.
  
  rgBoxResults指向储存字符的缓冲区.不过,返回结果比较有意思,除了第一个rgBoxResults以外的所有结构的indxBox成员都储存了返回字符.
  比如返回五个字符'与子于飞干',则rgBoxResults的数组列数值为:
  rgBoxResults[0].indxBox :      0
  rgBoxResults[0].rgChar[0] :  '与'
  rgBoxResults[1].indxBox :     '子'
  rgBoxResults[1].rgChar[0] :  '于'
  rgBoxResults[2].indxBox :     '飞'
  rgBoxResults[2].rgChar[0] :  '干'
  
11.调用 HwxDestroy()销毁引擎,本次识别过程结束.如果需要继续识别文字,从步骤2重新开始.
//========================================================================
//TITLE:
//    漫谈WinCE的手写识别技术(二)
//AUTHOR:
//    norains
//DATE:
//    Thursday  25-January -2007
//Environment:
//  EVC4.0 + Standard SDK
//========================================================================
我来回答
回答0个
时间排序
认可量排序
易百纳技术社区暂无数据
或将文件直接拖到这里
悬赏:
E币
网盘
* 网盘链接:
* 提取码:
悬赏:
E币

Markdown 语法

  • 加粗**内容**
  • 斜体*内容*
  • 删除线~~内容~~
  • 引用> 引用内容
  • 代码`代码`
  • 代码块```编程语言↵代码```
  • 链接[链接标题](url)
  • 无序列表- 内容
  • 有序列表1. 内容
  • 缩进内容
  • 图片![alt](url)
+ 添加网盘链接/附件

Markdown 语法

  • 加粗**内容**
  • 斜体*内容*
  • 删除线~~内容~~
  • 引用> 引用内容
  • 代码`代码`
  • 代码块```编程语言↵代码```
  • 链接[链接标题](url)
  • 无序列表- 内容
  • 有序列表1. 内容
  • 缩进内容
  • 图片![alt](url)
相关问答
无更多相似问答 去提问
举报反馈

举报类型

  • 内容涉黄/赌/毒
  • 内容侵权/抄袭
  • 政治相关
  • 涉嫌广告
  • 侮辱谩骂
  • 其他

详细说明

易百纳技术社区