《一种带有划词功能的屏幕取词实现方法.pdf》由会员分享,可在线阅读,更多相关《一种带有划词功能的屏幕取词实现方法.pdf(10页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN102043623A43申请公布日20110504CN102043623ACN102043623A21申请号201010590534622申请日20101207G06F9/4420060171申请人浙江大学地址310027浙江省杭州市西湖区浙大路38号72发明人姚敏尹建伟吕方敏阙杭宁沈正伟吴朝晖74专利代理机构杭州裕阳专利事务所普通合伙33221代理人江助菊54发明名称一种带有划词功能的屏幕取词实现方法57摘要本发明公开了一种带有划词功能的屏幕取词实现方法,包括以下步骤步骤一在计算机设备WINDOWS操作系统的DLL程序中利用SETWINDOWSHOOKEXAPI函数加载全局。
2、鼠标钩子;步骤二当鼠标悬停的时间超过使用者设定的停留时间,鼠标钩子捕捉到鼠标停留消息WM_MOUSEHOVER后,程序执行以下操作,重画窗口;挂载API钩子,截获API函数;位置匹配;步骤三当鼠标钩子捕捉到鼠标左键弹起消息WM_LBUTTONUP时,程序执行以下操作,保存剪贴板上的内容;模拟CTRLC操作;获得取词内容;恢复剪贴板内容。与现有技术相比,本发明既能方便用户使用,又能保证取词的通用性和准确性。51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书1页说明书6页附图2页CN102043626A1/1页21一种带有划词功能的屏幕取词实现方法,其特征在于包括以下步骤步骤。
3、一安装全局鼠标钩子在计算机设备WINDOWS操作系统的DLL程序中利用SETWINDOWSHOOKEXAPI函数加载全局鼠标钩子,用于捕捉鼠标的各个消息;当鼠标钩子捕捉到鼠标停留消息WM_MOUSEHOVER时,程序执行屏幕取词操作,其中,所述WM_MOUSEHOVER的停留时间,可以根据使用者的习惯设定;当鼠标钩子捕捉到鼠标左键弹起消息WM_LBUTTONUP时,程序执行划词取词操作;步骤二屏幕取词当鼠标悬停的时间超过使用者设定的停留时间,安装的鼠标钩子捕捉到鼠标停留消息WM_MOUSEHOVER后,程序执行以下操作,A重画窗口通过所述鼠标钩子获取鼠标指针在显示器上当前位置的坐标数据,并将此。
4、数据保存到计算机设备的内存中,根据坐标数据,在鼠标位置下选取一个1PX1PX的微小矩形框,利用API函数INVALIDATERECT向该矩形框发送重画消息,重画窗口;B挂载API钩子,截获API函数当计算机设备的WINDOWS系统接收到重画消息时,底层的操作系统会立即调用系统动态链接库GDI32DLL中的EXTTEXTOUTW、EXTTEXTOUTA、TEXTOUTW、TEXTOUTA这些API函数来进行文字输出,此时令程序挂载API钩子,通过API钩子截获进程对上述API函数的调用,取得该API函数的参数,从而实现对输出字符串的捕捉;C位置匹配在捕捉到输出字符串后,计算出该字符串所在矩形框的。
5、边界的坐标值,然后将计算机内存中存储的当前鼠标坐标位置与该矩形框的边界坐标做比较,如果鼠标位置在矩形框内,证明该字符串就是鼠标当前所指向的字符串,直接输出即可;反之不予输出;步骤三划词取词当鼠标钩子捕捉到鼠标左键弹起消息WM_LBUTTONUP时,程序执行以下操作,A保存剪贴板上的内容在程序中,应用OPENCLIPBOARD函数打开系统剪贴板,再通过GETCLIPBOARDDATA函数获取剪贴板上的文本内容数据,并将其保存到计算机的内存中,定义其变量名为G_OLDSTRING,再调用CLOSECLIPBOARD函数关闭系统剪贴板;B模拟CTRLC操作在保存完剪贴板上的内容后,程序调用KEYBD。
6、_EVENT函数分别模拟“CTRL”和“C”键被按下,即进行一次复制的操作,鼠标划词的文字内容数据取代剪贴板上原有的内容数据;C获得取词内容同上述步骤三A,再次应用所述OPENCLIPBOARD函数打开剪贴板,利用GETCLIPBOARDDATA函数将其中的文本内容数据保存到计算机的内存中,以便在应用程序中使用;再调用所述CLOSECLIPBOARD函数关闭系统剪贴板;D恢复剪贴板内容应用所述OPENCLIPBOARD函数打开剪贴板,利用SETCLIPBOARDDATA函数将步骤三A中保存在计算机内存中的G_OLDSTRING变量值写到剪贴板中,用于恢复剪贴板上原有的内容;最后调用所述CLOS。
7、ECLIPBOARD函数关闭系统剪贴板。权利要求书CN102043623ACN102043626A1/6页3一种带有划词功能的屏幕取词实现方法技术领域0001本发明涉及屏幕上的取词方法,尤其是在WINDOWS操作系统下的一种带有划词功能的屏幕取词实现方法。背景技术0002随着信息时代的来临,各式各样的文字信息充斥在人们的电脑上。有时,为了获取屏幕上的词语,用户不得不通过复制、粘贴等一系列繁琐的操作来获得该词,这给用户带来极大不便。人们希望可以通过更简单的操作来提取屏幕上的词语。于是,屏幕上的取词技术应运而生。现有的屏幕上的取词方法主要有两种0003一是屏幕取词,该方法通过移动鼠标来直接提取屏幕。
8、上鼠标所在位置的词语,采用该方法,用户获取词语的操作方式简单、快捷,不足之处有二,1由于分词技术不够成熟,从而导致取到的词语不够准确,与用户的想法不符,2有些应用软件采用了一些特殊的文字输出方式如PDF阅读器输出的为图片格式,致使屏幕取词功能在其中完全丧失,给用户的使用带来不便;0004二是划词取词,即用户通过拖拽鼠标划取屏幕上的词语来获取词语,与屏幕取词相比,该方法能够更准确地取到屏幕上的词语,可以在一些屏幕取词取不到的地方取词,但取词操作较屏幕取词繁琐。0005为克服屏幕取词和划词取词的不足,我们提出将划词取词和屏幕取词结合起来使用的方法,取两者取词之优点。将划词取词和屏幕取词相结合,传统。
9、的认识是不能实现的。然而,经过研究我们发现,将屏幕取词和划词取词结合到一起在技术上是完全能够实现的。因为,在WINDOWS操作系统下,屏幕上的文字大多数都是通过动态库GDI32DLL中的EXTTEXTOUTW、EXTTEXTOUTA、TEXTOUTW、TEXTOUTA四个函数输出的,其中EXTTEXTOUTW和TEXTOUTW用于UNICODE字符的输出,而EXTTEXTOUTA和TEXTOUTA用于ANSI字符的输出,因此,想要抓取屏幕上的词语只需通过APIHOOK技术拦截系统对以上API函数的调用,并从中截获这些函数的参数即可,这便是实现屏幕取词的通用方法。本发明在实现上述传统屏幕取词的基。
10、础上,创造性的融入了划词取词的方法,实现了划词取词和屏幕取词的有机结合。发明内容0006本发明的目的在于提供一种带有划词功能的屏幕取词实现方法,既能方便用户使用,又能保证取词的通用性和准确性。0007本发明为解决技术问题所采用的技术方案为0008本发明一种带有划词功能的屏幕取词实现方法,包括以下步骤0009步骤一安装全局鼠标钩子0010在计算机设备WINDOWS操作系统的DLL程序中利用SETWINDOWSHOOKEXAPI函数加载全局鼠标钩子,用于捕捉鼠标的各个消息;当鼠标钩子捕捉到鼠标停留消息WM_说明书CN102043623ACN102043626A2/6页4MOUSEHOVER时,程序。
11、执行屏幕取词操作,其中,所述WM_MOUSEHOVER的停留时间,可以根据使用者的习惯设定;当鼠标钩子捕捉到鼠标左键弹起消息WM_LBUTTONUP时,程序执行划词取词操作;0011步骤二屏幕取词0012当鼠标悬停的时间超过使用者设定的停留时间,安装的鼠标钩子捕捉到鼠标停留消息WM_MOUSEHOVER后,程序执行以下操作,0013A重画窗口0014通过所述鼠标钩子获取鼠标指针在显示器上当前位置的坐标数据,并将此数据保存到计算机设备的内存中,根据坐标数据,在鼠标位置下选取一个1PX1PX的微小矩形框,利用API函数INVALIDATERECT向该矩形框发送重画消息,重画窗口;0015B挂载AP。
12、I钩子,截获API函数0016当计算机设备的WINDOWS系统接收到重画消息时,底层的操作系统会立即调用系统动态链接库GDI32DLL中的EXTTEXTOUTW、EXTTEXTOUTA、TEXTOUTW、TEXTOUTA这些API函数来进行文字输出,此时令程序挂载API钩子,通过API钩子截获进程对上述API函数的调用,取得该API函数的参数,从而实现对输出字符串的捕捉;0017C位置匹配0018在捕捉到输出字符串后,计算出该字符串所在矩形框的边界的坐标值,然后将计算机内存中存储的当前鼠标坐标位置与该矩形框的边界坐标做比较,如果鼠标位置在矩形框内,证明该字符串就是鼠标当前所指向的字符串,直接输。
13、出即可;反之不予输出;0019步骤三划词取词0020当鼠标钩子捕捉到鼠标左键弹起消息WM_LBUTTONUP时,程序执行以下操作,0021A保存剪贴板上的内容0022在程序中,应用OPENCLIPBOARD函数打开系统剪贴板,再通过GETCLIPBOARDDATA函数获取剪贴板上的文本内容数据,并将其保存到计算机的内存中,定义其变量名为G_OLDSTRING,再调用CLOSECLIPBOARD函数关闭系统剪贴板;0023B模拟CTRLC操作0024在保存完剪贴板上的内容后,程序调用KEYBD_EVENT函数分别模拟“CTRL”和“C”键被按下,即进行一次复制的操作,鼠标划词的文字内容数据取代剪。
14、贴板上原有的内容数据;0025C获得取词内容0026同上述步骤三A,再次应用所述OPENCLIPBOARD函数打开剪贴板,利用GETCLIPBOARDDATA函数将其中的文本内容数据保存到计算机的内存中,以便在应用程序中使用;再调用所述CLOSECLIPBOARD函数关闭系统剪贴板;0027D恢复剪贴板内容0028应用所述OPENCLIPBOARD函数打开剪贴板,利用SETCLIPBOARDDATA函数将步骤三A中保存在计算机内存中的G_OLDSTRING变量值写到剪贴板中,用于恢复剪贴板上原有的内容;最后调用所述CLOSECLIPBOARD函数关闭系统剪贴板。0029本发明的有益效果本发明采。
15、用了全局鼠标钩子,并通过模拟键盘操作“CTRLC”复制操作来替换并获取剪贴板上取词内容,实现了划词取词和屏幕取词的有说明书CN102043623ACN102043626A3/6页5机结合,而且还能够及时回复剪切板中原有的内容数据,与现有的屏幕上的取词方法相比,具有如下有益效果,0030一、进程边界墙被打破,在大多数程序中均可正常取到词如PDF阅读器输出的图片格式,即使在部分应用程序中,屏幕取词功能受限,但是有划词取词的补充,依然能够保障取词功能的正常实现;0031二、仅通过鼠标移动就可获取屏幕上的词语,方便快捷,省去复制、粘贴等繁琐操作;0032三、在方便快捷的同时,取词更有准确性的保证;00。
16、33四、两种取词方式可供选择,用户可根据个人习惯、喜好进行挑选。附图说明0034图1是本发明的屏幕取词的实现方法流程示意图;0035图2是本发明的划词取词的实现方法流程示意图。具体实施方式0036如图1和图2所示,本发明一种带有划词功能的屏幕取词实现方法,其具体实施包括以下步骤0037步骤一安装全局鼠标钩子0038在计算机设备WINDOWS操作系统的DLL程序中利用SETWINDOWSHOOKEXAPI函数加载全局鼠标钩子。关于SETWINDOWSHOOKEX函数的具体用法,很多书中都有提到,并且这不是本发明的重点所在,因此这里不再赘述。0039设定捕捉到鼠标消息后的预处理函数为GETMSGP。
17、ROC。在GETMSGPROC需要处理鼠标的以下几种消息0040WINAPIGETMSGPROCMSGMSG00410042IFMSGMESSAGEWM_MOUSEMOVE0043G_PTCURRENTPOINTXMSGPTX;0044G_PTCURRENTPOINTYMSGPTY;/得到鼠标的当前坐标00450046ELSEIFMSGMESSAGEWM_MOUSEHOVER0047SCREEGETWORD;0048ELSEIFMSGMESSAGEWM_LBUTTONUP0049DRUGGETWORD;00500051当鼠标钩子捕捉到鼠标停留消息WM_MOUSEHOVER时,可以认为鼠标正悬停。
18、于取词处,此时执行屏幕取词操作,其中,鼠标钩子捕捉到鼠标停留消息WM_MOUSEHOVER的停留时间,可以根据使用者的习惯设定;当鼠标钩子捕捉到鼠标左键弹起消息WM_LBUTTONUP时,可以认为用户已经划词完毕,程序执行划词取词操作;0052步骤二屏幕取词说明书CN102043623ACN102043626A4/6页60053在安装鼠标钩子的过程中,用到的API函数有SETWINDOWSHOOKEX,当安装的鼠标钩子捕捉到鼠标停留消息WM_MOUSEHOVER时,程序执行以下操作,0054A重画窗口0055利用鼠标钩子得到鼠标的当前位置,然后在鼠标位置下选取一个1PX1PX的小矩形框若矩形框。
19、选取过大,会造成屏幕闪烁,利用API函数INVALIDATERECT向矩形框发送重画消息,重画窗口;0056RECTRC;0057RCLEFTG_PTCURRENTPOINTX;0058RCTOPG_PTCURRENTPOINTY;0059RCRIGHTG_PTCURRENTPOINTX1;0060RCBOTTOMG_PTCURRENTPOINTY1;0061INVALIDATERECTG_HWNDCURRENTWND,RC,TRUE;/发送重画消息0062B挂载API钩子,截获API函数0063在拦截API函数的时候,采用现有技术通用的改写输入地址表来实现。具体的步骤如下00641找到GDI。
20、32DLL模块的基地址0065HMODULEHMODULEGETMODULEHANDLE“GDI32DLL”;00662获取API函数的地址,以TEXTOUTA为例0067FARPROCM_PFNRAWPROCGETPROCADDRESSHMODULE,”TEXTOUTA”;00683调用IMAGEDIRECTORYENTRYTODATA函数查看某应用程序是否有输入节即是否需要加载动态库。如果返回NULL说明该程序没有输入节,则不做任何操作直接返回。00694如果有输入节,IMAGEDIRECTORYENTRYTODATA将返回指向输入节信息的指针。扫描所有的输入节信息,查看其中是否有GDI3。
21、2DLL模块,如果没有,则不做任何操作直接返回。00705如果找到GDI32DLL模块就可以得到一个IMAGETHUNKDATA结构的数组地址,在该地址中包含输入符号信息。依次扫描该数组地址,查找是否有和要拦截的API函数地址想匹配的地址。00716如果查找到有这些API函数的地址,则用WRITEPROCESSMEMORY函数将AP原型函数的入口地址改为我们自己写的替代函数地址。00727在替代函数中,即可取得其中的参数为程序所用,在使用完后,必须调用原型API函数,以免影响系统正常工作。以TEXTOUTA为例,其替代函数为0073BOOLWINAPIHOOK_TEXTOUTAHDCHDC,I。
22、NTX,INTY,LPCSTRIPSTRING,INTC00740075/这里进行对IPSTRING的处理00760077/调用原型API函数0078INTIRESULTPFNTEXTOUTAPROCG_TEXTOUTAHDC,X,Y,IPSTRING,C;0079RETURNIRESULT;0080说明书CN102043623ACN102043626A5/6页70081C位置匹配0082在替代函数HOOK_TEXTOUTA的参数中,LPSTRING即为要输出屏幕的文字。而X、Y为该字符串的左上角的X、Y坐标值。利用GETTEXTEXTENTPOINT32W函数可以得到当前字符串中单个字符的大。
23、小,从而可以计算出整个字符串的矩形框坐标。代码如下0083IFG_PTCURRENTPOINTXRECTWORDLEFTG_PTCURRENTPOINTX0084RECTWORDRIGHTG_PTCURRENTPOINTYRECTWORDTOP0085G_PTCURRENTPOINTXRECTWORDBOTTOM00860087/鼠标正处在当前字符串内,可以对其进行输出或其他操作008800890090以上为屏幕取词的具体实现过程。0091步骤三划词取词0092划词一般有三个动作,即鼠标左键按下、拖拽、左键弹起。在划词取词中主要就是对剪贴板的操作。当鼠标钩子捕捉到鼠标左键弹起消息WM_LBUT。
24、TONUP时,程序执行以下操作,0093A保存剪贴板上的内容0094应用一些系统函数可以实现剪贴板内容的提取。0095IFOPENCLIPBOARDNULL/打开剪贴板00960097HANDLEHCLIPBOARDDATAGETCLIPBOARDDATACF_TEXT;/获取内容0098CHARTEMPCCHARGLOBALLOCKHCLIPBOARDDATA;/锁定0099G_OLDSTRINGTEMPC;/保存内容0100GLOBALUNLOCKHCLIPBOARDDATA;/解除锁定0101CLOSECLIPBOARD;01020103B模拟CTRLC操作0104调用KEYBD_EVE。
25、NT函数即可实现按键模拟操作0105KEYBD_EVENTVK_CONTROL,MAPVIRTUALKEYVK_CONTROL,0,0,0;0106KEYBD_EVENTC,MAPVIRTUALKEYC,0,0,0;0107KEYBD_EVENTC,MAPVIRTUALKEYC,0,KEYEVENTF_KEYUP,0;0108KEYBD_EVENTVK_CONTROL,MAPVIRTUALKEYVK_CONTROL,0,0109KEYEVENTF_KEYUP,0;0110C获得取词内容0111这里同步骤三A的保存剪贴板内容的操作一样,保存取词内容,取词完成。0112D恢复剪贴板内容0113用O。
26、PENCLIPBOARD打开剪贴板后,调用系统函数SETCLIPBOARDDATA实现剪贴板内容的恢复。0114IFOPENCLIPBOARDNULL/打开剪贴板说明书CN102043623ACN102043626A6/6页801150116EMPTYCLIPBOARD;/清空剪贴板0117SETCLIPBOARDDATAG_OLDSTRING;/设置剪贴板内同为原来内容0118CLOSECLIPBOARD;01190120以上步骤必须在接收到鼠标WM_LBUTTONUP消息后迅速执行,中间不可穿插过多其余操作,否则恢复剪贴板内容时间过长,有可能导致用户复制、粘贴操作过快而剪贴板内容还没来得及恢复的情况出现,粘贴功能受到影响。说明书CN102043623ACN102043626A1/2页9图1说明书附图CN102043623ACN102043626A2/2页10图2说明书附图CN102043623A。