一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种文字复制方法、装置、电子设备及可读存储介质与流程

2021-11-09 22:31:00 来源:中国专利 TAG:
1.本发明涉及文档处理
技术领域
:,特别是涉及一种文字复制方法、装置、电子设备及可读存储介质。
背景技术
::2.在工作和学习中,用户常常需要对pdf(portabledocumentformat,便携式文档格式)文档中的文字进行复制。其中,将pdf文档中的文字复制到其他文档的方式为:将待复制文字的字节码通过转换表解析为统一码unicode码,然后将解析得到的unicode复制到剪切板,进而可以基于剪切板中的内容将待复制文字复制到其他文档。其中,转换表为pdf文档内嵌的、记录有字节码与unicode的转换关系的表。3.但是,目前为了压缩pdf文档的大小常常会将该转换表删除,这样就导致在复制文字时缺少转换表,使得复制到其他文档的文字变成乱码,无法实现对pdf文档中的文字的复制。技术实现要素:4.本发明实施例的目的在于提供一种文字复制方法、装置、电子设备及可读存储介质,以能够对pdf文档中的文字进行复制。具体技术方案如下:5.第一方面,本发明实施例提供了一种文字复制方法,该方法可以包括:6.当接收到针对便携式文档格式pdf文档中的待复制文字的复制指令时,提取待复制文字的笔画;7.调用预设输入法对待复制文字的笔画进行识别,得到笔画识别结果;8.查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码;9.基于待复制文字的unicode码,将待复制文字复制到目标文档。10.可选地,提取待复制文字的笔画可以包括:11.从pdf文档内嵌的字库中,提取待复制文字的笔画;其中,字库中存储有待复制文字的笔画。12.可选地,调用预设输入法对待复制文字的笔画进行识别,得到笔画识别结果,可以包括:13.调用预设输入法对待复制文字的笔画进行识别,得到针对待复制文字的多个候选笔画识别结果;14.将用户所选定的候选笔画识别结果,确定为待复制文字的笔画识别结果。15.可选地,在查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码之后,还包括:16.将待复制文字的笔画识别结果和unicode码,关联存储至内存中的转换缓存表。17.可选地,在查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码之前,还可以包括:18.判断内存中的转换缓存表是否存储有待复制文字的笔画识别结果;其中,转换缓存表中存储有:预设输入法识别过的待复制文字的笔画识别结果和unicode码;19.若是,将转换缓存表中与待复制文字的笔画识别结果关联的unicode码,确定为待复制文字的unicode码;20.若否,执行查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码。21.第二方面,本发明实施例还提供了一种文字复制装置,该装置可以包括:22.提取模块,用于当接收到针对便携式文档格式pdf文档中的待复制文字的复制指令时,提取待复制文字的笔画;23.识别模块,用于调用预设输入法对待复制文字的笔画进行识别,得到笔画识别结果;24.查找模块,用于查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码;25.复制模块,用于基于待复制文字的unicode码,将待复制文字复制到目标文档。26.可选地,提取模块具体可以用于:27.从pdf文档内嵌的字库中,提取待复制文字的笔画;其中,字库中存储有待复制文字的笔画。28.可选地,识别模块可以包括:29.识别单元,用于调用预设输入法对待复制文字的笔画进行识别,得到针对待复制文字的多个候选笔画识别结果;30.确定单元,用于将用户所选定的候选笔画识别结果,确定为待复制文字的笔画识别结果。31.可选地,在本发明实施例中,该装置还可以包括:32.存储模块,用于在查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码之后,将待复制文字的笔画识别结果和unicode码,关联存储至内存中的转换缓存表。33.可选地,在本发明实施例中,该装置还可以包括:34.判断模块,用于在查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码之前,判断内存中的转换缓存表是否存储有待复制文字的笔画识别结果;35.其中,转换缓存表中存储有:预设输入法识别过的待复制文字的笔画识别结果和unicode码;36.确定模块,用于判断模块判断为是时,将转换缓存表中与待复制文字的笔画识别结果关联的unicode码,确定为待复制文字的unicode码;37.触发模块,用于判断模块判断为否时,触发查找模块。38.第三方面,本发明实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;39.存储器,用于存放计算机程序;40.处理器,用于执行存储器上所存放的程序时,实现上述第一方面任一所述的方法步骤。41.第四方面,本发明实施例还提供了一种可读存储介质,可读存储介质为电子设备中的可读存储介质,可读存储介质内存储有计算机程序,计算机程序被电子设备的处理器执行时实现上述第一方面中任一所述的方法步骤。42.第五方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在电子设备上运行时,使得电子设备执行上述第一方面中任一所述的方法步骤。43.在本发明实施例中,当接收到针对pdf文档中的待复制文字的复制指令时,提取待复制文字的笔画。然后,可以调用预设输入法对待复制文字的笔画进行识别,得到笔画识别结果。之后,可以查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码。这样,可以基于预设输入法获得待复制文字的unicode码。进而,可以基于待复制文字的unicode码,将待复制文字复制到目标文档。这样,可以实现对pdf文档中的文字的复制,避免了复制文字时发生乱码的情况。44.当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。附图说明45.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。46.图1为本发明实施例提供的一种文字复制方法的流程图;47.图2为本发明实施例提供的一种文字复制装置的结构示意图;48.图3为本发明实施例提供的一种电子设备的结构示意图。具体实施方式49.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。50.在工作和学习中,用户常常需要对pdf(portabledocumentformat,便携式文档格式)文档中的文字进行复制。其中,将pdf文档中的文字复制到其他文档的方式为:将待复制文字的字节码通过转换表解析为统一码unicode码,然后将解析得到的unicode复制到剪切板,进而可以基于剪切板中的内容将待复制文字复制到其他文档。其中,转换表为pdf文档内嵌的、记录有字节码与unicode的转换关系的表。51.但是,目前为了压缩pdf文档的大小常常会将该转换表删除,这样就导致在复制文字时缺少转换表,使得复制到其他文档的文字变成乱码,无法实现对pdf文档中的文字的复制。52.为了解决相关技术中存在的问题,本发明实施例提供了一种文字复制方法、装置、电子设备及可读存储介质。53.本发明实施例提供的文字复制方法应用于电子设备,该电子设备中可以安装有pdf(portabledocumentformat,便携式文档格式)文档阅读客户端。另外,该电子设备包括但并不局限于电脑和智能手机。54.图1为本发明实施例提供的一种文字复制方法的流程图。参见图1,本发明实施例提供的文字复制方法可以包括如下步骤:55.s101:当接收到针对便携式文档格式pdf文档中的待复制文字的复制指令时,提取待复制文字的笔画;56.s102:调用预设输入法对待复制文字的笔画进行识别,得到笔画识别结果;57.s103:查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码;58.s104:基于待复制文字的unicode码,将待复制文字复制到目标文档。59.在本发明实施例中,当接收到针对pdf文档中的待复制文字的复制指令时,提取待复制文字的笔画。然后,可以调用预设输入法对待复制文字的笔画进行识别,得到笔画识别结果。之后,可以查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码。这样,可以基于预设输入法获得待复制文字的unicode码。进而,可以基于待复制文字的unicode码,将待复制文字复制到目标文档。这样,可以实现对pdf文档中的文字的复制,避免了复制文字时发生乱码的情况。60.下面对本发明实施例提供的文字复制方法进行详细说明。61.s101:当接收到针对便携式文档格式pdf文档中的待复制文字的复制指令时,提取待复制文字的笔画;62.举例而言,用户可以对pdf文档中的待复制文字“了”执行复制操作。然后,电子设备可以接收到针对待复制文字“了”的复制指令。之后,电子设备可以提取待复制文字“了”的笔画“了”。63.可以理解的是,提取待复制文字“了”的笔画是指:提取待复制文字“了”的笔顺“乛亅”,以及,提取笔顺“乛亅”的位置信息。64.具体地,可以从pdf文档内嵌的字库中,提取待复制文字的笔画。其中,字库中存储有待复制文字的笔画。这样,可以基于pdf文档内嵌的字库获得待复制文字的笔画。65.其中,本发明实施例中的待复制文字包括但并不局限于汉字、字母、数字和符号。66.s102:调用预设输入法对待复制文字的笔画进行识别,得到笔画识别结果;67.延续上述示例,在提取待复制文字“了”的笔画“了”之后,可以调用预设输入法对笔画“了”进行识别,得到笔画识别结果为“了”。68.其中,由于预设输入法的识别精度或待复制文字字体的原因,在调用预设输入法对待复制文字的笔画进行识别后,可能会导致得到针对待复制文字的多个候选笔画识别结果。举例而言,调用预设输入法对笔画“了”进行识别,可以得到一种笔画识别结果为“了”,另一种笔画识别结果为“3”。69.在该种情况下,可以将用户所选定的候选笔画识别结果,确定为待复制文字的笔画识别结果。这样,可以避免预设输入法所导致的笔画识别结果错误,提高笔画识别结果的准确度,进而可以对待复制文字进行正确复制。70.s103:查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码;71.举例而言,在获得笔画识别结果为“了”之后,可以查找预设输入法中记录的笔画识别结果“了”对应的unicode码。然后,将查找到的unicode码作为该待复制文字的unicode码。72.其中,统一码unicode是计算机科学领域里的一项业界标准,包括字符集、编码方案等。unicode是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。也就是说,unicode是标准的字符编码,不会出现乱码的情况。73.s104:基于待复制文字的unicode码,将待复制文字复制到目标文档。74.可以理解的是,在获得待复制文字的unicode码之后,可以基于该unicode码将待复制文字复制到目标文档。这样,可以基于预设输入法查找到待复制文字的unicode码,从而可以实现对待复制文字的复制,避免了复制时出现乱码的情况。75.在本发明实施例中,在查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码之后,还可以包括:76.将待复制文字的笔画识别结果和unicode码,关联存储至内存中的转换缓存表。77.这样,可以将在预设输入法中查找过的笔画识别结果以及该笔画识别结果对应的unicode码,关联存储在内存中的转换缓存表中。这样,可以将查找过的内容存储至转换缓存表中,便于后续利用该转换缓存表进行快速查找。78.具体地,在查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码之前,还可以包括:79.判断内存中的转换缓存表是否存储有待复制文字的笔画识别结果;其中,转换缓存表中存储有:预设输入法识别过的待复制文字的笔画识别结果和unicode码;80.若是,将转换缓存表中与待复制文字的笔画识别结果关联的unicode码,确定为待复制文字的unicode码;81.若否,执行查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码。82.这样,在查找预设输入法中记录的笔画识别结果所对应的统一码unicode码之前,可以利用转换缓存表进行查找。其中,由于转换缓存表中记录的笔画识别结果要比预设输入法中记录的笔画识别结果要少,因而可以在转换缓存表中进行快速查找。若查找不到,则再到预设输入法中进行查找。这样,可以提高获得待复制文字的unicode码的速度。83.综上,应用本发明实施例提供的文字复制方案,可以实现对pdf文档中的文字的复制,避免了复制文字时发生乱码的情况。84.相应于上述方法实施例,本发明实施例还提供了一种文字复制装置。图2为本发明实施例提供的一种文字复制装置的结构示意图,参见图2,该装置可以包括:85.提取模块201,用于当接收到针对便携式文档格式pdf文档中的待复制文字的复制指令时,提取待复制文字的笔画;86.识别模块202,用于调用预设输入法对待复制文字的笔画进行识别,得到笔画识别结果;87.查找模块203,用于查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码;88.复制模块204,用于基于待复制文字的unicode码,将待复制文字复制到目标文档。89.在本发明实施例中,当接收到针对pdf文档中的待复制文字的复制指令时,提取待复制文字的笔画。然后,可以调用预设输入法对待复制文字的笔画进行识别,得到笔画识别结果。之后,可以查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码。这样,可以基于预设输入法获得待复制文字的unicode码。进而,可以基于待复制文字的unicode码,将待复制文字复制到目标文档。这样,可以实现对pdf文档中的文字的复制,避免了复制文字时发生乱码的情况。90.可选地,在本发明实施例中,提取模块201具体可以用于:91.从pdf文档内嵌的字库中,提取待复制文字的笔画;其中,字库中存储有待复制文字的笔画。92.可选地,在本发明实施例中,识别模块202可以包括:93.识别单元,用于调用预设输入法对待复制文字的笔画进行识别,得到针对待复制文字的多个候选笔画识别结果;94.确定单元,用于将用户所选定的候选笔画识别结果,确定为待复制文字的笔画识别结果。95.可选地,在本发明实施例中,该装置还可以包括:96.存储模块,用于在查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码之后,将待复制文字的笔画识别结果和unicode码,关联存储至内存中的转换缓存表。97.可选地,在本发明实施例中,该装置还可以包括:98.判断模块,用于在查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码之前,判断内存中的转换缓存表是否存储有待复制文字的笔画识别结果;99.其中,转换缓存表中存储有:预设输入法识别过的待复制文字的笔画识别结果和unicode码;100.确定模块,用于判断模块判断为是时,将转换缓存表中与待复制文字的笔画识别结果关联的unicode码,确定为待复制文字的unicode码;101.触发模块,用于判断模块判断为否时,触发查找模块。102.相应于上述方法实施例,本发明实施例还提供了一种电子设备。图3为本发明实施例提供的一种电子设备的结构示意图,参见图3,该电子设备包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信;103.存储器303,用于存放计算机程序;104.处理器301,用于执行存储器上所存放的程序时,实现上述任一文字复制方法实施例提供的方法步骤。105.在本发明实施例中,当接收到针对pdf文档中的待复制文字的复制指令时,提取待复制文字的笔画。然后,可以调用预设输入法对待复制文字的笔画进行识别,得到笔画识别结果。之后,可以查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码。这样,可以基于预设输入法获得待复制文字的unicode码。进而,可以基于待复制文字的unicode码,将待复制文字复制到目标文档。这样,可以实现对pdf文档中的文字的复制,避免了复制文字时发生乱码的情况。106.相应于上述方法实施例,本发明实施例还提供了一种可读存储介质,可读存储介质内存储有计算机程序,计算机程序被电子设备的处理器执行时实现上述任一文字复制方法实施例提供的方法步骤。107.本发明实施例提供的可读存储介质中存储的计算机程序被电子设备的处理器执行后,当接收到针对pdf文档中的待复制文字的复制指令时,提取待复制文字的笔画。然后,可以调用预设输入法对待复制文字的笔画进行识别,得到笔画识别结果。之后,可以查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码。这样,可以基于预设输入法获得待复制文字的unicode码。进而,可以基于待复制文字的unicode码,将待复制文字复制到目标文档。这样,可以实现对pdf文档中的文字的复制,避免了复制文字时发生乱码的情况。108.相应于上述方法实施例,在本发明还提供了一种包含指令的计算机程序产品,当其在电子设备上运行时,使得电子设备执行上述实施例中任一文字复制方法的方法步骤。109.本发明实施例提供的计算机程序被电子设备的处理器执行后,当接收到针对pdf文档中的待复制文字的复制指令时,提取待复制文字的笔画。然后,可以调用预设输入法对待复制文字的笔画进行识别,得到笔画识别结果。之后,可以查找预设输入法中记录的笔画识别结果所对应的统一码unicode码,作为待复制文字的unicode码。这样,可以基于预设输入法获得待复制文字的unicode码。进而,可以基于待复制文字的unicode码,将待复制文字复制到目标文档。这样,可以实现对pdf文档中的文字的复制,避免了复制文字时发生乱码的情况。110.上述电子设备提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。111.通信接口用于上述电子设备与其他设备之间的通信。112.存储器可以包括随机存取存储器(randomaccessmemory,ram),也可以包括非易失性存储器(non-volatilememory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。113.上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。114.在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。115.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。116.本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、可读存储介质和计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。117.以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。当前第1页12当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献