信息处理方法、设备、介质和程序产品与流程

2022-07-02 00:57:23 来源：中国专利 TAG：

1.本公开的实施例总体上涉及计算机领域，并且更具体地，涉及信息处理方法、电子设备、计算机可读存储介质和程序产品。

背景技术：

2.文本识别是模式识别应用的一个重要领域，其指的是从非文本文件(例如，图像文件、图形文件、视频文件、音频文件)中自动识别文本字符的技术。通过文本识别技术，可以将非文本文件中不可复制的文本信息转换成可编辑的文本形式。虽然文本识别技术已经得到不断发展，但由于实际应用中文本呈现的模式多样性等原因，文本识别结果的精确度仍然不能得到保证。对于一些对识别结果精确度要求高的应用，例如在医学领域中对纸质的医学文件的扫描版进行文本识别时，期望能够确保文本识别结果的准确度。

技术实现要素：

3.根据本公开的实施例，提供一种用于信息处理的方案，以用于对文本识别结果执行后处理，提高文本识别结果的准确度。
4.在本公开的第一方面，提供了一种信息处理方法。该方法包括：从非文本文件识别出的文本序列中提取多个文本单元，每个文本单元包括文本序列中的至少一个字符；确定多个文本单元是否被包括在预定知识库中，预定知识库包括与文本序列相关的知识领域中使用的文本单元；如果确定多个文本单元被包括在预定知识库中，确定多个文本单元之间的相互依赖程度；以及如果确定相互依赖程度超过阈值依赖程度，将多个文本单元确定为文本序列的校正版本的至少一部分。
5.根据一些可选实施例，多个文本单元包括文本序列中连续的一对文本单元，并且确定相互依赖程度包括：确定一对文本单元之间的互信息，以指示相互依赖程度。
6.根据一些可选实施例，该方法还包括：如果确定多个文本单元中至少一个文本单元未被包括在预定知识库中或者相互依赖程度不超过阈值依赖程度，校正多个文本单元以获得校正后的多个文本单元作为文本序列的校正版本的至少一部分。
7.根据一些可选实施例，校正多个文本单元包括：生成针对多个文本单元的组合的至少一个候选组合单元；将文本序列中与多个文本单元相邻的至少一个锚文本单元与至少一个候选组合单元合并，以组成至少一个候选文本序列，至少一个锚文本单元包括文本序列中被确定为正确的至少一个文本单元；确定至少一个候选文本序列各自的序列置信度；以及基于所确定的序列置信度，从至少一个候选组合单元确定针对多个文本单元的校正结果。
8.根据一些可选实施例，生成至少一个候选组合单元包括：确定多个文本单元的组合是否与错误词汇词典中的文本单元相匹配，错误词汇词典中的文本单元包括多个错误文本单元和针对每个错误文本单元的至少一个校正文本单元；如果多个文本单元的组合至少部分匹配于错误词汇词典中的目标文本单元，从错误词汇词典确定所匹配的目标文本单元
对应的至少一个校正文本单元；以及基于至少一个校正文本单元来确定针对多个文本单元的组合的至少一个候选组合单元。
9.根据一些可选实施例，错误词汇词典中的错误文本单元是在多个参考文本序列中被标注为错误的文本单元，多个参考文本序列从多个非文本文件被识别出。
10.根据一些可选实施例，确定多个文本单元的组合是否与错误词汇词典中的文本单元相匹配包括：通过正向最大匹配和反向最大匹配中的至少一项，从错误词汇词典确定与多个文本单元的组合至少部分匹配的目标文本单元。
11.根据一些可选实施例，生成至少一个候选组合单元包括：确定多个文本单元的组合所包括的多个字符中的至少一个字符的读音信息和字形信息中的至少一项；基于所确定的读音信息和字形信息中的至少一项，确定分别与至少一个字符具有相同或相似读音或字形的多个候选字符序列；以及基于多个候选字符序列来生成针对多个文本单元的组合的多个候选组合单元。
12.根据一些可选实施例，确定多个候选字符序列包括：利用输入法引擎，基于读音信息和字形信息来确定分别与至少一个字符具有相同或相似读音或字形的多个候选字符序列。
13.根据一些可选实施例，确定读音信息和字形信息中的至少一项包括：调整多个文本单元所包括的多个字符的顺序，以获得重排序的多个字符；以及确定重排序的多个字符中的至少一个字符的读音信息和字形信息中的至少一项。
14.在本公开的第二方面，提供了一种电子设备。该设备包括：处理单元；以及存储器，耦合至处理单元并且包含存储于其上的指令。指令在由处理单元执行时使设备执行以下动作。这些动作包括从非文本文件识别出的文本序列中提取多个文本单元，每个文本单元包括所述文本序列中的至少一个字符；确定所述多个文本单元是否被包括在预定知识库中，所述预定知识库包括与所述文本序列相关的知识领域中使用的文本单元；如果确定所述多个文本单元被包括在所述预定知识库中，确定所述多个文本单元之间的相互依赖程度；以及如果确定所述相互依赖程度超过阈值依赖程度，将所述多个文本单元确定为所述文本序列的校正版本的至少一部分。
15.根据一些可选实施例，该设备可以第一方面的方法的各种实施例。
16.在本公开的第三方面，提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现根据第一方面的方法的各种实施例。
17.在本公开的第四方面，提供了一种计算机程序产品，包括计算机程序，计算机程序被处理器执行时实现根据第一方面的方法的各种实施例。
附图说明
18.通过参考附图阅读下文的详细描述，本公开的上述以及其他目的、结构和特征将更加清楚。在附图中，以示例性而非限制性的方式示出了本公开的若干实施例，其中：
19.图1示出了根据本公开的一些实施例的信息处理环境的示意图；
20.图2示出了根据本公开的一些实施例的信息处理过程的流程图；
21.图3示出了根据本公开的另一些实施例的信息处理环境的示意图；
22.图4示出了根据本公开的一些实施例的确定校正候选的过程的流程图；
23.图5示出了根据本公开的另一些实施例的确定校正候选的过程的流程图；
24.图6示出了根据本公开的一些实施例的基于输入法引擎的校正候选的确定的示意图；
25.图7示出了根据本公开的一些实施例的文本单元校正的过程的流程图；
26.图8示出了根据本公开的一些实施例的文本单元校正的示意图；以及
27.图9示出了适于实现本公开的实施例的设备的框图。
具体实施方式
28.下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实施例仅用于示例性作用，并非用于限制本公开的保护范围。
29.在本公开的实施例的描述中，术语“包括”及其类似用语应当理解为开放性包含，即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
30.如上文简述的，期望提高文本识别结果的精确度，特别是在对文本识别结果的精确度要求高的应用中。一些研究方向致力于研究和改进文本识别技术，以进一步提高识别准确度。然而，由于文本在不同使用场景下的模式变化很大，因此通过文本识别技术生成的文本序列可能在不同应用场景下均能够获得令人满意的准确度。因此，在需要确保高精确度的实际应用中，可能需要用户人工核查文本识别出的文本序列，这将导致极高的时间成本和人力成本。另外，特别是针对某一个特殊领域(例如医学)，相似的内容会反复出现，文本识别算法的错误会反复出现。通过调整文本识别算法来提高准确率，耗时耗力，周期会很长，而且受限于语料等因素。因此，需要一个更为高效的方式来提高准确率。
31.根据本公开的实施例，提出了一种对文本识别结果执行后处理的方案。根据该方案，预先创建与文本序列相关的知识领域对应的知识库用于从非文本文件识别出的文本序列。具体地，确定文本序列中连续的多个文本单元是否被包括在预定的知识库中。如果这些文本单元均被包括在知识库中，这意味着个体文本单元本身是正确的。进一步确定这些文本单元彼此之间的相互依赖程度，这可以反映这些文本单元的顺序组合是否合理。通过衡量个体文本单元本身以及文本单元的组合的准确性，可以确定这些文本单元是否能够用于构成文本序列的校正版本。以此方式，可以确保所得到的文本序列的校正版本的高精确度。
32.示例环境
33.图1示出了根据本公开的一些实施例的用于信息处理的环境100的示意图。应当理解，图1示出的实体、元素和模块的数目和布置仅是示例，环境100中可以包括不同数目和不同布置方式的实体、元素和模块。
34.在图1的环境100中，信息处理系统110被配置为实现根据本公开的实施例的信息处理过程。具体地，信息处理系统110被配置为处理输入的文本序列106，以确定文本序列106的校正版本112。校正版本112可以被认为具有更高的精确度。
35.文本序列106包括一个或多个字符。文本序列106的处理可以基于文本单元来实
现。在本文中，“文本单元”指的是在自然语言中所使用的文本单位。每个文本单元包括一个或多个字符。例如，对于中文，文本单元可以是单个词、词语或者词组等。对于英文，文本单元可以是单词、由多个单词组成的词组等。文本单元的划分可以通过各种分词技术来实现。每个文本单元中的字符的数目可能取决于分词的粒度。
36.文本序列106是通过文本识别引擎105从非文本文件102识别得到的。在一些实施例中，如果从非文本文件102识别出的全部文本信息较多，每次处理的文本序列106可以是全部识别结果中的一部分。例如，文本序列106可以是一句话，一句话的一部分，多句话，或者一段话等。
37.非文本文件102例如是图像文件、音频文件、视频文件等。文本识别引擎105可以被配置为将非文本文件中不可复制的文本信息转换成可编辑的文本形式。如果非文本文件102是图像文件，文本识别引擎105可以利用光学字符识别(ocr)技术来提取图像文件中视觉呈现的文本信息。这样的图像文件可以呈现打印、扫描、手写等形式的文本。如果非文本文件102是音频文件，文本识别引擎105可以被配置为通过语音文本识别技术来确定语音对应的文本信息。如果非文本文件102是视频文件，文本识别引擎105可以被配置为识别视频文件的帧中呈现的文本信息，和/或识别视频文件的语音对应的文本信息。文本识别引擎105可以将从非文本文件102识别的文本信息按顺序组成文本序列106。
38.文本识别可以被应用在各种领域中，用于实现自动化的信息提取、归档、分析等。作为示例，在医学领域，期望通过文本识别技术，从患者的各类纸质医学报告的数字化图像(例如扫描图像或拍摄图像)中自动提取文本信息，以便归档到医院信息系统(his)。文本识别在其他领域中各种应用。在下文中，可能参考医学领域来描述本公开的一些实施例。然而，应当理解，本公开提出的文本识别后处理方法还可以被应用到其他知识领域，诸如教育领域、财务领域、工业制造领域等等。这里的“知识领域”的划分可以是各种粒度的。
39.文本识别引擎105提供的文本序列106的准确度可能难以保证。例如，文本序列106中的一个或多个字符可能被识别错误，字符的顺序可能不正确，或者可能会遗漏一些字符未识别。因此，期望能够对来自文本识别引擎105的文本序列106进一步处理，以获得高准确度的校正版本。根据本公开的实施例，通过信息处理系统110的处理，校正版本112中的字符可以被认为是具有高精确度、高可信度的。
40.在本公开的实施例中，信息处理系统110对文本序列106的处理至少基于预定的知识库120来实现。知识库120包括与文本序列106相关的知识领域中的文本单元，例如是在相关知识领域中常用的文本单元。知识库120中的文本单元是正确的文本单元。如下文将详细描述的，知识库120可以被用作相关知识领域的基本知识的参考，用于衡量文本识别结果是否符合知识领域的一般使用。知识库120可以被实现为或被包括在数据存储系统中，例如可以是服务器的存储系统、数据中心、文件系统等。
41.在一些实施例中，知识库120可以基于多个参考文本序列122-1、122-2、
……
122-n(统称为或单独称为参考文本序列122)来构建，其中n是大于1的正整数。参考文本序列122可以是先前从多个非文本文件识别得到的结果，例如可以是由文本识别引擎105或其他文本识别引擎识别出的结果。用于识别参考文本序列的非文本文件可以包括相关知识领域中所使用的非文本文件。例如，如果要用于引导对医学领域的文本识别处理，可以采集医学领域的非文本文件，例如患者的纸质医学报告的数字化图像，并利用文本识别引擎来识别其
中的文本序列。
42.被包括到知识库120中的文本单元是参考文本序列122中被标注为正确的文本单元。在一些实施例中，可以由用户130手动标注识别出的文本序列122中的文本单元是否正确。除此之外或者作为备选，还可以借助其他工具来标注参考文本序列122中的正确文本单元。在一些实施例中，还可以对文本序列120中的正确文本单元进行统计，以将出现频率较高(例如，高于频率阈值)的文本单元收集到知识库120中。
43.在一些实施例中，除应用参考文本序列122之外，或者作为备选，还可以从相关知识领域的专业词典124中获取知识库120所需要的文本单元。这些专业词典中出现的领域术语可能也会在实际应用中被频繁使用。例如，对于医学领域，可以从医学“金标准”案例或者用于各种疾病诊断和治疗的标准、词典、教科书等获取在本领域中常用的文本单元，诸如各种医学诊断和治疗方法的文本描述等。在一些实施例中，可以对专业词典124中出现的文本序列进行分词来获得知识库120中的文本单元。
44.在一些实施例中，信息处理系统110可以被实现或者被集成具有计算能力的一个或多个电子设备上。这样的电子设备可以是服务端设备或终端设备。服务端设备例如可以是集中式服务器、分布式服务器、大型机、边缘计算设备、云，等等。终端设备例如可以是各种便携式或固定终端，诸如平板电脑、台式计算机、笔记本计算机、智能手机等等。注意，虽然在图1中被示出为是分离的，但文本识别引擎105和信息处理系统110也可以被实现在单个设备上。
45.基于知识库的识别后处理
46.以上结合图1描述了本公开的实施例的示例环境。下文将参考图2的流程图来更详细描述识别后处理过程的具体实施例。图2示出了根据本公开的一些实施例的信息处理过程200的流程图。过程200例如可以由图1的信息处理系统110来实现。为便于讨论，下文将参考图1的环境100来描述过程200。
47.在框205，信息处理系统110从非文本文件102识别出的文本序列106中提取连续的多个文本单元。如以上提及的，可以通过分词技术将文本序列106划分为多个文本单元，其中每个文本单元包括文本序列106中的至少一个字符。在确定文本序列106的校正版本112时，从文本序列106中提取连续的多个文本单元来衡量这些文本单元是否应当是正确的识别结果，从而要被包括在校正版本112中。在一些实施例中，可以提取文本序列106中的一对文本单元。
48.例如，假设从图像文件识别的文本序列106是“临床提示直ca惠肠者检查，现片示”，其被划分以下文本单元：“临床”、“提示”、“直ca”、“惠肠者”、“检查”、“现片示”。信息处理系统110可以提取连续的两个文本单元“临床”和“提示”，或者“直ca”和“惠肠者”，用于后续处理。
49.在框210，信息处理系统110确定所提取的多个文本单元是否被包括在预定知识库120中。如以上提及的，知识库120包括与文本序列106相关知识领域中使用的文本单元。
50.将所识别的文本序列106中的文本单元与知识库120中的文本单元进行比较，可以确定每个文本单元本身是否是在该知识领域中可能会出现的文本单元。这有助于判断单个文本单元是否被误识别。因为特定知识领域中的文本单元的使用重复率较高，如果文本单元中某个字符被误识别，可能导致该文本单元不再对应于知识领域中的术语。
51.如果确定所提取的多个文本单元均被包括在知识库120中，在框215，信息处理系统110确定多个文本单元之间的相互依赖程度。文本单元之间的相互依赖程度指示这些文本单元之间的相关性，这可以用于衡量多个文本单元的出现顺序是否是合理的。
52.在一些实施例中，如果每次判断一对文本单元之间的相互依赖程度，可以计算这对文本单元之间的互信息(mi)，用于指示这对文本单元之间的相互依赖程度。
53.互信息是信息论中的一个概念，用于度量两个信息元素之间的相互依赖程度，可以反映两个信息元素之间的相互结合的紧密程度。例如，如果两个信息元素(在文本信息中指的是两个文本单元)彼此相互独立、没有交集，那么互信息为0。这意味着在文本信息中，对应的两个文本单元可能不会组合成词组或短语。如果两个信息元素之间的互信息越大(大于0)，这意味着两个信息元素同时出现的概率越高，在文本信息中对应的两个文本单元组合成短语或词组的概率越高。在一些示例中，两个文本单元之间的互信息可以被确定如下：
[0054][0055]
其中wi和w
i 1
分别表示第i个文本单元和随后的第i 1个文本单元，mi(wi,w
i 1
)表示这两个文本单元之间的互信息，p(wi)表示第i个文本单元在语料库中出现的概率，p(w
i 1
)表示第i 1个文本单元在语料库中出现的概率，p(wi,w
i 1
)表示第i个文本单元和随后的第i 1个文本单元在语料库中共同出现的概率。在此考虑的语料库可以包括实际应用中使用的一组文档集合。
[0056]
在一些实施例中，如果提取连续的两个以上的文本单元，还可以利用其它相关性算法来确定多个文本单元之间的相互依赖程度。例如，可以确定多个文本单元中逐对文本单元的互信息，并基于所确定的互信息来衡量多个文本单元之间的相互依赖程度。
[0057]
在框220，信息处理系统110确定所提取的多个文本单元之间的相互依赖程度是否超过阈值依赖程度。如果相互依赖程度超过一定阈值，这意味着这些文本单元不仅各自被包括在知识库120中，而且彼此具有较高的相互依赖关系，可以认为这些文本单元被正确识别的文本单元，有很高的概率能够用于形成文本序列106的校正版本112。阈值依赖程度可以根据实际应用需要设置。
[0058]
因此，在框225，信息处理系统110将被确定为包括在预定知识库中并且相互依赖程度超过阈值依赖程度的多个文本单元确定为文本序列106的校正版本112的至少一部分。例如，如果“临床”和“提示”被包括在知识库120中并且这两个文本单元之间的相互依赖程度很高(例如，mi(临床，提示)＝1)，那么这两个文本单元大概率是被正确识别的，可以被包括在校正版本112中。
[0059]
根据本公开的实施例，借助于相关知识领域的知识库以及文本单元之间的相互依赖程度的分析，可以确保筛选到校正版本的文本单元是正确的文本单元。这些文本单元不仅本身是相关知识领域中实际出现的文本单元，而且多个文本单元之间的顺序也是正确的。通过过程200，可以自动衡量所获得的文本序列是否是正确的识别结果，获得精确度得以保证的校正版本。
[0060]
在一些实施例中，信息处理系统110可以多次迭代地执行过程200，判断文本序列
106中两个或多个顺序文本单元是否能够即存在于知识库120中又具有较高的相互依赖程度。通过多轮迭代，可以定位出文本序列106中被确认为正确的文本单元。这些正确的文本单元将被包括到文本序列106的校正版本112中。在下文将讨论到的一些实施例中，文本序列106中被确定为正确的文本单元还可以被用作“锚文本单元”，用于辅助校正文本序列106中可能存在的错误文本单元。
[0061]
在一些实施例中，如果在框210确定当前提取的多个文本单元中至少一个文本单元未被包括在知识库120中，可以认为该文本单元有可能是被错误识别的文本单元。注意，虽然未被包括在知识库120中的文本单元理论上可能是新出现的文本单元，但考虑到其出现概率较低，因此可以先假设该文本单元是误识别的文本单元。
[0062]
在一些实施例中，如果在框220确定多个文本单元之间的相互依赖程度较低，这意味着虽然这些文本单元各自都存在于知识库120中，但它们共同出现在一个句子中的概率较低。这种情况意味着多个文本单元中可能存在误识别的情况，这样的误识别可能是文本单元的一个或多个字符被误识别或者文本单元的顺序识别错误。
[0063]
例如，非文本文件102中呈现的一个文本单元在文本序列106中被误识别为另一文本单元(例如，由于字符识别错误，识别出多余的字符，或者识别丢失了字符)，但误识别后的文本单元仍然对应于相关知识领域中的术语。例如，如果非文本文件102中呈现的“高血脂”被误识别为“高血压”，但“高血压”这个术语可能仍然存在知识库120中。被误识别的文本单元与文本序列106中相邻的文本单元之间的相互依赖程度可能会比较小。在另外的示例中，如果多个文本单元的顺序被识别错误也可能会导致每个文本单元均存在于知识库120中，但它们之间的相互依赖程度较小。
[0064]
在一些实施例中，如果在框210确定当前提取的多个文本单元中至少一个文本单元未被包括在知识库120中，或者在框220确定多个文本单元之间的相互依赖程度较低，信息处理系统110还可以框230校正多个文本单元，以获得校正后的多个文本单元作为文本序列106的校正版本112的至少一部分。例如，在上文给出的示例文本序列106“临床提示直ca惠肠者检查，现片示”中，假设文本单元“直ca”和“惠肠者”不存在于知识库120中，或者存在于知识库120中但彼此之间的mi低于阈值，那么信息处理系统110可以确定要校正这两个文本单元“直ca惠肠者”。
[0065]
在一些实施例中，信息处理系统110通过自动校正的方式，生成针对要校正的多个文本单元的一个或多个候选组合单元，并确定这些候选组合单元中是否可用于校正多个文本单元。由于无法准确定位多个文本单元中哪个文本单元是被误识别的，因此在校正过程中将多个文本单元视为整体来确定候选组合单元。也就是说，一个候选组合单元可以被认为是多个文本单元的组合的可能的校正结果。
[0066]
在一些实施例中，信息处理系统110可以借助辅助工具来生成多个文本单元的候选组合单元。图3示出了根据本公开的这样的实施例的信息处理环境100的示意图。如图3所示，环境100还包括错误词汇词典340，其中包括多个错误文本单元和针对每个错误文本单元的至少一个校正文本单元。如图所示，在错误词汇词典340中，每个错误文本单元342被映射到一个或多个校正文本单元344-1、
……
344-m(统称为或单独称为校正文本单元344)，其中m是大于等于1的正整数。
[0067]
错误词汇词典340可以是通过收集对文本识别的错误结果的校正而生成的。例如，
由文本识别生成的参考文本序列122中可能存在一些错误识别结果。参考文本序列122中被标注为错误的文本单元可以包括在错误词汇词典340中。此外，还可以获得针对这些错误文本单元342的校正文本单元344。在不同情况下，例如不同的原始非文本文件中，同一个错误文本单元342可能被校正为不同的文本单元，因此可能存在多个校正文本单元344。
[0068]
在一些实施例中，对错误文本单元342的标注和/或校正可以由用户130通过手动方式来实现。除此之外或者作为备选，还可以借助其他工具来标注错误文本单元342以及确定对应的校正文本单元344。在一些实施例中，还可以对文本序列122中的错误文本单元以及对应的校正文本单元进行统计，以将出现频率较高的错误文本单元342和出现频率较高的校正文本单元344收集到错误词汇词典340中。
[0069]
错误词汇词典340提供了对不同错误文本单元如何校正的知识。这样的知识可以用于辅助确定针对文本序列106中可能被误识别的多个文本单元的候选组合单元。在一些实施例中，获得参考文本序列122所采用的文本识别算法或引擎可以与对非文本文件102所采用的文本识别算法或引擎相同或相似。这样可以使错误词汇词典340能够捕获关于所采用的文本识别算法或引擎可能出现的典型错误以及针对这样的错误的校正。
[0070]
在一些实施例中，除错误词汇词典340之外或者作为备选，信息处理系统100还可以调用输入法引擎350来确定针对文本序列106中可能被误识别的多个文本单元的候选组合单元。如下文将详细讨论的，输入法引擎350可以被用于确定与多个文本单元中的字符具有相似读音或字形的字符，从而可以为多个文本单元生成一些候选组合单元用于执行校正。输入法引擎350可以是适合用于输入与多个文本单元相关的自然语言的引擎。
[0071]
在下文中，将先结合图4至图6来详细讨论为何生成候选组合单元的一些实施例，然后再结合图7和图8来讨论如何基于所生成的候选组合单元来校正多个文本单元。
[0072]
候选校正集的确定
[0073]
如图3的环境所示，信息处理系统110可以借助错误词汇词典340或输入法引擎350来生成多个文本单元的候选组合单元用于校正。下文将分别讨论基于错误词汇词典和基于输入法引擎的校正候选的生成。
[0074]
基于错误词汇词典生成校正候选
[0075]
图4示出了根据本公开的一些实施例的确定校正候选的过程400的流程图。过程400例如可以由信息处理系统110借助图3的错误词汇词典340来实现。为便于讨论，下文将参考图3的环境100来描述过程400。
[0076]
在框405，信息处理系统110确定多个文本单元的组合是否与错误词汇词典340中的文本单元相匹配。由于多个文本单元被怀疑是文本识别引擎105误识别的结果，但错误的原因无法确定，因此将多个文本单元作为整体来考虑候选组合单元。多个文本单元的组合(或者也称为组合文本单元)包括这些个体文本单元中的多个字符。
[0077]
信息处理系统110可以搜索错误词汇词典340以确定可能与多个文本单元的组合相匹配的文本单元。在此使用的“匹配”指的是多个文本单元的组合与错误词汇词典340中的文本单元之间的文本相似度大于一定阈值。
[0078]
在一些实施例中，信息处理系统110可以同时搜索错误词汇词典340中的错误文本单元342和校正文本单元344。在从错误词汇词典340确定匹配文本单元时，信息处理系统110可以衡量多个文本单元的组合与错误词汇词典340中的文本单元之间的相似度。在一些
实施例中，相似度的衡量可以按多个文本单元的组合与错误词汇词典340中的文本单元之间匹配字符的数目来确定。
[0079]
在一些实施例中，信息处理系统110可以通过最大匹配法，例如正向最大匹配(fmm)和/或反向最大匹配(vmm)，来确定多个文本单元的组合与错误词汇词典340中的文本单元是否匹配。fmm和vmm的区别在于扫描顺序不同，其中fmm按从左到右衡量匹配字符的数目，而vmm按从右到左的顺序衡量匹配字符的数目。
[0080]
如果通过fmm和/或vmm，确定多个文本单元的组合至少部分匹配于错误词汇词典340中的某个文本单元(称为“目标文本单元”)，例如多个文本单元所包括的连续字符与错误词汇词典340中的某个文本单元之间具有较多的匹配字符，则多个文本单元的组合与该文本单元至少部分匹配，并且该文本单元可以被确定为目标文本单元。
[0081]
如果确定多个文本单元的组合至少部分匹配于所述错误词汇词典中的目标文本单元，在框410，信息处理系统110可以从错误词汇词典确定匹配的目标文本单元对应的一个或多个校正文本单元。如果目标文本单元是错误文本单元342，则获取该错误文本单元342对应的一个或多个校正文本单元。如果目标文本单元是校正文本单元344，则可以获取该校正文本单元344本身，并且可选地还可以获取被映射到同一错误文本单元342的另一个或多个校正文本单元344(如果存在的话)。在一些实施例中，可能可以从错误词汇词典340确定多个目标文本单元，从而获得对应的多个校正文本单元。
[0082]
在框415，信息处理系统110基于至少一个校正文本单元来确定针对多个文本单元的组合的至少一个候选组合单元。
[0083]
在一些实施例中，所获得的校正文本单元可以被直接用作多个文本单元的组合的候选组合单元。例如，假设要校正的多个文本单元的组合是上文提及的“直ca惠肠者”，可以从错误词汇词典340中通过该组合的全部字符搜索到匹配的错误文本单元“直ca惠肠者”。该错误文本单元被映射到校正文本单元“直肠ca患者”和“ca直肠患者”，这些校正文本单元可以被确定为“直ca惠肠者”的候选组合单元。在一些实施例中，如果多个文本单元的组合“直ca惠肠者”中的部分字符，例如“直ca肠”与错误词汇词典340中的文本单元(例如，校正文本单元“直肠ca”)相匹配，那么可以将该文本单元对应的校正文本单元(例如，“直肠ca”)与多个文本单元的组合中的其他字符共同组成候选组合单元。
[0084]
在一些实施例中，仅在确定多个文本单元中的至少一个文本单元未被包括在知识库120中的情况下，信息处理系统110可以借助错误词汇词典340来执行生成针对多个文本单元的候选组合单元。因为文本单元不存在于知识库120中，可能是单个文本单元中的字符被误识别(例如，字符错误，丢失字符或者存在多余字符)等，这样的单个错误文本单元可能在错误词汇词典340中被校正。在一些实施例中，如果确定多个文本单元均存在于知识库120中，但多个文本单元之间相互依赖程度较低，也可以借助错误词汇词典340来确定候选组合单元。
[0085]
由于错误词汇词典中包含了对文本识别错误的先前校正知识，借助错误词汇词典来辅助文本单元的校正，可以减少校正所需要的计算量，并且还可以提高校正效率。在一些实施例中，随着错误文本单元不断被使用者标注和校正，错误词汇词典中的知识(即，错误文本单元及其对应的校正文本单元)可以不断被丰富。例如，在对当前处理的非文本文件102提取文本序列过程中，如果发现某个文本单元如何正确识别或者被自动校正，可以通过
引入使用者的手动标注的方式进行校正。本次校正的错误文本单元和校正文本单元可以被加入错误词汇词典。在一些示例中，使用者也可以根据对所使用的文本识别算法和引擎的分析确定可能会出现的新的识别错误，并将新的错误和对应的校正都增加到错误词汇词典，以供后续文本识别校正使用。
[0086]
在一些应用中，非文本文件的文本识别结果(例如，ocr识别结果)可能仅部分被用于后续使用，因此由ocr识别的文本信息的错误可以不需要一次性全部被校正，而是可以优先校正与后续要使用的文本的提取相关的文本识别错误。
[0087]
基于搜索引擎生成校正候选
[0088]
在一些实施例中，除错误词汇词典340外或者作为备选，还可以利用输入法引擎350来生成多个文本单元的候选组合单元。图5示出了根据本公开的另一些实施例的确定校正候选的过程的流程图。过程500例如可以由信息处理系统110借助图3的输入法引擎350来实现。为便于讨论，下文将参考图3的环境100来描述过程500。
[0089]
在框505，信息处理系统110确定多个文本单元的组合所包括的多个字符中的至少一个字符的读音信息和/或字形信息。
[0090]
读音信息可以是在输入法引擎350，例如读音输入法引擎中用于输入对应字符的信息。字形信息可以是在输入法引擎350，例如字形输入法引擎中用于输入对应字符的信息。例如，对于汉字，读音信息可以包括拼音，其可用于由拼音输入法引擎来输入对应汉字；字形信息可以包括汉字的笔画，其可用于由五笔输入法引擎来输入对应汉字。
[0091]
应当理解，除拼音和笔画之外，还可以确定汉字的其他读音信息或字形信息，只要所使用的输入法引擎350能够支持基于这样的信息的文本输入。对于其他自然语言，例如韩文、英文等，也可以利用对应的输入法引擎来确定候选字符序列。
[0092]
在一些实施例中，取决于输入法引擎150的文本输入能力，提供到输入法引擎150的读音信息和字形信息可以不同。例如，对于汉字，一些输入法引擎可以支持对单个或多个汉字的完整拼音的输入和/或部分拼音(例如，汉字的声母)进行输入。又例如，一些输入法引擎可以支持对单个或多个汉字的完整笔画或者第一个笔画进行输入。
[0093]
在一些实施例中，信息处理系统110可以确定多个文本单元的组合中的全部字符的读音信息或字形信息，用于提供给输入法引擎350。这样，可以利用输入法引擎350来探索在实际应用中较常出现的具有类似读音或字形的字符组合。在一些实施例中，信息处理系统110可以仅确定部分字符的读音信息和/或字形信息，用于提供给输入法引擎350。对于其他
[0094]
在一些情况下，如果多个文本单元中包括混合语言字符(即，包括多种语言的字符)，例如同时包括汉字和英文字母，可以忽略其中少量出现或者无法通过输入法引擎350来获得候选字符序列的那些字符。
[0095]
在一些情况下，多个文本单元的误识别可能包括顺序错误，这可能包括文本单元与文本单元之间的顺序错误，或者文本单元中的字符顺序错误。因此，在基于输入法引擎来确定候选组合单元时，信息处理系统110还可以调整多个文本单元所包括的多个字符的顺序，获得重排序的多个字符。信息处理系统110可以确定重排序的多个字符中全部字符或部分字符的读音信息和/或字形信息用于输入给输入法引擎350。
[0096]
在框510，信息处理系统110基于所确定的读音信息和字形信息中的至少一项，确
定分别与至少一个字符具有相同或相似读音或字形的多个候选字符序列。具体地，信息处理系统110可以调用输入法引擎350，将读音信息和/或字形信息输入到输入法引擎350，并获得由输入法引擎350给出的候选项。信息处理系统110可以从输入法引擎350给出的候选项提供的候选项中确定候选字符序列。
[0097]
在文本识别中，被误识别的文本单元可能与对应的正确文本单元之间具有读音或字形上的相似性。当前可用的很多输入法引擎具有一定的联想功能，可以从输入法字库中确定出与用户输入的读音信息或字形信息相同或相似读音的字符候选项供用户选择。因此，借助输入法引擎350，可以获得与多个文本单元中的一个或字符具有相同或相似读音或字形的候选字符序列。候选字符序列包括由输入法引擎350基于读音信息和/或字形信息提供的单个或多个字符。在一些实施例中，取决于输入法引擎350的能力，在提供单个字符的读音信息或字形信息的情况下，输入法引擎350也可能基于此确定出多个字符。
[0098]
在一些实施例中，输入法引擎350基于读音信息或字形信息可以生成具有相同或相似读音或字形的多个候选项。信息处理系统110可以选择输入法引擎350生成的排序靠前的一个或多个候选项用作针对候选字符序列。因为输入法引擎350可以基于用户输入习惯、实际语料库中较常出现的字符等来决定将哪些候选项排序更靠前。一般而言，用户经常输入或者实际语料库中经常出现的候选项会被排序在更靠前的位置。因此，选择这样的候选项用作候选字符序列，可以有更高的概率能够用于校正多个文本单元的误识别。
[0099]
在一些实施例中，对于相同的单个字符或多个字符，如果向输入法引擎350提供多种读音信息(例如，完整拼音和汉字声母)，信息处理系统110还可以将输入法引擎350针对每种读音信息提供的排序靠前的一个或多个候选项确定为候选字符序列。类似地，如果还向输入法引擎350提供字形信息，也可以将排序靠前的一个或多个候选项确定为候选字符序列。
[0100]
图6示出了根据本公开的一些实施例的基于输入法引擎的校正候选集的确定的示意图。图6示出了输入法引擎的多个输入界面。在图6的示例中，要确定与文本序列106中多个文本单元的组合“直ca惠肠者”中的一个或多个字符具有相同或相似读音的候选字符序列。由于“直ca惠肠者”包含英文字母“ca”，可以先不考虑“ca”，而考虑其余多个字符“直惠肠者”的读音信息。
[0101]
在输入界面610示出的示例中，多个字符“直惠肠者”的顺序被调整，获得重排序的多个字符“直肠惠者”。在该示例中，向输入法引擎350提供重排序的多个字符“直肠惠者”的部分拼音(zh ch h zh)。输入法引擎350提供了相应的多个候选项，这些候选项具有相应排序，代表输入法引擎350认为更符合输入的读音信息的概率。信息处理系统110可以从中确定排序靠前的候选项612“直肠患者”和候选项614“直肠患者”作为候选字符序列。
[0102]
在输入界面620示出的示例中，重排序的多个字符“直肠惠者”的完整拼音(zhi chang hui zhe)被提供给输入法引擎350。信息处理系统110可以从输入法引擎350提供的候选项中确定排序靠前的候选项622“直肠挥着”作为候选字符序列。
[0103]
在输入界面630示出的示例中，未被重排序的多个字符“直惠肠者”的完整拼音(zhi hui chang zhe)被提供给输入法引擎350。信息处理系统110可以从输入法引擎350提供的候选项中确定排序靠前的候选项632“只会唱着”作为候选字符序列。
[0104]
在一些实施例，信息处理系统110可以将多个文本单元所包括的全部字符的读音
信息和/或字符信息一次性提供给输入法引擎350，以由输入法引擎350探索这些读音和/或字符信息可能对应的候选项，如图6的示例所示。在一些实施例中，信息处理系统110在将全部字符的读音信息和/或字符信息划分为多个信息部分，并分别提供给输入法引擎350。信息处理系统110可以将输入法引擎350每次提供的排序靠前的候选项组合成候选字符序列。在一些实施例中，信息处理系统110也可以仅借助输入法引擎350来生成针对多个文本单元中的部分字符(至少一个字符)的字符候选项。
[0105]
继续返回参考图5，在过程500的框515，信息处理系统110基于多个候选字符序列来生成针对多个文本单元的组合的多个候选组合单元。
[0106]
在一些实施例中，如果在确定某个字符候选序列时多个文本单元所包括的一个或多个其他字符被忽略，那么可以将被忽略的字符(可以是其他语言的字符或者是不需要通过读音或字形信息来确定候选的字符)与该字符候选序列组合成针对多个文本单元的组合的候选组合单元。
[0107]
例如，在图6的示例中，多个文本单元的组合“直ca惠肠者”中英文字母“ca”未被输入法引擎350用于确定候选字符序列，因此在确定针对多个文本单元的组合的候选组合单元时，信息处理系统110将被忽略的英文字母“ca”合并到所确定的多个候选字符序列中。所忽略的英文字母“ca”可以被放在每个候选字符序列的特定位置或多个不同位置处，以构建对应的单个或多个文本序列。例如，“ca”可以被放置候选字符序列612“直肠患者”之前，得到文本序列“ca直肠患者”。
[0108]
在一些实施例中，如果多个文本单元的组合中的一些其他字符与多个候选字符序列的相对位置是可确定的，则可以按对应的相对位置来合并其他字符和多个候选字符序列，以得到对应的文本序列。例如，如果多个文本单元的组合“病人无高血敏”中，“高血敏”对应的读音或字形信息被用于通过输入法引擎350确定出候选字符序列，该字符序列可以与其余字符“病人无”合并成文本序列。
[0109]
在一些实施例中，如果多个文本单元所包括的全部字符的读音信息和/或字形信息均被用于通过输入法引擎350确定出候选字符序列，该字符候选序列可以被直接确定为针对多个文本单元的组合的候选组合单元。
[0110]
上文讨论了通过输入法引擎350确定针对多个文本单元的组合的候选组合单元的情况。在一些实施例中，信息处理系统110可以过程200的框200处确定多个文本单元的相互依赖程度较低(例如，不超过阈值依赖程度)或者在过程400的框450处确定无法从错误词汇词典340中获得与多个文本单元的组合至少部分匹配的目标文本单元时，开始借助输入法引擎350来生成候选组合单元。在其他实施例中，信息处理系统110也可以在确定需要校正多个文本单元的情况下，同时借助错误词汇词典340和输入法引擎350，或者仅借助输入法引擎350来确定候选组合单元。
[0111]
基于候选校正集的错误校正
[0112]
图7示出了根据本公开的一些实施例的文本单元校正的过程700的流程图。过程700例如可以由信息处理系统110来实现。
[0113]
在框710，信息处理系统110生成针对多个文本单元的组合的至少一个候选组合单元。候选组合单元的生成可以由通过上文讨论的一些实施例来实现。
[0114]
在获得候选组合单元后，信息处理系统110可以进一步衡量候选组合单元是否能
够用于校正多个文本单元。因此，在框720，信息处理系统110将文本序列106中与多个文本单元相邻的至少一个锚文本单元与至少一个候选组合单元合并，以组成至少一个候选文本序列。至少一个锚文本单元包括文本序列106中被确定为正确的至少一个文本单元。
[0115]
在一些实施例中，这些被确定为正确的锚文本单元可以在过程200中被确定为即包括在知识库120中并且与其相邻的文本单元之间的相互依赖程度又非常高。在一些实施例中，也可以通过手动方式由用户标注文本序列106中的一个或多个正确文本单元以作为锚文本单元。
[0116]
在一些实施例中，文本序列106的一个或多个锚文本单元可以位于要校正的多个文本单元之前和/或在要校正的多个文本单元。在一些实施例中，还可以使用文本序列106中连续的多个锚文本单元。
[0117]
图8示出了根据本公开的一些实施例的文本单元校正的示意图。在图8的示例中，文本序列106中的多个文本单元810“直ca惠肠者”要校正。文本序列106中的文本单元820“临床”、文本单元830“提示”和文本单元840“检查”是被确定为是正确的文本单元，并且这些文本单元与多个文本单元810“直ca惠肠者”相邻，因此可以被用作锚文本单元。
[0118]
假设借助错误词汇词典340，信息处理系统110确定针对多个文本单元810“直ca惠肠者”的候选组合单元811“直肠ca患者”和候选组合单元812“ca直肠患者”。此外，借助输入法引擎350，信息处理系统110还确定针对多个文本单元810“直ca惠肠者”的以下候选组合单元：候选组合单元813“ca直肠患者”，其包括图6的字符序列候选612；候选组合单元814“ca职场患者”，其包括图6的字符序列候选614、候选组合单元815“ca直肠挥着”，其包括图6的字符序列候选622，和候选组合单元816“ca只会唱着”，其包括图6的字符序列候选632。
[0119]
信息处理系统110将每个候选组合单元与所选定的锚文本单元820、830和840合并成候选文本序列，例如图8所示的候选文本序列811、812、813、814和815。注意，由于通过错误词汇词典340确定的候选组合单元812和由输入法引擎350确定的候选组合单元813重复，仅基于此生成一个候选文本序列即可。
[0120]
在框715，信息处理系统110确定至少一个候选文本序列各自的序列置信度。例如，在图8的示例中，信息处理系统110可以确定候选文本序列851至855各自的序列置信度。序列置信度指示候选文本序列能够形成正确句子或者句子的一部分的概率，也即候选文本序列在实际文本使用中可能会出现的概率。因为候选文本序列中存在被认为是争取的一个或多个锚文本，如果所确定的序列置信度越高，那么意味着为要校正的多个文本单元生成的候选组合单元是正确的概率更高。相反，如果序列置信度越低，意味着候选组合单元是正确的概率越低，具有较小的概率与锚文本单元一起出现做一个句子中。
[0121]
在一些实施例中，假设候选文本序列包括m个文本单元，被表示为s＝w1,w2,...,wm，其中wi表示第i个文本单元。该候选文本序列的序列置信度可以通下式来确定：
[0122]
p(w1,w2,...,wm)＝p(w1)p(w2|w1)...p(wm|w1,...,w
m-1
)
ꢀꢀ
公式(2)
[0123]
在一些实施例中，考虑到通常第n个文本单元(例如，一个词)的出现可能仅与前n-1个文本单元相关，而与其它任何文本单元不相关，信息处理系统110可以利用n元语言模型来近似计算每个候选文本序列的序列置信度。
[0124]
n元语言模型是一种基于统计语言模型的算法。它的基本思想是将文本序列按文本单元进行大小为n的滑动窗口操作，形成了长度是n的序列片段，其中n为自然数。每个序
列片段称为一个元(gram)。通过对所有序列片段的出现频率进行统计，可以确定整个文本序列出现的概率，即序列置信度。因此，整个文本序列出现的概率就是各个文本单元出现概率的乘积。这些概率可以通过从语料库中统计n个文本单元同时出现的频率来确定。常用的n元语言模型二元(bi-gram)语言模型(其中n＝2)，三元(tri-gram)语言模型(其中n＝4)等。当然，更多元的语言模型也是可能的。以二元语言模型为例，针对包括m个文本单元的候选文本序列，通过二元语言模型计算的序列置信度可以被表示为：
[0125][0126]
其中p(wi|w
i-1
)表示条件概率，指示在已知第i-1个文本单元存在的情况下第i个文本单元wi出现的概率。可以借助语料库来确定该条件概率。
[0127]
在确定一个或多个候选文本序列的序列置信度后，在框720，信息处理系统110基于所确定的序列置信度，从至少一个候选组合单元确定针对多个文本单元的校正结果。
[0128]
在一些实施例中，如果仅生成针对多个文本单元的多个候选组合单元，并计算与锚文本单元合并形成的多个候选文本序列各自的序列置信度，那么信息处理系统110可以基于序列置信度对多个候选文本序列进行排序，并且选择序列置信度最高的候选文本序列。所选择的候选文本序列中所包括的候选组合单元可以被确定为校正后的多个文本单元。校正后的多个文本单元可以被包括到文本序列106的校正版本112中。
[0129]
例如，在图8的示例中，假设在五个候选文本序列851至855中，确定候选文本序列851的序列置信度最高，那么其中的候选组合单元“直肠ca患者”811可以被确定为是文本序列106中的多个文本单元810的校正版本。
[0130]
在一些实施例中，可以选择序列置信度排序靠前的多个候选文本序列，并将其中的多个候选组合单元提供给用户，由用户确认那个候选组合单元可以被用作校正后的多个文本单元。
[0131]
在一些实施例中，还可以将序列置信度与置信度阈值相比较。例如，在仅确定一个候选文本序列的情况下，可以将该候选文本序列的序列置信度与置信度阈值进行比较。如果所确定的序列置信度超过置信度阈值，可以将组成该候选文本序列的候选组合单元确定为校正后的多个文本单元。
[0132]
在一些情况下，为了进一步确保校正结果的准确性，信息处理系统110还可以将多个候选文本序列各自的序列置信度分别与置信度阈值相比较。信息处理系统110可以将排序最高或者靠前、同时序列置信度超过置信度阈值的候选文本序列中的候选组合单元确定为校正后的多个文本单元。
[0133]
在一些实施例中，如果所确定的候选文本序列的序列置信度均低于置信度阈值，这意味着所生成的候选组合文本可能均不太正确，无法用于与锚文本单元一起形成正确的句子。在这种极端情况下，也可以引入人工方式进行进一步校正。
[0134]
以上示例实施例讨论了如何校正文本序列106中可能存在识别错误的文本单元。在一些实施例中，信息处理系统110可以通过迭代地确定文本序列106中的正确文本单元，同时校正可能存在错误的文本单元，最终获得文本序列106的完整的校正版本112。
[0135]
示例设备
[0136]
图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。图1和图3的信息处理系统110的全部或部分组件可以被实现在设备900。
[0137]
如图所示，设备900包括处理单元901，其可以根据存储在只读存储器(rom)902中的计算机程序指令或者从存储单元908加载到随机访问存储器(ram)903中的计算机程序指令，来执行各种适当的动作和处理。在ram 903中，还可存储设备900操作所需的各种程序和数据。处理单元901、rom 902以及ram 903通过总线904彼此相连。输入/输出(i/o)接口905也连接至总线904。
[0138]
设备900中的多个部件连接至i/o接口905，包括：输入单元906，例如键盘、鼠标等；输出单元907，例如各种类型的显示器、扬声器等；存储单元908，例如磁盘、光盘等；以及通信单元909，例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0139]
处理单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。处理单元901的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理单元901可以执行上文所描述的各个方法和处理，例如过程200、过程400、过程500和/或过程700。例如，在一些实施例中，过程200、过程400、过程500和/或过程700可被实现为计算机软件程序，其被有形地包含于计算机可读介质，例如存储单元908。在一些实施例中，计算机程序的部分或者全部可以经由rom 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到ram 903并由处理单元901执行时，可以执行上文描述的过程200、过程400、过程500和/或过程700的一个或多个步骤。备选地，在其他实施例中，处理单元901可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行过程200、过程400、过程500和/或过程700。
[0140]
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)等等。
[0141]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0142]
根据本公开的示例性实现方式，提供了一种计算机可读存储介质，其上存储有计算机可执行指令或程序，其中计算机可执行指令或程序被处理器执行以实现上文描述的方法或功能。计算机可读存储介质可以包括非瞬态计算机可读介质。根据本公开的示例性实现方式，还提供了一种计算机程序产品，包括计算机可执行指令或程序，而计算机可执行指令或程序被处理器执行以实现上文描述的方法或功能。该计算机程序产品可以被有形地体现在非瞬态计算机可读介质上。
[0143]
这里参照根据本公开实现的方法、装置、设备和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框
图中各方框的组合，都可以由计算机可执行指令或程序实现。
[0144]
在本公开的上下文中，计算机可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。计算机可读介质可以是机器可读信号介质或机器可读储存介质。计算机可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0145]
此外，虽然采用特定次序描绘了各操作，但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行，或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地，在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
[0146]
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种计算机系统集成用主机的制作方法

信息处理方法、设备、介质和程序产品与流程

相关文献

最热文献