一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本纠错方法、装置、计算机设备及计算机可读存储介质与流程

2021-10-29 20:31:00 来源:中国专利 TAG:计算机 自然语言 纠错 装置 可读


1.本技术涉及自然语言处理技术领域,特别涉及一种文本纠错方法、装置、计算机设备及计算机可读存储介质。


背景技术:

2.文本纠错是指应用人工智能技术自动识别一段文本中的错误字符,对错误字符进行更正,从而得到正确的文本。在相关的文本纠错方法中,通常需要预先建立一个字典,该字典用于存储错误字符与正确字符之间的对应关系,在获取到待纠错的文本后,基于该字典对文本中的各个字符进行匹配,从而确定出文本中的错误字符,并将错误字符替换为对应的正确字符。
3.在上述过程中,文本纠错仅仅依赖于字典中所存储的内容,这就导致文本纠错的覆盖范围极小,且准确率较低。


技术实现要素:

4.本技术实施例提供了一种文本纠错方法、装置、计算机设备及计算机可读存储介质,能够提高文本纠错的全面性和准确性。该技术方案如下:
5.一方面,提供了一种文本纠错方法,该方法包括:
6.获取待纠错的第一文本,该第一文本包括至少两个字符;
7.分别基于每个字符的结构、读音以及在该第一文本中的上下文信息,获取该每个字符的字形特征、读音特征以及语义特征;
8.分别对该每个字符的字形特征、读音特征以及语义特征进行加权融合,得到该每个字符的融合特征;
9.对得到的至少两个融合特征进行解码,得到至少两个目标字符,将该至少两个目标字符构成第二文本,该第二文本是对该第一文本中的错误字符进行纠正后的文本。
10.一方面,提供了一种文本纠错装置,该装置包括:
11.文本获取模块,用于获取待纠错的第一文本,该第一文本包括至少两个字符;
12.特征获取模块,用于分别基于每个字符的结构、读音以及在该第一文本中的上下文信息,获取该每个字符的字形特征、读音特征以及语义特征;
13.特征融合模块,用于分别对该每个字符的字形特征、读音特征以及语义特征进行加权融合,得到该每个字符的融合特征;
14.特征解码模块,用于对得到的至少两个融合特征进行解码,得到至少两个目标字符,将该至少两个目标字符构成第二文本,该第二文本是对该第一文本中的错误字符进行纠正后的文本。
15.在一种可能实现方式中,该特征获取模块,包括:
16.第一获取子模块,用于通过文本纠错模型中的字形解析网络,基于该至少两个字符的结构,分别提取该至少两个字符的字形特征;
17.第二获取子模块,用于通过该文本纠错模型中的语音识别网络,基于该至少两个字符的读音,分别提取该至少两个字符的读音特征;
18.第三获取子模块,用于通过该文本纠错模型中的语义识别网络,基于该至少两个字符在该第一文本中的上下文信息,分别提取该至少两个字符的语义特征。
19.在一种可能实现方式中,该第一获取子模块,用于:
20.通过该字形解析网络,基于任一字符的结构以及至少两个参考字符的结构,生成该任一字符对应的字符节点图,该字符节点图用于指示该任一字符与该至少两个参考字符在结构维度的关联关系;
21.对该任一字符所对应的字符节点图进行特征提取,得到该任一字符对应的字形特征。
22.在一种可能实现方式中,该第一获取子模块,用于:
23.获取该每个字符对应的字符图像,该字符图像用于指示字符的结构;
24.通过该字形解析网络对该每个字符对应的字符图像进行图像特征提取,得到该每个字符的字形特征。
25.在一种可能实现方式中,该第二获取子模块,包括:
26.拼音获取单元,用于获取该每个字符对应的拼音,该拼音用于指示字符的读音;
27.拼音编码单元,用于通过该语音识别网络对该每个字符对应的拼音进行编码,得到该每个字符的读音特征。
28.在一种可能实现方式中,该拼音编码单元,用于:
29.通过该语音识别网络基于参考映射条件,对该每个字符对应的拼音进行数据处理,该参考映射条件包括将拼音中的翘舌音映射为对应的平舌音、将拼音中的鼻音映射为对应的边音、将拼音中的后鼻音映射为前鼻音和去除拼音的音调中的至少一项;
30.通过该语音识别网络分别对数据处理后的该拼音进行编码,得到该每个字符的该读音特征。
31.在一种可能实现方式中,该第二获取子模块,用于:
32.获取该每个字符对应的音频文件,一个该音频文件包括对一个字符进行朗读的语音信息;
33.通过该语音识别网络对该每个字符对应的音频文件进行音频特征提取,得到该每个字符的读音特征。
34.在一种可能实现方式中,该特征融合模块,包括:
35.第一融合子模块,用于对于任一字符,通过该文本纠错模型中的特征融合网络,对该任一字符的字形特征、读音特征以及语义特征进行特征融合,得到该任一字符对应的初始融合特征;
36.权重确定子模块,用于基于该任一字符对应的初始融合特征,分别确定该任一字符的字形特征所对应的第一权重、读音特征对应的第二权重以及语义特征对应的第三权重;
37.第二融合子模块,用于基于该第一权重、第二权重、第三权重,对该任一字符的字形特征、读音特征以及语义特征进行加权融合,得到该任一字符的融合特征。
38.在一种可能实现方式中,该权重确定子模块,用于:
39.获取该第一文本对应的文本语义特征;
40.对于任一字符,对该文本特征、该初始融合特征以及该任一字符的字形特征进行特征融合,得到第一中间特征;
41.对该文本特征、该初始融合特征以及该任一字符的读音特征进行特征融合,得到第二中间特征;
42.对该文本特征、该初始融合特征以及该任一字符的语义特征进行特征融合,得到第三中间特征;
43.分别基于该第一中间特征、该第二中间特征以及该第三中间特征确定该第一权重、该第二权重以及该第三权重。
44.在一种可能实现方式中,该第二融合子模块,用于:
45.分别基于该第一权重、该第二权重以及该第三权重,对该第一中间特征、该第二中间特征以及该第三中间特征进行加权融合,得到该融合特征。
46.在一种可能实现方式中,该特征解码模块,用于:
47.分别将每个融合特征解码为一个分类向量,该分类向量中的一个元素用于指示该融合特征对应于一个候选字符的概率;
48.分别将每个该分类向量中数值最大的元素所指示的候选字符,确定该目标字符。
49.在一种可能实现方式中,该装置还包括以下至少一项:
50.字体调整模块,用于将该第一文本中的该至少两个字符统一为参考字体;
51.字符去除模块,用于去除该第一文本中的外文字符。
52.一方面,提供了一种计算机设备,该计算机设备包括一个或多个处理器和一个或多个存储器,该一个或多个存储器中存储有至少一条计算机程序,该至少一条计算机程序由该一个或多个处理器加载并执行以实现该文本纠错方法所执行的操作。
53.一方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行以实现该文本纠错方法所执行的操作。
54.一方面,提供了一种计算机程序产品,该计算机程序产品包括至少一条计算机程序,该至少一条计算机程序存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该至少一条计算机程序,处理器执行该至少一条计算机程序,使得该计算机设备实现该文本纠错方法所执行的操作。
55.本技术实施例提供的技术方案,通过在对第一文本纠错时,充分考虑第一文本中各个字符本身的字形特征、读音特征以及各个字符在第一文本中的上下文语义特征,融合这三个维度的特征进行正确字符的预测,对于第一文本中出现的任一字符均能够进行识别、纠正,能够有效扩大文本纠错的覆盖范围,且多维的特征融合也能够提高文本纠错的准确率。
附图说明
56.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他
的附图。
57.图1是本技术实施例提供的一种文本纠错方法的实施环境示意图;
58.图2是本技术实施例提供的一种文本纠错方法的流程图;
59.图3是本技术实施例提供的一种文本纠错模型的示意图;
60.图4是本技术实施例提供的一种文本纠错方法的流程图;
61.图5是本技术实施例提供的一种字符节点图的示意图;
62.图6是本技术实施例提供的一种特征融合方法的示意图;
63.图7是本技术实施例提供的一种文本纠错方法的示意图;
64.图8是本技术实施例提供的一种资讯应用程序的界面示意图;
65.图9是本技术实施例提供的一种文本纠错模型的训练方法的流程图;
66.图10是本技术实施例提供的一种文本纠错装置的结构示意图;
67.图11是本技术实施例提供的一种终端的结构示意图;
68.图12是本技术实施例提供的一种服务器的结构示意图。
具体实施方式
69.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
70.本技术中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分,应理解,“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系,也不对数量和执行顺序进行限定。
71.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
72.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。本技术实施例涉及人工智能技术中的自然语言处理技术。
73.自然语言处理(nature language processing,nlp)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
74.为了便于理解本技术实施例的技术过程,下面对本技术实施例所涉及的一些名词
进行解释:
75.bert(bidirectional encoder representations from transformers,一种自然语言识别模型):是由谷歌发布的一种自然语言识别模型,bert模型中包括多个运算层,即多个transformers(转换器),各个transformers基于注意力机制获取文本的特征以及进行特征解码。该bert模型为已经预训练完成的模型,开发人员在应用该bert模型时,只需根据具体的自然语言处理任务,对该模型中的各个参数进行微调即可,从而能够有效降低模型的训练难度,降低模型训练的耗时。例如,在本技术实施例中,开发人员基于文本纠错任务,对bert模型进一步训练,使bert模型能够识别出文本中的错误字符,并更正为正确字符。
76.注意力机制:是利用有限的注意力资源,从大量信息中快速筛选出高价值的信息的手段。注意力机制包括两个方面,一方面是,决定需要关注输入信息的哪部分,另一方面中,分配有限的信息处理资源给重要的部分。
77.图1是本技术实施例提供的一种文本纠错方法的实施环境示意图,参见图1,该实施环境包括终端110和服务器140。
78.其中,终端110安装和运行有支持文本纠错的应用程序,例如,该应用程序是浏览器类应用程序、资讯类应用程序,示例性的,用户在输入一段文本进行数据搜索时,该应用程序能够对用户所输入的文本进行纠错,以提高搜索准确度,或者,该应用程序基于文本纠错功能纠正搜索结果中的错误字符,或者,过滤掉包含错误字符过多的搜索结果。需要说明的是,本技术实施例对该应用程序的类型不作限定。可选的,该终端110是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,本技术实施例对该终端110的设备类型不做限定。示例性的,终端110是用户使用的终端,终端110中运行的应用程序内登录有用户账号。终端110泛指多个终端中的一个,本实施例仅以终端110来举例说明。
79.服务器140可以是一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。服务器140用于为支持文本纠错的应用程序提供后台服务。可选的,服务器140承担主要文本纠错工作,终端110承担次要文本纠错工作;或者,服务器140承担次要文本纠错工作,终端110承担主要文本纠错工作;或者,服务器140或终端110分别可以单独承担文本纠错工作。
80.可选的,服务器140包括:接入服务器、自然语言处理服务器和数据库。接入服务器用于为终端110提供接入服务。自然语言处理服务器用于提供文本纠错有关的后台服务,该自然语言处理服务器可以搭载自然语言处理器,支持自然语言处理器多线程并行计算。自然语言处理服务器可以是一台或多台。当自然语言处理服务器是多台时,存在至少两台自然语言处理服务器用于提供不同的服务,和/或,存在至少两台自然语言处理服务器用于提供相同的服务,比如以负载均衡方式提供同一种服务,本技术实施例对此不加以限定。自然语言处理服务器中可以设置有文本纠错模型,在模型训练和应用过程中,该自然语言处理服务器可以搭载自然语言处理处理器,并支持自然语言处理处理器并行运算。其中,上述服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
81.上述终端110与服务器140可以通过有线或无线通信方式进行直接或间接地连接,
本技术实施例对此不作限定。
82.本技术实施例提供文本纠错方法能够与多种应用场景相结合,应用于多种应用程序中。例如,在资讯类应用程序中,资讯内容的质量会严重影响用户体验,通常情况下资讯内容包含错别字较多,则其质量较差,甚至可能是为了规避机器审核而故意设置错误字符,结合本技术实施例提供的技术方案,在对发布到应用程序中的资讯内容进行审时,先对资讯内容进行文本纠错,再基于正确的文本进行内容上的审核,一方面,能够过滤掉应用程序中的恶意内容,另一方面,对文本中的错误字符进行更正,能够提高应用程序的内容质量,提升用户体验。
83.图2是本技术实施例提供的一种文本纠错方法的流程图。该方法可以应用于上述终端或者服务器,而终端和服务器均能够视为一种计算机设备,在本技术实施例中,以计算机设备作为执行主体,对文本纠错方法进行介绍,参见图2,在一种可能实现方式中,该实施例包括以下步骤:
84.201、计算机设备获取待纠错的第一文本,该第一文本包括至少两个字符。
85.可选的,该第一文本是存储在计算机设备中的一段文本,或者,该第一文本是计算机设备从网络中截取的一段文本,或者,该第一文本是用户输入的一段文本,或者,对语音数据进行识别得到的文本,本技术实施例对具体采用哪种文本不作限定。在本技术实施例中,该第一文本包括多个字符,示例性的,该字符为中文字符,也可以是外文字符,可选的,该多个字符中包括错误字符。
86.202、计算机设备分别基于每个字符的结构、读音以及在该第一文本中的上下文信息,获取每个字符的字形特征、读音特征以及语义特征。
87.其中,字符的结构为字符中的笔画结构;可选的,该字符的读音由字符的拼音来表示,或者由朗读该字符的音频文件表示,本技术实施例对此不作限定;该上下文信息用于指示字符在文本中的含义。
88.在本技术实施例中,从多个维度对文本中的各个字符进行特征提取,充分考虑了字符本身的字形和读音,以及,各个字符在第一文本中的上下文语义,基于多维度的特征进行后续的文本纠错,从而能够提高纠错的全面性、准确性。
89.203、计算机设备分别对每个字符的字形特征、读音特征以及语义特征进行加权融合,得到每个字符的融合特征。
90.在一种可能实现方式中,字符的字形特征、读音特征以及语义特征对应于不同的权重,也即是,不同特征在后续文本纠错过程中的重要程度不同,计算机设备基于不同的权重分别对该字形特征、读音特征以及语义特征进行加权处理,再对加权处理后的特征进行融合,得到该融合特征。在后续文本纠错过程中,基于该融合特征进行正确字符的预测,能够使计算机设备更加关注重要特征,从而能够跟准确的预测出正确字符。需要说明的是,本技术实施例对特征进行融合的方法不作限定。
91.204、计算机设备对得到的至少两个融合特征进行解码,得到至少两个目标字符,将该至少两个目标字符构成第二文本,该第二文本是对第一文本中的错误字符进行纠正后的文本。
92.在一种可能实现方式中,该计算机设备能够将每个融合特征映射为一个目标字符,该目标字符即为计算机设备预测出的正确字符,该计算机设备确定各个目标字符的排
列顺序,基于该排列顺序对该至少两个字符进行排序,构成该第二文本。需要说明的是,本技术实施例对融合特征进行解码的方法不作限定。
93.本技术实施例提供的技术方案,通过在对第一文本纠错时,充分考虑第一文本中各个字符本身的字形特征、读音特征以及各个字符在第一文本中的上下文语义特征,融合这三个维度的特征进行正确字符的预测,对于第一文本中出现的任一字符均能够进行识别、纠正,能够有效扩大文本纠错的覆盖范围,且多维的特征融合也能够提高文本纠错的准确率。
94.上述实施例是对本技术实施方式的一个简要介绍,在一种可能实现方式中,上述文本纠错过程基于文本纠错模型实现,该文本纠错模型为已训练的模型,可选的,该文本纠错模型是存储在计算机设备中的模型,或者是网络中的模型。在一种可能实现方式中,该文本纠错模型为基于bert(bidirectional encoder representations from transformers,一种自然语言处理模型)模型构建的,图3是本技术实施例提供的一种文本纠错模型的示意图,参见图3,该文本纠错模型包括输入层301、特征提取层302以及输出层303。其中,该输入层301包括字形解析网络、语音识别网络、语义识别网络,该字形解析网络用于提取字符的字形特征(shapeembedding),该语音识别网络用于提取字符的读音特征(pinyinembedding),该语义识别网络用于提取字符在文本中的语义特征(charembedding);该特征提取层302包括特征融合网络,该特征融合网络由bert模型的主干网络以及注意力模块构成,能够基于注意力机制对输入模块所提取到的特征进行特征融合;该输出层303能够输出纠错后的文本。需要说明的是,上述对文本纠错模型的说明,仅是一种示例性说明,本技术实施例对文本纠错模型的结构不作限定。图4是本技术实施例提供的一种文本纠错方法的流程图,以下结合图3和图4,以该文本纠错方法基于上述文本纠错模型实现为例,对该文本纠错方法进行说明,在一种可能实现方式中,该实施例包括以下步骤:
95.401、计算机设备获取待纠错的第一文本,将该第一文本输入文本纠错模型。
96.在一种可能实现方式中,计算机设备响应于文本纠错指令,获取待纠错的第一文本。示例性的,该计算机设备是用户使用的终端,该终端安装和运行有支持文本纠错功能的应用程序,例如,该应用程序是资讯类应用程序,用户能够在该应用程序中搜索资讯内容,在一种可能实现方式中,用户在该应用程序中的搜索操作能够触发搜索指令以及文本纠错指令,计算机设备响应于该搜索指令,基于用户提供的搜索关键词查询搜索结果,响应于文本纠错指令,基于该搜索结果执行后续的文本纠错步骤,可选的,计算机设备将获取到的搜索结果中的全部文本作为该待纠错的第一文本,或者,将各个搜索结果的标题作为该第一文本,本技术实施例对此不作限定。
97.在本技术实施例中,以该文本纠错模型是基于bert模型构建的为例进行说明。在一种可能实现方式中,计算机设备将该第一文本输入文件纠错模型之前,先对第一文本进行预处理,可选的,终端将该第一文本中的该至少两个字符统一为参考字体,其中,该参考字符由开发人员进行设置,本技术实施例对此不作限定,例如,第一文本中包括繁体字符和简体字符,计算机设备将第一文本中的繁体字符转换为对应的简体字符。可选的,计算机设备去除该第一文本中的外文字符,例如,该纠错模型是针对于汉字字符进行纠错,则计算机设备可以去除第一文本中不在纠错范围内的外文字符。可选的,计算机设备还可以去除第
一文本中的特殊字符,对英文字符进行大小写转换等。当然,该计算机设备还可以通过其他方法对第一文件进行预处理,本技术实施例对此不作限定。
98.402、计算机设备通过文本纠错模型中的字形解析网络,基于该第一文本中至少两个字符的结构,分别提取该至少两个字符的字形特征。
99.在一种可能实现方式中,计算机设备获取字符的字形特征的方法,包括以下实现方式中的任一种:
100.实现方式一、在一种可能实现方式中,该计算机设备中存储有字符集合,该字符集合包括多个参考字符,计算机设备通过该字形解析网络,基于任一字符的结构以及至少两个参考字符的结构,生成该任一字符对应的字符节点图,该字符节点图用于指示该任一字符与该至少两个参考字符在结构维度的关联关系,计算机设备对该任一字符所对应的字符节点图进行特征提取,得到该任一字符对应的字形特征。在本技术实施例中,该字形解析网络能够对字符进行拆解,例如,字形解析网络基于字符的构字部件对字符进行拆解,也可以基于字符的笔画对字符进行拆解等,该字形解析网络基于字符的结构,即字符的拆解结果,构建字符节点图。图5是本技术实施例提供的一种字符节点图的示意图,以字符“雨”为例,计算机设备根据字符“雨”与参考字符在结构上的相似性生成字符节点图,每个字符均可以作为一个节点,有关联关系的节点通过边相互连接。在一种可能实现方式中,该字形解析网络能够为字符节点图中的各个边分配不同的权重,以图5中的节点501和节点502为例,计算机设备基于节点501和节点502所对应字符的笔画数目、相邻节点的数目,确定节点501和节点502之间的边的权重。示例性的,计算机设备确定节点之间的边的权重的方法表示为下述公式(1):
[0101][0102]
其中,w
ij
表示与字符i的节点与字符j的节点之间所连接的边的权重,s
i
表示字符i的笔画数目,s
j
表示字符j的笔画数目,d
j
表示与字符j的节点相邻的节点的数目。
[0103]
在一种可能实现方式中,计算机设备基于字符节点图以及图中各个边的权重,对该字符节点图进行向量化处理,示例性的,计算机设备基于node2vec算法将该字符节点图转换为一个字形向量,由该字形向量来表示字符的字形特征。当然,该字形特征也可以表示为其他形式,本技术实施例对此不作限定。在本身奇怪实施例中,通过构建字符节点图的方式,来获取字形相近的字符之间的关联关系,基于各个字符在字形结构维度的关联关系,生成各个字符对应的字形特征,能够确保获取到的字形特征的客观性、准确性。
[0104]
实现方式二、在一种可能实现方式中,该字形解析网络具备图像具备图像处理功能,能够进行图像特征提取,示例性的,该字形解析网络是基于卷积神经网络构建的,包括多个用于进行图像特征提取的卷积层。该计算机设备获取每个字符对应的字符图像,其中,该字符图像用于指示字符的结构,可选的,该字符图像是对第一文本中的各个字符分别进行截图所得到的图像。计算机设备通过该字形解析网络对每个字符对应的字符图像进行图像特征提取,得到每个字符的字形特征。需要说明的是,本技术实施例对该字形解析网络的结构以及图像特征提取的方法不作限定。在本技术实施例中,直接对字符图像进行图像特征提取,将提取到的图像特征作为字符的字形特征,能够高效、快速的获取到各个字符的字形特征。
[0105]
需要说明的是,上述对提取字符的字形特征的方法的说明,仅是一种可能实现方式的示例性说明,本技术实施例对具体采用哪种方法获取字形特征不作限定。在本技术实施例中,在文本纠错过程中,融入了字形维度的特征,使模型充分学习到正确字形与错误字形之间的关联,使文本纠错过程更贴近于人类本身对错误字符进行纠正的过程,进而提高文本纠错结果的准确性。
[0106]
403、计算机设备通过文本纠错模型中的语音识别网络,基于该第一文本中至少两个字符的读音,分别提取该至少两个字符的读音特征。
[0107]
在一种可能实现方式中,计算机设备获取字符的读音特征的方法,包括以下实现方式中的任一种:
[0108]
实现方式一、在一种可能实现方式中,计算机设备获取每个字符对应的拼音,该拼音用于指示字符的读音,计算机设备通过该语音识别网络对每个字符对应的拼音进行编码,得到每个字符的读音特征。示例性的,计算机设备中存储有字符与拼音之间的对应关系表,计算机设备通过查询该对应关系表,确定每个字符对应的拼音,计算机设备将各个拼音映射为拼音向量,由该拼音向量来指示字符的读音特征。可选的,计算机设备将拼音中的各个字母元素映射为一个子向量,再基于各个字母元素在拼音中的排列顺序,对各个字母元素对应的子向量进行拼接,得到该拼音向量,当然,该计算机设备也可以通过其他方式获取各个字符的拼音向量,本技术实施例对此不作限定。需要说明的是,本技术实施例中,仅以字符的读音特征表示为向量的形式为例进行说明,该读音特征也可以表示为矩阵等其他形式,本技术实施例对此不作限定。
[0109]
在一种可能实现方式中,计算机设备对各个字符的拼音进行编码之前,还可以对拼音进行近音化处理,以使读音相近的字符能够对应于相同的读音特征。示例性的,计算机设备通过该语音识别网络基于参考映射条件,对每个字符对应的拼音进行数据处理,再通过该语音识别网络分别对数据处理后的该拼音进行编码,得到每个字符的该读音特征。其中,该参考映射条件由开发人员进行设置,本技术实施例对此不作限定,示例性的,该参考映射条件包括将拼音中的翘舌音映射为对应的平舌音、将拼音中的鼻音映射为对应的边音、将拼音中的后鼻音映射为前鼻音和去除拼音的音调中的至少一项。在本技术实施例中,通过基于字符的拼音来提取字符的读音特征,且对读音相近的拼音进行近音化处理,使读音相近的拼音映射为相同的读音特征,能够使模型在近音字纠错中有良好的表现。
[0110]
实现方式二、在一种可能实现方式中,该语音识别网络具备对音频文件进行处理的功能,能够进行音频特征提取。示例性的,该字形解析网络是基于卷积神经网络构建的,包括多个用于进行音频特征提取的卷积层。计算机设备获取每个字符对应的音频文件,一个音频文件包括对一个字符进行朗读的语音信息,可选的,该音频文件是预先录制的,存储在该计算机设备中。计算机设备通过该语音识别网络对每个字符对应的音频文件进行音频特征提取,得到每个字符的读音特征。需要说明的是,本技术实施例对该语音识别网络的结构以及音频特征提取的方法不作限定。在本技术实施例中,通过基于字符对应的音频文件,提取读音特征,能够高效、快速的获取到各个字符的读音特征。
[0111]
需要说明的是,上述对提取字符的读音特征的方法的说明,仅是一种可能实现方式的示例性说明,本技术实施例对具体采用哪种方法获取读音特征不作限定。在本技术实施例中,在文本纠错过程中融合了字符的读音特征,能够使模型充分学习到正确字符与错
误字符的读音之间的相似性,使模型在后续对近音字进行纠错时有良好的表现。
[0112]
404、计算机设备通过文本纠错模型中的语义识别网络,基于该第一文本中的至少两个字符在该第一文本中的上下文信息,分别提取该至少两个字符的语义特征。
[0113]
在一种可能实现方式中,该语义识别网络是bert模型的输入层中用于提取语义特征的网络,该bert模型能够将输入的第一文本中的各个字符映射为一个charembedding,该charembedding也即是字符的语义特征。在一种可能实现方式中,该语义识别网络可以包括卷积神经网络、rnn(recurrent neural network,循环神经网络)等构建的,本技术实施例对该语义识别网络的结构不作限定。示例性的,计算机设备通过该语义识别网络中对第一文本进行双向特征提取,使各个字符的语义特征中能够融合第一文本的上下文信息,也即是,语义识别网络按照从左到右和从右到左的顺序依次对各个字符进行语义特征提取,在一次特征提取过程中,能够得到每个字符对应的一个隐层特征,经过两次特征提取,每个字符能够对应于两个隐层特征。以计算机设备对第一文本中相邻的第一字符和第二字符进行特征提取为例,该第一字符位于第二字符的左侧,在一种可能实现方式中,在从左到右的特征提取顺序中,计算机设备在提取到第一字符的隐层特征后,可以将该隐层特征传递给第二字符,结合该第一字符的隐层特征来生成第二字符的隐层特征,也即是,每个字符的隐层特征中都融合了前一个字符的语义信息;在从右到左的特征提取顺序中,计算机设备在获取到第二字符的隐层特征后,可以将该隐层特征传递给第一字符,结合该第二字符的隐层特征来生成该第一字符的隐层特征,也即是,每个字符的隐层特征中都融合了后一个字符的语义信息。计算机设备对这两个隐层特征进行特征融合,得到每个字符对应的语义特征。需要说明的是,上述对语义特征获取方法的说明,仅是一种可能实现方式的示例性说明,本技术实施例对具体采用哪种方法获取语义特征不作限定。在本技术实施例中,通过获取包含文本上下文信息的语义特征,结合文本的上下文对错误字符进行识别和纠正,能够提高文本纠错的准确性。
[0114]
需要说明的是,上述步骤402至步骤404是分别基于每个字符的结构、读音以及在该第一文本中的上下文信息,获取每个字符的字形特征、读音特征以及语义特征的步骤。在本技术实施例中,充分融合字符本身的外部信息,如字音特征、字形特征,再结合字符在文本中的语义特征,能够有效扩展文本纠错的覆盖范围,提高文本纠错结果的准确性。
[0115]
405、计算机设备确定每个字符的字形特征所对应的第一权重、读音特征对应的第二权重以及语义特征对应的第三权重。
[0116]
在本技术实施例中,计算机设备能够为不同的特征赋予不同的权重,从而在后续特征解码过程中,能够更加关注重要特征,即权重较大的特征。在一种可能实现方式中,该计算机设备获取各个特征对应的权重的过程包括以下两个步骤:
[0117]
步骤一、对于任一字符,计算机设备通过文本纠错模型中的特征融合网络,也即是bert模型中的主干网络,对该任一字符的字形特征、读音特征以及语义特征进行特征融合,得到该任一字符对应的初始融合特征(berthidden)。需要说明的是,本技术实施例对bert模型提取该初始融合特征的方法不作限定。
[0118]
步骤二、计算机设备基于该任一字符对应的初始融合特征,分别确定该任一字符的字形特征所对应的第一权重、读音特征对应的第二权重以及语义特征对应的第三权重。在一种可能实现方式中,首先,计算机设备获取第一文本对应的文本语义特征,也即是,计
算机设备通过文本纠错模型中的输入层,即bert模型中的输入层,对第一文本进行整体特征提取,得到第一文本的文本特征(cls)。然后,对于任一字符,计算机设备对该文本特征、该初始融合特征以及该任一字符的字形特征进行特征融合,得到第一中间特征;对该文本特征、该初始融合特征以及该任一字符的读音特征进行特征融合,得到第二中间特征;对该文本特征、该初始融合特征以及该任一字符的语义特征进行特征融合,得到第三中间特征。最后,计算机设备分别基于该第一中间特征、该第二中间特征以及该第三中间特征确定该第一权重、第二权重以及第三权重。在一种可能实现方式中,该融合特征的获取方法表示为下述公式(2)至公式(5):
[0119]
f
ij
=softmax(relu(w1·
[h
cls
;h
i
;e
ij
] b1))
ꢀꢀ
(2)
[0120]
h
ij
=relu(w2·
[h
cls
;h
i
;e
ij
] b2)

f
ij
ꢀꢀ
(3)
[0121]
u
ij
=w3·
[h
i
;h
ij
] b3ꢀꢀ
(4)
[0122][0123]
其中,a
ij
表示第i个字符的第.j项特征所对应的权重,j∈{字形特征,读音特征,语义特征};h
cls
表示第一文本的文本语义特征;h
i
表示第i个字符的初始融合特征,h
ij
表示字符的第j项特征对应的中间特征,e
ij
表示第i个字符的第j项特征,w1、w2、w3、b1、b2和b3的数值由开发人员进行设置;u
ij
,表示u
ij
的转置;f
ij
表示中间融合特征,是由文本语义特征h
cls
、字符的初始融合特征h
i
和字符的第j项特征h
ij
融合得到的。
[0124]
需要说明的是,上述对确定各个特征的权重的方法的说明,仅是一种示例性说明,例如,计算机设备也可以将该初始融合特征分别与该任一字符的字形特征、读音特征以及语义特征进行点乘处理,得到该第一权利、该第二权重以及该第三权重,本技术实施例对此不作限定。在本技术实施例中,基于注意力机制为不同维度的特征分配不同的权重,例如,对于字形相近的错误字符,为该字符的字形特征分别较大的权重,对于读音相近的错误字符,为该字符的读音特征分配较大的权重,使计算机设备在后续文本纠错过程中,能够更加关注权重较大的特征,即关注更重要的特征,从而提高文本纠错的准确性。
[0125]
406、计算机设备基于该第一权重、第二权重、第三权重,对该任一字符的字形特征、读音特征以及语义特征进行加权融合,得到该任一字符的融合特征。
[0126]
在一种可能实现方式中,计算机设备可以应用该第一权重、第二权重和第三权重,直接对字形特征、读音特征和语义特征进行加权,也可以对步骤406中获取到的中间特征进行加权,也即是,分别基于该第一权重、该第二权重以及该第三权重,对该第一中间特征、该第二中间特征以及该第三中间特征进行加权融合,得到该融合特征。在本技术实施例中,以对中间特征进行加权融合得到融合特征为例进行说明,该中间特征融合了第一文本的整体的文本语义特征,所包括的信息更加丰富,从而基于该中间特征进行特征融合,所得到的融合特征中能够包括更丰富、更多维的信息,进而提高后续字符预测的准确度。在一种可能实现方式中,计算机设备进行特征融合的过程可以表示为下述公式(6):
[0127]
z=∑
j
α
ij
*h
ij
ꢀꢀ
(6)
[0128]
其中,z表示融合特征,j∈{字形特征,读音特征,语义特征},α
ij
表示第i个字符的第j项特征所对应的权重,h
ij
表示字符的第j项特征对应的中间特征。
[0129]
需要说明的是,上述步骤405和步骤406是分别对每个字符的字形特征、读音特征
以及语义特征进行加权融合,得到每个字符的融合特征的步骤。图6是本技术实施例提供的一种特征融合方法的示意图,以下结合图6对上述步骤405和步骤406的过程进行说明,以对一个字符所对应的各个特征进行特征融合为例,计算机设备将第一文本的文本语义特征(cls)和初始融合特征(berthidden),分别与字符的字形特征(shapeembedding)、读音特征(pinyinembedding)、语义特征(charembedding)进行融合,得到第一中间特征601、第二中间特征602和第三中间特征603,再分别基于第一权重、第二权重和第三权重对三个中间特征进行加权融合,得到融合特征。
[0130]
407、计算机设备对得到的至少两个融合特征进行解码,得到至少两个目标字符,将该至少两个目标字符构成第二文本。
[0131]
其中,该第二文本是对该第一文本中的错误字符进行纠正后的文本。
[0132]
在一种可能实现方式中,计算机设备通过文本纠错模型。即bert模型中的输出层,分别将每个融合特征解码为一个分类向量,其中,该分类向量中的一个元素用于指示该融合特征对应于一个候选字符的概率,计算机设备分别将每个分类向量中数值最大的元素所指示的候选字符,确定该目标字符。需要说明的是,上述对目标字符确定方法的说明,仅是一种可能实现方式的示例性说明,本技术实施例对具体采用哪种方法确定该目标字符不作限定。该计算机设备对目标字符进行排序,得到该第二文本,该目标字符的排列顺序与对应的融合特征的排列顺序相同,示例性的,该计算机设备基于融合特征所对应的字符在第一文本中的位置,来确定各个融合特征的排列顺序,本技术实施例对确定目标字符的排列顺序的方法不作限定。
[0133]
图7是本技术实施例提供的一种文本纠错方法的示意图,以下结合图7,对上述文本纠错过程进行说明。如图7所示,在一种可能实现方式中,计算机设备将第一文本输入文本纠错模型,即bert模型,由bert模型提取第一文本中各个字符对应的字形特征(shapeembedding)、读音特征(pinyinembedding)和语义特征(charembedding),可选的,该bert模型还可以提取各个字符在第一文本中的位置特征(positionembedding)和分段特征(segmentembedding),计算机设备基于提取到的多维度的特征,进行特征融合,得到每个字符对应的初始融合特征以及第一文本的文本语义特征。对于任一字符,计算机设备基于注意力机制对字符的各个维度的特征进行加权融合,即执行上述步骤405和步骤406,得到融合特征,再将该融合特征映射为一个分类向量(classifler),基于该分类向量确定目标字符,进而得到第二文本。
[0134]
本技术实施例提供的技术方案,通过在对第一文本纠错时,充分考虑第一文本中各个字符本身的字形特征、读音特征以及各个字符在第一文本中的上下文语义特征,融合这三个维度的特征进行正确字符的预测,对于第一文本中出现的任一字符均能够进行识别、纠正,能够有效扩大文本纠错的覆盖范围,且多维的特征融合也能够提高文本纠错的准确率。
[0135]
图8是本技术实施例提供的一种资讯应用程序的界面示意图,如图8中的(a)图所示,用户在进行资讯内容搜索时,会获取到包含错别字的搜索结果,例如,801区域中所示的搜索结果,结合本技术实施例提供的技术方案,计算机设备能够对搜索结果进行文本纠错,对搜索结果中的错误字符进行替换,如图8中的(b)图所示,或者,计算机设备直接进包括错误字符的内容过滤掉,或者,对于包括错误字符的搜索内容,计算机设备将该内容在搜索结
果界面中的显示位置调整到靠后的位置。通过将本技术实施例提供的文本纠错方法与资讯应用程序相结合,能够有效提高用户所浏览的资讯内容的质量,准确的过滤掉应用程序中的恶意内容,提高用户在使用应用程序时的用户体验。
[0136]
上述实施例中的文本纠错模型是计算机设备中存储的预先训练好的模型,该文本纠错模型为该计算机设备训练的模型,或者为其他设备训练的模型。图9是本技术实施例提供的一种文本纠错模型的训练方法的流程图,参见图9,在一种可能实现方式中,该文本纠错模型的训练方法包括以下步骤:
[0137]
901、计算机设备获取待训练的文本纠错模型以及至少两个训练样本。
[0138]
在本技术实施例中,该待训练的文本纠错模型为已经经过预训练的bert模型。一个训练样本中包括一个第一训练文本和一个第二训练文本,该第一训练文本是包括错误字符的文本,该第二训练文本是对第一训练文本中的错误制度进行纠正后的文本。在一种可能实现方式中,计算机设备基于等长序列对该文本纠错模型进行训练,也即是,输入文本纠错模型的各个文本所包括的字符数目是相同的,示例性的,计算机设备在将各个训练文本输入文本纠错模型之前,可以先对各个训练文本的长度进行调整,例如,在训练文本的末尾添加占位字符,以使各个训练文本的长度相同。
[0139]
902、计算机设备将该至少两个训练样本输入文本纠错模型,获取文本纠错模型的输出结果与正确结果之间的误差。
[0140]
在本技术实施例中,计算机设备通过该文本纠错模型对训练样本中的第一训练文本进行纠错,获取文本纠错模型的输出结果,该对第一训练文件进行纠错的过程与上述步骤401至步骤407同理。计算机设备基于损失函数获取模型的输出结果与正确结果,即对应的第二训练文本之间的误差。其中,该损失函数可以是交叉熵损失函数,本技术实施例对此不作限定,本技术实施例对获取模型输出结果与正确结果之间的误差的方法不作限定。
[0141]
903、计算机设备基于该误差对该文本纠错模型中的各个参数进行调整,直到满足模型收敛条件,得到训练好的文本纠错模型。
[0142]
在一种可能实现方式中,计算机设备将获取到的误差与误差阈值进行比较,若该误差大于误差阈值,则计算机设备将该误差反向传播至该文本纠错模型,结合swa(stochastic weight averaging,随机权重平均)技术的adam(adaptive moment estimation,自适应矩估计)优化算法,更新该文本纠错模型中的各个参数。若计算机设备获取到的误差小于该误差阈值,则确定模型的输出结果正确,计算机设备继续读取下一组训练样本,执行上述步骤902。其中,该误差阈值由开发人员进行设置,本技术实施例对此不作限定。
[0143]
在一种可能实现方式中,若计算机设备获取到正确的输出结果的数目达到参考数目,或者,读取完全部的训练样本,则确定文本纠错模型满足模型收敛条件,获取到训练完成的文本纠错模型。其中,该参考数目由开发人员进行设置,本技术实施例对此不作限定。需要说明的是,该模型收敛条件也可以设置为其他内容,本技术实施例对此不作限定。
[0144]
上述所有可选技术方案,可以采用任意结合形成本技术的可选实施例,在此不再一一赘述。
[0145]
图10是本技术实施例提供的一种文本纠错装置的结构示意图,参见图10,该装置包括:
[0146]
文本获取模块1001,用于获取待纠错的第一文本,该第一文本包括至少两个字符;
[0147]
特征获取模块1002,用于分别基于每个字符的结构、读音以及在该第一文本中的上下文信息,获取该每个字符的字形特征、读音特征以及语义特征;
[0148]
特征融合模块1003,用于分别对该每个字符的字形特征、读音特征以及语义特征进行加权融合,得到该每个字符的融合特征;
[0149]
特征解码模块1004,用于对得到的至少两个融合特征进行解码,得到至少两个目标字符,将该至少两个目标字符构成第二文本,该第二文本是对该第一文本中的错误字符进行纠正后的文本。
[0150]
在一种可能实现方式中,该特征获取模块1002,包括:
[0151]
第一获取子模块,用于通过文本纠错模型中的字形解析网络,基于该至少两个字符的结构,分别提取该至少两个字符的字形特征;
[0152]
第二获取子模块,用于通过该文本纠错模型中的语音识别网络,基于该至少两个字符的读音,分别提取该至少两个字符的读音特征;
[0153]
第三获取子模块,用于通过该文本纠错模型中的语义识别网络,基于该至少两个字符在该第一文本中的上下文信息,分别提取该至少两个字符的语义特征。
[0154]
在一种可能实现方式中,该第一获取子模块,用于:
[0155]
通过该字形解析网络,基于任一字符的结构以及至少两个参考字符的结构,生成该任一字符对应的字符节点图,该字符节点图用于指示该任一字符与该至少两个参考字符在结构维度的关联关系;
[0156]
对该任一字符所对应的字符节点图进行特征提取,得到该任一字符对应的字形特征。
[0157]
在一种可能实现方式中,该第一获取子模块,用于:
[0158]
获取该每个字符对应的字符图像,该字符图像用于指示字符的结构;
[0159]
通过该字形解析网络对该每个字符对应的字符图像进行图像特征提取,得到该每个字符的字形特征。
[0160]
在一种可能实现方式中,该第二获取子模块,包括:
[0161]
拼音获取单元,用于获取该每个字符对应的拼音,该拼音用于指示字符的读音;
[0162]
拼音编码单元,用于通过该语音识别网络对该每个字符对应的拼音进行编码,得到该每个字符的读音特征。
[0163]
在一种可能实现方式中,该拼音编码单元,用于:
[0164]
通过该语音识别网络基于参考映射条件,对该每个字符对应的拼音进行数据处理,该参考映射条件包括将拼音中的翘舌音映射为对应的平舌音、将拼音中的鼻音映射为对应的边音、将拼音中的后鼻音映射为前鼻音和去除拼音的音调中的至少一项;
[0165]
通过该语音识别网络分别对数据处理后的该拼音进行编码,得到该每个字符的该读音特征。
[0166]
在一种可能实现方式中,该第二获取子模块,用于:
[0167]
获取该每个字符对应的音频文件,一个该音频文件包括对一个字符进行朗读的语音信息;
[0168]
通过该语音识别网络对该每个字符对应的音频文件进行音频特征提取,得到该每
个字符的读音特征。
[0169]
在一种可能实现方式中,该特征融合模块1003,包括:
[0170]
第一融合子模块,用于对于任一字符,通过该文本纠错模型中的特征融合网络,对该任一字符的字形特征、读音特征以及语义特征进行特征融合,得到该任一字符对应的初始融合特征;
[0171]
权重确定子模块,用于基于该任一字符对应的初始融合特征,分别确定该任一字符的字形特征所对应的第一权重、读音特征对应的第二权重以及语义特征对应的第三权重;
[0172]
第二融合子模块,用于基于该第一权重、第二权重、第三权重,对该任一字符的字形特征、读音特征以及语义特征进行加权融合,得到该任一字符的融合特征。
[0173]
在一种可能实现方式中,该权重确定子模块,用于:
[0174]
获取该第一文本对应的文本语义特征;
[0175]
对于任一字符,对该文本特征、该初始融合特征以及该任一字符的字形特征进行特征融合,得到第一中间特征;
[0176]
对该文本特征、该初始融合特征以及该任一字符的读音特征进行特征融合,得到第二中间特征;
[0177]
对该文本特征、该初始融合特征以及该任一字符的语义特征进行特征融合,得到第三中间特征;
[0178]
分别基于该第一中间特征、该第二中间特征以及该第三中间特征确定该第一权重、该第二权重以及该第三权重。
[0179]
在一种可能实现方式中,该第二融合子模块,用于:
[0180]
分别基于该第一权重、该第二权重以及该第三权重,对该第一中间特征、该第二中间特征以及该第三中间特征进行加权融合,得到该融合特征。
[0181]
在一种可能实现方式中,该特征解码模块1004,用于:
[0182]
分别将每个融合特征解码为一个分类向量,该分类向量中的一个元素用于指示该融合特征对应于一个候选字符的概率;
[0183]
分别将每个该分类向量中数值最大的元素所指示的候选字符,确定该目标字符。
[0184]
在一种可能实现方式中,该装置还包括以下至少一项:
[0185]
字体调整模块,用于将该第一文本中的该至少两个字符统一为参考字体;
[0186]
字符去除模块,用于去除该第一文本中的外文字符。
[0187]
本技术实施例提供的装置,通过在对第一文本纠错时,充分考虑第一文本中各个字符本身的字形特征、读音特征以及各个字符在第一文本中的上下文语义特征,融合这三个维度的特征进行正确字符的预测,对于第一文本中出现的任一字符均能够进行识别、纠正,能够有效扩大文本纠错的覆盖范围,且多维的特征融合也能够提高文本纠错的准确率。
[0188]
需要说明的是:上述实施例提供的文本纠错装置在文本纠错时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的文本纠错装置与文本纠错方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
[0189]
上述技术方案所提供的计算机设备可以实现为终端或服务器,例如,图11是本技术实施例提供的一种终端的结构示意图。该终端1100可以是:智能手机、平板电脑、mp3播放器(moving picture experts group audio layer iii,动态影像专家压缩标准音频层面3)、mp4(moving picture experts group audio layer iv,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1100还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
[0190]
通常,终端1100包括有:一个或多个处理器1101和一个或多个存储器1102。
[0191]
处理器1101可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1101可以采用dsp(digital signal processing,数字信号处理)、fpga(field-programmable gate array,现场可编程门阵列)、pla(programmable logic array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1101也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称cpu(central processing unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1101可以在集成有gpu(graphics processing unit,图像处理器),gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1101还可以包括ai(artificial intelligence,人工智能)处理器,该ai处理器用于处理有关机器学习的计算操作。
[0192]
存储器1102可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1102还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1102中的非暂态的计算机可读存储介质用于存储至少一条计算机程序,该至少一条计算机程序用于被处理器1101所执行以实现本技术中方法实施例提供的文本纠错方法。
[0193]
在一些实施例中,终端1100还可选包括有:外围设备接口1103和至少一个外围设备。处理器1101、存储器1102和外围设备接口1103之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1103相连。具体地,外围设备包括:射频电路1104、显示屏1105、摄像头组件1106、音频电路1107、定位组件1108和电源1109中的至少一种。
[0194]
外围设备接口1103可被用于将i/o(input/output,输入/输出)相关的至少一个外围设备连接到处理器1101和存储器1102。在一些实施例中,处理器1101、存储器1102和外围设备接口1103被集成在同一芯片或电路板上;在一些其他实施例中,处理器1101、存储器1102和外围设备接口1103中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
[0195]
射频电路1104用于接收和发射rf(radio frequency,射频)信号,也称电磁信号。射频电路1104通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1104将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选的,射频电路1104包括:天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1104可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wifi(wireless fidelity,无线保真)网络。在一些实施例中,射频电
路1104还可以包括nfc(near field communication,近距离无线通信)有关的电路,本技术对此不加以限定。
[0196]
显示屏1105用于显示ui(userinterface,用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1105是触摸显示屏时,显示屏1105还具有采集在显示屏1105的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1101进行处理。此时,显示屏1105还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1105可以为一个,设置终端1100的前面板;在另一些实施例中,显示屏1105可以为至少两个,分别设置在终端1100的不同表面或呈折叠设计;在一些实施例中,显示屏1105可以是柔性显示屏,设置在终端1100的弯曲表面上或折叠面上。甚至,显示屏1105还可以设置成非矩形的不规则图形,也即异形屏。显示屏1105可以采用lcd(liquid crystal display,液晶显示屏)、oled(organic light

emitting diode,有机发光二极管)等材质制备。
[0197]
摄像头组件1106用于采集图像或视频。可选的,摄像头组件1106包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及vr(virtual reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1106还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
[0198]
音频电路1107可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1101进行处理,或者输入至射频电路1104以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1100的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1101或射频电路1104的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1107还可以包括耳机插孔。
[0199]
定位组件1108用于定位终端1100的当前地理位置,以实现导航或lbs(location based service,基于位置的服务)。定位组件1108可以是基于美国的gps(global positioning system,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
[0200]
电源1109用于为终端1100中的各个组件进行供电。电源1109可以是交流电、直流电、一次性电池或可充电电池。当电源1109包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
[0201]
在一些实施例中,终端1100还包括有一个或多个传感器1110。该一个或多个传感器1110包括但不限于:加速度传感器1111、陀螺仪传感器1112、压力传感器1113、指纹传感器1114、光学传感器1115以及接近传感器1116。
[0202]
加速度传感器1111可以检测以终端1100建立的坐标系的三个坐标轴上的加速度
大小。比如,加速度传感器1111可以用于检测重力加速度在三个坐标轴上的分量。处理器1101可以根据加速度传感器1111采集的重力加速度信号,控制显示屏1105以横向视图或纵向视图进行用户界面的显示。加速度传感器1111还可以用于游戏或者用户的运动数据的采集。
[0203]
陀螺仪传感器1112可以检测终端1100的机体方向及转动角度,陀螺仪传感器1112可以与加速度传感器1111协同采集用户对终端1100的3d动作。处理器1101根据陀螺仪传感器1112采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变ui)、拍摄时的图像稳定、游戏控制以及惯性导航。
[0204]
压力传感器1113可以设置在终端1100的侧边框和/或显示屏1105的下层。当压力传感器1113设置在终端1100的侧边框时,可以检测用户对终端1100的握持信号,由处理器1101根据压力传感器1113采集的握持信号进行左右手识别或快捷操作。当压力传感器1113设置在显示屏1105的下层时,由处理器1101根据用户对显示屏1105的压力操作,实现对ui界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
[0205]
指纹传感器1114用于采集用户的指纹,由处理器1101根据指纹传感器1114采集到的指纹识别用户的身份,或者,由指纹传感器1114根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1101授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1114可以被设置终端1100的正面、背面或侧面。当终端1100上设置有物理按键或厂商logo时,指纹传感器1114可以与物理按键或厂商logo集成在一起。
[0206]
光学传感器1115用于采集环境光强度。在一个实施例中,处理器1101可以根据光学传感器1115采集的环境光强度,控制显示屏1105的显示亮度。具体地,当环境光强度较高时,调高显示屏1105的显示亮度;当环境光强度较低时,调低显示屏1105的显示亮度。在另一个实施例中,处理器1101还可以根据光学传感器1115采集的环境光强度,动态调整摄像头组件1106的拍摄参数。
[0207]
接近传感器1116,也称距离传感器,通常设置在终端1100的前面板。接近传感器1116用于采集用户与终端1100的正面之间的距离。在一个实施例中,当接近传感器1116检测到用户与终端1100的正面之间的距离逐渐变小时,由处理器1101控制显示屏1105从亮屏状态切换为息屏状态;当接近传感器1116检测到用户与终端1100的正面之间的距离逐渐变大时,由处理器1101控制显示屏1105从息屏状态切换为亮屏状态。
[0208]
本领域技术人员可以理解,图11中示出的结构并不构成对终端1100的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
[0209]
图12是本技术实施例提供的一种服务器的结构示意图,该服务器1200可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(central processing units,cpu)1201和一个或多个的存储器1202,其中,该一个或多个存储器1202中存储有至少一条计算机程序,该至少一条计算机程序由该一个或多个处理器1201加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器1200还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器1200还可以包括其他用于实现设备功能的部件,在此不做赘述。
[0210]
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括至少一条计算机程序的存储器,上述至少一条计算机程序可由处理器执行以完成上述实施例中的文本纠错方法。例如,该计算机可读存储介质可以是只读存储器(read

only memory,rom)、随机存取存储器(random access memory,ram)、只读光盘(compact disc read

only memory,cd

rom)、磁带、软盘和光数据存储设备等。
[0211]
在示例性实施例中,还提供了一种计算机程序产品,该计算机程序产品包括至少一条计算机程序,该至少一条计算机程序存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该至少一条计算机程序,处理器执行该至少一条计算机程序,使得该计算机设备实现该文本纠错方法所执行的操作。
[0212]
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0213]
上述仅为本技术的可选实施例,并不用以限制本技术,凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜