一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种文本处理方法和文本处理系统与流程

2022-07-16 23:22:08 来源:中国专利 TAG:


1.本发明涉及文本处理技术领域,尤其涉及一种文本处理方法和一种文本处理系统。


背景技术:

2.文本处理直接应用于自然语言处理,也称为nlp(natural language processing),自然语言处理是研究人与计算机交互的语言问题的一门学科,处理自然语言的关键是要让计算机“理解”自然语言,所以自然语言处理又叫做自然语言理解(nlu,naturallanguage understanding),也称为计算语言学(computational linguistics)。一方面它是语言信息处理的一个分支,另一方面它是人工智能(ai, artificial intelligence)的核心课题之一。
3.文本处理涉及的处理类型有:信息提取、语言翻译、情绪分析、信息分类等,其中,文本处理涉及到的技术手段有自动分词、词性分析、句法分析和语义分析等nlp领域的多种复杂技术。
4.通常而言,文本处理是将待处理文本输入处理模块,在处理模块中进行一系列自动处理得到处理结果,当有多个文本需要处理时,每个文本处理工作都需要经过一系列复杂处理才能得到处理结果,从而,造成每个文本的等待时间过长,用户体验差,且给文本处理模块带来巨大的处理压力。
5.因此,现有技术中存在用户等待文本处理时间过长的缺陷。


技术实现要素:

6.本发明的主要目的在于提供一种文本处理方法,旨在解决现有技术中用户等待文本处理时间过长的缺陷。
7.为实现上述目的,本发明提供的文本处理方法包括如下步骤:服务器接收各个用户终端发送的待处理文本,并在所述服务器的第一缓存区中排序形成文本队列,等待各个第一处理器按照所述文本队列的排列顺序提取所述待处理文本进行文本处理;获取用户终端对待处理文本进行词频统计确定的所述待处理文本的特征片段;将所述文本队列中的待处理文本的特征片段按照文本队列中的顺序,依次存储至所述服务器的第二缓存区中;所述第二处理器从所述第二缓存区中依次提取待处理文本的特征片段;所述第二处理器对提取的所述特征片段进行初步处理得到初步结果,将所述初步结果返回至所述服务器;所述服务器将所述初步结果返回至用户终端;所述第一处理器从所述第一缓存区中依次提取各个待处理文本进行完整处理得到精确结果,将所述精确结果返回至服务器;
所述服务器将所述精确结果返回至所述用户终端。
8.优选地,所述获取用户终端对待处理文本进行词频统计确定的所述待处理文本的特征片段的步骤,包括:所述用户终端对向所述服务器发送的每个待处理文本进行词频统计;通过词频统计筛选出每个所述待处理文本中词频排名靠前的单词作为典型词,标记所述典型词在所述待处理文本中所在的文本位置;统计标注出的文本位置中,出现典型词次数最多的文本片段;将出现典型词次数最多的文本片段作为所述特征片段;将所述特征片段向所述服务器发送。
9.优选地,所述文本处理方法,还包括:所述第二处理器判断所述文本队列中的各个所述待处理文本是否均已完成初步处理;若否,根据所述文本队列中的各个所述待处理文本的排列顺序,对未进行初步处理的所述待处理文本继续进行初步处理;若是,控制所述第二处理器执行所述第一处理器的完整处理任务。
10.优选地,所述服务器连接有多个处理器,所述服务器接收各个用户终端发送的待处理文本,并在所述服务器的第一缓存区中排序形成文本队列,等待各个第一处理器按照所述文本队列的排列顺序提取所述待处理文本进行文本处理的步骤之前,还包括:获取与所述服务器连接的空闲的处理器;获取与所述服务器连接的剩余处理时间不超过预设时间的处理器;将空闲的处理器与所述剩余处理时间不超过预设时间的处理器添加至处理器群组,对所述处理器群组进行剩余处理时间排序;将所述处理器群组中剩余处理时间最短的编号第一个处理器作为所述第二处理器;将所述处理器群组中其余的所述处理器作为所述第一处理器。
11.优选地,所述服务器接收各个用户终端发送的待处理文本,并在所述服务器的第一缓存区中排序形成文本队列的步骤之后,还包括:所述第二处理器识别所述文本队列中的每个所述待处理文本对应的所述用户终端的类别;根据所述用户终端的类别确定所述待处理文本的文本类别;根据所述文本类别将所述待处理文本存储至所述服务器的所述第一缓存区的不同类别的存储单元;在所述第一缓存区中形成记录文本队列中各个待处理文本信息的文本链表,其中文本链表中按照待处理文本的排序记载有各个待处理文本信息,和每个所述待处理文本的具体存储单元。
12.优选地,所述文本处理方法,还包括:生成用于对各个第一处理器进行剩余处理时间排序的顺序链表;在所述第一处理器的数量小于所述待处理文本的数量时,将文本链表根据第一处理器的数量分成多个文本链表单元;
根据所述顺序链表中各个第一处理器的排序,将各个所述文本链表单元中的每个待处理文本与所述顺序链表中的第一处理器建立对应链表。
13.优选地,所述文本处理方法,还包括:在所述服务器接收到用户终端发送的待处理文本后,向用户终端返回标准反馈时间;接收各个所述用户终端向所述服务器发出的超时反馈信息,其中,超时反馈信息指的是超过服务器向用户终端返回的标准反馈时间仍未收到精确结果的信息,超时反馈信息包括滞后处理的待处理文本;根据所述超时反馈信息和所述对应链表,确定处理滞后的所述第一处理器;从所述文本链表中确定滞后的所述待处理文本对应的文本链表单元;判断所述文本链表单元中排列在所述滞后的待处理文本之后的待处理文本是否处理完毕;若是,将之后处理的所述待处理文本分配给所述所述顺序链表中位于滞后的第一处理器之后的第一处理器。
14.优选地,所述文本处理方法,还包括:获取预设的侦测周期;所述接收各个所述用户终端向所述服务器发出的超时反馈信息的步骤之后,还包括:获取所述第二处理器在当前侦测周期已处理的所有特征片段的总字数;获取各个所述第一处理器在当前侦测周期已处理的所有待处理文本的总字数;判断滞后的所述第一处理器是否超过预设的允许滞后条件;若是,搜索所述处理器群组之外的空闲处理器作为新增处理器,将滞后的所述第一处理器替换为所述新增处理器;其中,确定新增处理器的具体步骤为:;其中,表示第二处理器在当前的第t个侦测周期已处理的总字数,表示第二处理器在当前的第t个侦测周期已处理完的第i个特征片段的字数,表示第二处理器在当前的第t个侦测周期已处理完的特征片段的总数;;;其中,表示第j个第一处理器在当前的第t个侦测周期已处理的总字数,表示第j个第一处理器在当前的第t个侦测周期已处理完的第q个特征片段的字
数,表示第j个第一处理器在当前的第t个侦测周期已处理完的特征片段的总数;;,j为第一处理器的总数;当滞后的第一处理器为第m个第一处理器,其中,;其中,为调整系数,;表示第m个第一处理器,即滞后的第一处理器;表示的替换处理器,表示不采用新增的处理器替换滞后的第一处理器,表示新增处理器,表示将替换为新增处理器。
15.优选地,所述文本处理方法,还包括:服务器侦测第二处理器的运行状态处于正常运行状态或异常运行状态;在所述第二处理器处于异常运行状态时,所述服务器采用其他空闲处理器替换异常的所述第二处理器;其中,在满足以下条件时,服务器判断第二处理器为正常运行状态:其中,表示第二处理器在当前的第t个侦测周期已处理完成的特征片段数量;为修正系数,且;为第二处理器在第t个侦测周期已处理完成的特征片段数量,;表示第二处理器在1个侦测周期处理的特征片段的标准个数;表示剩余特征片段的数量;在不满足上述条件时,服务器判断第二处理器为异常运行状态。
16.为实现上述目的,本发明还提供一种文本处理系统,应用如上述任一项所述的文本处理方法。
17.在本发明的技术方案中,服务器连接有一个至多个用户终端,因此,连接的每个用户终端都可以向服务器上传待处理文本,服务器可以向多个用户终端共享以进行文本处理工作。服务器接收到各个待处理文本后,为了保持文本处理顺序,在第一缓存区中对待处理文本进行排序形成文本队列;由于处理器对每个文本处理得到处理结果需要一定的处理时间,因此,用户终端得到待处理文本的处理结果需要一段较长的时间,为了避免用户过长等待,本发明采用了两种处理器:第一处理器和第二处理器;其中,第二处理器用于对用户终端上传的存储于服务器第二缓存区的特征片段进行初步处理得到初步结果。特征片段由用户终端进行词频统计确定,以降低服务器端的数据处理压力;进一步的,由于待处理文本一般有一定的语义连贯性,因此,全文的意思表达应该是一致的,而特征片段就是通过词频统计得到的能够体现整个待处理文本语义的一个局部片段,第二处理器对特征片段进行处理得到初步结果,不仅能表明待处理文本已经成功被服务器接收,也能让用户终端快速得到一个反馈结果,以解决现有技术中用户等待文本处理时间过长的缺陷,保证处理结果的时效性;进一步的,第一处理器用于从第一缓存区中按照排序依次提取各个待处理文本进行处理,以对待处理文本的全文进行全面处理得到精确结果,将精确结果向服务器发送,并通过服务器向用户返回该精确结果,也能使用户终端在得到初步结果后,再获得一个全面处理的精确结果,保证处理结果的准确性。
附图说明
18.图1为本发明文本处理方法一实施例的流程示意图。
19.本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
20.应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
21.在后续的描述中,使用用于表示元件的诸如“单元”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“单元”、“部件”或“单元”可以混合地使用。
22.请参阅图1,为实现上述目的,本发明的第一实施例提供一种文本处理方法,包括如下步骤:步骤s10,服务器接收各个用户终端发送的待处理文本,并在所述服务器的第一缓存区中排序形成文本队列,等待各个第一处理器按照所述文本队列的排列顺序提取所述待处理文本进行文本处理;步骤s20,获取用户终端对待处理文本进行词频统计确定的所述待处理文本的特征片段;步骤s30,将所述文本队列中的待处理文本的特征片段按照文本队列中的顺序,依次存储至所述服务器的第二缓存区中;步骤s40,所述第二处理器从所述第二缓存区中依次提取待处理文本的特征片段;步骤s50,所述第二处理器对提取的所述特征片段进行初步处理得到初步结果,将所述初步结果返回至所述服务器;步骤s60,所述服务器将所述初步结果返回至用户终端;
步骤s70,所述第一处理器从所述第一缓存区中依次提取各个待处理文本进行完整处理得到精确结果,将所述精确结果返回至服务器;步骤s80,所述服务器将所述精确结果返回至所述用户终端。
23.在本发明的技术方案中,服务器连接有一个至多个用户终端,因此,连接的每个用户终端都可以向服务器上传待处理文本,服务器可以向多个用户终端共享以进行文本处理工作。服务器接收到各个待处理文本后,为了保持文本处理顺序,在第一缓存区中对待处理文本进行排序形成文本队列;由于处理器对每个文本处理得到处理结果需要一定的处理时间,因此,用户终端得到待处理文本的处理结果需要一段较长的时间,为了避免用户过长等待,本发明采用了两种处理器:第一处理器和第二处理器;其中,第二处理器用于对用户终端上传的存储于服务器第二缓存区的特征片段进行初步处理得到初步结果。特征片段由用户终端进行词频统计确定,以降低服务器端的数据处理压力;进一步的,由于待处理文本一般有一定的语义连贯性,因此,全文的意思表达应该是一致的,而特征片段就是通过词频统计得到的能够体现整个待处理文本语义的一个局部片段,第二处理器对特征片段进行处理得到初步结果,不仅能表明待处理文本已经成功被服务器接收,也能让用户终端快速得到一个反馈结果,以解决现有技术中用户等待文本处理时间过长的缺陷,保证处理结果的时效性;进一步的,第一处理器用于从第一缓存区中按照排序依次提取各个待处理文本进行处理,以对待处理文本的全文进行全面处理得到精确结果,将精确结果向服务器发送,并通过服务器向用户返回该精确结果,也能使用户终端在得到初步结果后,再获得一个全面处理的精确结果,保证处理结果的准确性。
24.其中,第一处理器和第二处理器的数量可以分别为一个至多个。
25.当待处理文本被第一处理器处理完毕后,可以从所述文本队列中删除待处理文本的信息,并从第一缓存区中删除该待处理文本;当特征片段被第二处理器处理完毕后,从所述第二缓存区中删除该特征片段。
26.其中,本发明中的文本处理(包括初步处理和完整处理)可以为信息提取、语言翻译、情绪分析或信息分类。
27.在本实施例中,在仅采用一个第二处理器时,服务器需要侦测第二处理器的运行状态是否正常,以确定是否需要采用其他处理器(其他处理器可以为其中一个第一处理器或其他空闲处理器)替换第二处理器。
28.服务器侦测第二处理器的运行状态的具体步骤为:服务器侦测第二处理器的运行状态处于正常运行状态或异常运行状态;在所述第二处理器处于异常运行状态时,所述服务器采用其他空闲处理器替换异常的所述第二处理器;其中,在满足以下条件时,服务器判断第二处理器为正常运行状态:其中,表示第二处理器在当前的第t个侦测周期已处理完成的特征片段数
量;为修正系数,且;为第二处理器在第t个侦测周期已处理完成的特征片段数量,;表示第二处理器在1个侦测周期处理的特征片段的标准个数;表示剩余特征片段的数量;在不满足上述条件时,服务器判断第二处理器为异常运行状态。
29.优选地,所述获取用户终端对待处理文本进行词频统计确定的所述待处理文本的特征片段的步骤,包括:步骤s21,所述用户终端对向所述服务器发送的每个待处理文本进行词频统计;步骤s22,通过词频统计筛选出每个所述待处理文本中词频排名靠前的单词作为典型词,标记所述典型词在所述待处理文本中所在的文本位置;步骤s23,统计标注出的文本位置中,出现典型词次数最多的文本片段;步骤s24,将出现典型词次数最多的文本片段作为所述特征片段;步骤s25,将所述特征片段向所述服务器发送。
30.在本发明中,通过词频统计的方式确定待处理文本的特征片段。其中,排名靠前指的是排名位于前预设名次,例如,排名靠前可以为排名第一位,排名前两位,或者排名前三位。
31.其中,用户终端对待处理文本可以进行段落标号,用户终端向服务器发送的待处理文本是具有段落标号的文本。用户终端可以将待处理文本和所述特征片段对应的段落标号同步发送至服务器,由服务器从所述待处理文本中根据段落标号提取特征文本存储至第二缓存区。
32.优选地,所述文本处理方法,还包括:步骤s90,所述第二处理器判断所述文本队列中的各个所述待处理文本是否均已完成初步处理;若否,执行步骤s100,根据所述文本队列中的各个所述待处理文本的排列顺序,对未进行初步处理的所述待处理文本继续进行初步处理;若是,执行步骤s110,控制所述第二处理器执行所述第一处理器的完整处理任务。
33.由服务器侦测第一缓存区中未处理的待处理文本和第二缓存区中未处理的特征片段并分别进行计数,当第二缓存区中的特征片段全部处理完毕时,服务器向第二处理器发出控制指令,以使第二处理器作为辅助处理器处理第一缓存区中的待处理文本。
34.步骤s110可以具体为:当第二缓存区中的特征片段全部处理完毕时,评估第一处理器是否处于处理任务高峰,若是,服务器向第二处理器发出控制指令,以使第二处理器作为辅助处理器处理第一缓存区中的待处理文本;若否,第二处理器处于等待状态。
35.其中,评估第一处理器是否处于处理任务高峰可以采用如下方法:服务器侦测各个用户终端发送待处理文本的数量随时间的变化,以确定全部用户终端发送待处理文本的总数量随时间的变化,以及待处理文本的总量;根据全部用户终端发送待处理文本的总数量随时间的变化波动变化率以及待处理文本的总量,评估第一处理器是否进入处理任务高峰。
36.当存在多个第一处理器时,按照文本队列中的各个待处理文本的排序,将各个待
处理文本分配给各个第一处理器进行处理。
37.优选地,所述服务器连接有多个处理器,所述服务器接收各个用户终端发送的待处理文本,并在所述服务器的第一缓存区中排序形成文本队列,等待各个第一处理器按照所述文本队列的排列顺序提取所述待处理文本进行文本处理的步骤之前,还包括:步骤s120,获取与所述服务器连接的空闲的处理器;步骤s130,获取与所述服务器连接的剩余处理时间不超过预设时间的处理器;步骤s140,将空闲的处理器与所述剩余处理时间不超过预设时间的处理器添加至处理器群组,对所述处理器群组进行剩余处理时间排序;步骤s150,将所述处理器群组中剩余处理时间最短的编号第一个处理器作为所述第二处理器;步骤s160,将所述处理器群组中其余的所述处理器作为所述第一处理器。
38.步骤s120至步骤s160用于确定第一处理器和第二处理器。
39.在文本队列中新增待处理文本时,还可以直接将新增待处理文本与其中一第一处理器建立分配关系,以避免同一待处理文本分配至多个第一处理器导致的处理冲突,且有利于尽早地确定第一处理器与新增待处理文本的对应,以确定每个第一处理器的待处理任务量。
40.其中,根据预设的周期,可以自动搜寻与服务器连接的空闲的处理器和剩余处理时间不超过预设时间的处理器新增至处理器群组,其中,新增的处理器与各个第一处理器建立辅助关系,以使第一处理器分配的待处理文本合理分配至第一处理器及与其建立辅助关系的新增处理器,以避免新增处理器导致的待处理文本分配混乱。
41.优选地,所述服务器接收各个用户终端发送的待处理文本,并在所述服务器的第一缓存区中排序形成文本队列的步骤之后,还包括:步骤s170,所述第二处理器识别所述文本队列中的每个所述待处理文本对应的所述用户终端的类别;步骤s180,根据所述用户终端的类别确定所述待处理文本的文本类别;步骤s190,根据所述文本类别将所述待处理文本存储至所述服务器的所述第一缓存区的不同类别的存储单元;步骤s200,在所述第一缓存区中形成记录文本队列中各个待处理文本信息的文本链表,其中文本链表中按照待处理文本的排序记载有各个待处理文本信息,和每个所述待处理文本的具体存储单元。
42.步骤s170至步骤s200用于根据用户终端的类别对不同用户终端发送的待处理文本进行分区存储。该分区存储有利于对待处理文本根据上传来源进行初步分类,形成一个初步类别的分析。
43.进一步的,同类型的用户终端上传的待处理文本在文本信息类目、文本长度、文本语义存在较大的相似概率。例如,用户为某领域的技术研发人员时,其通过用户终端上传的待处理文本属于技术文本的概率非常大,并且属于某一特定技术领域的概率也较大。
44.根据所述用户终端的类别将所述待处理文本存储至所述服务器的所述第一缓存区的不同类别的存储单元,还有助于分配第一处理器。由于相同用户终端类别上传的文本领域具有较大的相似概率,则处理时间方面有较大可能有所相近,有助于将同一用户终端
类别的待处理文本分配至同一第一处理器,以便于预估该同一第一处理器的预计处理时间;或将不同用户终端类别的待处理文本交叉分配至统一处理器,有助于保持各个第一处理器的处理进度均匀。
45.本发明中,根据用户终端历史上传的多个待处理文本的精确结果,可以确定用户终端的类别。
46.文本链表用于记录待处理文本的总体信息,包括在文本队列中的排序位置、对应分配的第一处理器、服务器对文本的接收时间等。
47.优选地,所述文本处理方法,还包括:步骤s210,生成用于对各个第一处理器进行剩余处理时间排序的顺序链表;步骤s220,在所述第一处理器的数量小于所述待处理文本的数量时,将文本链表根据第一处理器的数量分成多个文本链表单元;步骤s230,根据所述顺序链表中各个第一处理器的排序,将各个所述文本链表单元中的每个待处理文本与所述顺序链表中的第一处理器建立对应链表。
48.以设置四个第一处理器,各个第一处理器进行剩余处理时间排序为第一处理器、第二处理器、第三处理器、第四处理器为例,形成的顺序链表记录的顺序信息为:第一处理器、第二处理器、第三处理器、第四处理器。此时,文本链表的每个文本链表单元排列有四个待处理文本信息,四个待处理文本信息中的第一个待处理文本信息与第一处理器对应,第二个待处理文本信息与第二处理器对应,第三个待处理文本信息与第三处理器对应,第四个待处理文本信息与第四处理器对应。
49.将每个文本链表的每个文本链表单元中的每个待处理文本信息都按照顺序链表与各个第一处理器对应,形成的就是对应链表。
50.对应链表有助于将文本队列中的各个待处理文本快速与各个第一处理器建立对应关系,当第一处理器具有辅助处理器时,将该辅助处理器也添加至对应链表。
51.在依次从文本队列中提取待处理文本时,若轮到提取某个待处理文本,而该待处理文本对应的第一处理器未完结上一待处理文本的处理任务时,采用该第一处理器的辅助处理器提取待处理文本。
52.其中,步骤s210至步骤s230可以按照设定周期执行一次,以根据各个第一处理器的当前任务处理情况,及时调整各个待处理文本与第一处理器的对应关系。设定周期为侦测周期的若干倍数。
53.优选地,所述文本处理方法,还包括:步骤s240,在所述服务器接收到用户终端发送的待处理文本后,向用户终端返回标准反馈时间;步骤s250,接收各个所述用户终端向所述服务器发出的超时反馈信息,其中,超时反馈信息指的是超过服务器向用户终端返回的标准反馈时间仍未收到精确结果的信息,超时反馈信息包括滞后处理的待处理文本;步骤s260,根据所述超时反馈信息和所述对应链表,确定处理滞后的所述第一处理器;步骤s270,从所述文本链表中确定滞后的所述待处理文本对应的文本链表单元;步骤s280,判断所述文本链表单元中排列在所述滞后的待处理文本之后的待处理
文本是否处理完毕;若是,执行步骤s290,将之后处理的所述待处理文本分配给所述所述顺序链表中位于滞后的第一处理器之后的第一处理器。
54.本实施例用于及时将滞后处理的待处理文本调配至其他的第一处理器。进一步的,服务器侦测文本队列中的各个待处理文本,并在文本链表中标记每个待处理文本的接收时间,侦测各个待处理文本自接收时间起,超过标准反馈时间仍未向对应的用户终端反馈精确结果,以使服务器和用户终端双向跟踪精确结果的反馈时间。
55.优选地,所述文本处理方法,还包括:步骤s300,获取预设的侦测周期;所述接收各个所述用户终端向所述服务器发出的超时反馈信息的步骤之后,还包括:步骤s310,获取所述第二处理器在当前侦测周期已处理的所有特征片段的总字数;步骤s320,获取各个所述第一处理器在当前侦测周期已处理的所有待处理文本的总字数;步骤s330,判断滞后的所述第一处理器是否超过预设的允许滞后条件;若是,执行步骤s340,搜索所述处理器群组之外的空闲处理器作为新增处理器,将滞后的所述第一处理器替换为所述新增处理器。
56.其中,确定新增处理器的具体步骤为:;其中,表示第二处理器在当前的第t个侦测周期已处理的总字数,表示第二处理器在当前的第t个侦测周期已处理完的第i个特征片段的字数,表示第二处理器在当前的第t个侦测周期已处理完的特征片段的总数;;;其中,表示第j个第一处理器在当前的第t个侦测周期已处理的总字数,表示第j个第一处理器在当前的第t个侦测周期已处理完的第q个特征片段的字数,表示第j个第一处理器在当前的第t个侦测周期已处理完的特征片段的总数;;,j为第一处理器的总数;当滞后的第一处理器为第m个第一处理器,其中,;
其中,为调整系数,;表示第m个第一处理器,即滞后的第一处理器;表示的替换处理器,表示不采用新增的处理器替换滞后的第一处理器,表示新增处理器,表示将替换为新增处理器。
57.本发明中的文本处理(包括初步处理和完整处理)可以为信息提取、语言翻译、情绪分析或信息分类。以本发明中的文本处理为信息分类处理为例,文本处理方法(包括初步处理和完整处理)可以包括如下步骤:s1:确定待处理文本中的典型词,包括:统计待处理文本中每个词的出现次数,确定出现次数排名靠前的词为典型词;其中,排名靠前为排名为前设定位数。
58.s2:获取服务器中的信息分类数据库,确定典型词对应的数据库清单:当典型词出现的数据库清单中包含的数据库越少,表示该典型词具有很好的类别区分能力,越能准确对应信息分类的类目。
59.s3:根据所有的典型词,共同确定类目。具体为,根据所有的典型词的数据库交集,确定第一级信息分类类目,以及根据各个典型词分别对应的数据库,确定第二级信息分类类目。其中,第一级信息分类类目和第二级信息分类类目均不限于一个。
60.为实现上述目的,本发明还提供一种文本处理系统,应用如上述任一项所述的文本处理方法。
61.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个计算机可读存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备进入本发明各个实施例所述的方法。
62.在本说明书的描述中,参考术语“一实施例”、“另一实施例”、“其他实施例”、 或“第一实施例~第x实施例”等的描述意指结合该实施例或示例描述的具体特征、 结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料、方法步骤或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
63.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
64.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
65.以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献