一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

词语搜索方法及装置、存储介质、终端与流程

2022-07-14 04:19:19 来源:中国专利 TAG:

词语搜索方法及装置、存储介质、终端
1.技术搜索领域
2.本发明涉及一种自然语言处理技术搜索领域,特别是涉及一种词语搜索方法及装置、存储介质、终端。


背景技术:

3.随着大数据技术的快速发展,越来越多的应用搜索领域需要对数据进行统计,从而基于得到的统计指标来表征业务情况。其中,为了满足不同业务的处理需求,会对统计指标进行搜索,以实现各搜索领域的应用,例如,按照统计搜索领域的专业词汇进行搜索,从而实现统计搜索领域统计指标的一种模糊搜索查询。
4.目前,现有针对统计搜索领域的统计指标的搜索,通常利用作为统计指标的词语名称结合搜索引擎进行搜索,此时,作为统计指标的词语名称为若干定语和主体词语组成的一个词组,而非自然语义样本,具有极强的科学专业性,因此,通常在统计指标的词语名称数据库中以sql的like查询方式进行查询,或者采用全文搜索引擎工具对统计指标的词语名称进行分词索引编制,进而实现搜索。但是,上述两种方式对于极强科学专业性的词语,搜索准确性差,无法从其他非统计搜索领域中精准地搜索到统计专业性的目标词语名称,大大影响了具有专业性较强词语在不同领域中的搜索准确性,因此,亟需一种词语搜索方法来解决上述问题。


技术实现要素:

5.有鉴于此,本发明提供一种词语搜索方法及装置、存储介质、终端,主要目的在于解决现有词语搜索准确性差的问题。
6.依据本发明一个方面,提供了一种词语搜索方法,包括:
7.获取目标搜索领域中待搜索的目标词语;
8.基于关联度对照关系在所述目标搜索领域中搜索与所述目标词语匹配的至少一个关联词语,并确定搜索到的所述关联词语与所述目标词语之间的相似度值,所述关联度对照关系中存储有不同搜索领域中不同搜索词语对应的至少一个关联词语,以及不同关联词语之间处于不同搜索领域中所具有的关联度;
9.若所述相似度值大于或等于预设关联相似度阈值,则将所述关联词语确定为所述目标词语的搜索结果。
10.进一步地,所述获取目标搜索领域中待搜索的目标词语之前,所述方法还包括:
11.从多个数据源自然语言词库中获取各搜索领域中的同义词语、具有包含关系的同类词语、以及简写类词语;
12.基于所述同义词语、所述同类词语、以及所述简写类词语建立不同词语之间的关联关系,确定不同词语所对应的关联词语;
13.按照预设关联度重合特征为不同关联词语之间配置关联度;
14.基于不同关联词语,以及所述关联词语之间配置的关联度生成关联度对照关系。
15.进一步地,所述按照预设关联度重合特征为不同关联词语之间配置关联度包括:
16.确定具有关联关系的两个关联词语的所属搜索领域,并按照所述搜索领域分别解析所述关联词语的对应词语概念;
17.确定所述词语概念之间的重合度,所述重合度用于表征所述关联词语之间在词语概念维度上的相同程度;
18.若所述词语概念的重合度大于或等于预设重合度阈值,则将所述重合度配置为所述关联词语之间的关联度。
19.进一步地,所述确定搜索到的所述关联词语与所述目标词语之间的相似度值包括:
20.确定查找到的所述关联词语之间的关联关系以及对应的关联度;
21.基于所述关联度递归计算所述关联词与所述目标词语之间相对于所述关联关系的相似度值,所述相似度值为按照关联关系进行至少一个关联度相乘得到。
22.进一步地,所述获取目标搜索领域中待搜索的目标词语之前,所述方法还包括:
23.接收待搜索的文本内容,并对所述文本内容进行分词;
24.若分词后的词语未处于目标搜索领域,则确定分词后的词语为目标词语,以进行关联词语的搜索。
25.进一步地,所述确定搜索到的所述关联词语与所述目标词语之间的相似度值之后,所述方法还包括:
26.若所述相似度值小于预设关联相似度阈值,则删除所述关联词语。
27.进一步地,所述将所述关联词语确定为所述目标词语的搜索结果之后,所述方法还包括:
28.按照所述关联词语所对应的关联关系输出所述搜索结果。
29.依据本发明另一个方面,提供了一种词语搜索装置,包括:
30.获取模块,用于获取目标搜索领域中待搜索的目标词语;
31.搜索模块,用于基于关联度对照关系在所述目标搜索领域中搜索与所述目标词语匹配的至少一个关联词语,并确定搜索到的所述关联词语与所述目标词语之间的相似度值,所述关联度对照关系中存储有不同搜索领域中不同搜索词语对应的至少一个关联词语,以及不同关联词语之间处于不同搜索领域中所具有的关联度;
32.确定模块,用于若所述相似度值大于或等于预设关联相似度阈值,则将所述关联词语确定为所述目标词语的搜索结果。
33.进一步地,所述装置还包括:建立模块,配置模块,生成模块,
34.所述获取模块,还用于从多个数据源自然语言词库中获取各搜索领域中的同义词语、具有包含关系的同类词语、以及简写类词语;
35.所述建立模块,用于基于所述同义词语、所述同类词语、以及所述简写类词语建立不同词语之间的关联关系,确定不同词语所对应的关联词语;
36.所述配置模块,用于按照预设关联度重合特征为不同关联词语之间配置关联度;
37.所述生成模块,用于基于不同关联词语,以及所述关联词语之间配置的关联度生成关联度对照关系。
38.进一步地,所述配置模块包括;
39.解析单元,用于确定具有关联关系的两个关联词语的所属搜索领域,并按照所述搜索领域分别解析所述关联词语的对应词语概念;
40.第一确定单元,用于确定所述词语概念之间的重合度,所述重合度用于表征所述关联词语之间在词语概念维度上的相同程度;
41.配置单元,用于若所述词语概念的重合度大于或等于预设重合度阈值,则将所述重合度配置为所述关联词语之间的关联度。
42.进一步地,所述搜索模块包括:
43.第二确定单元,用于确定搜索到的所述关联词语与所述目标词语之间的相似度值包括:
44.第三确定单元,用于确定查找到的所述关联词语之间的关联关系以及对应的关联度;
45.计算单元,用于基于所述关联度递归计算所述关联词与所述目标词语之间相对于所述关联关系的相似度值,所述相似度值为按照关联关系进行至少一个关联度相乘得到。
46.进一步地,所述装置还包括:分词模块,
47.所述分词模块,用于接收待搜索的文本内容,并对所述文本内容进行分词;
48.所述确定模块,还用于若分词后的词语未处于目标搜索领域,则确定分词后的词语为目标词语,以进行关联词语的搜索。
49.进一步地,所述装置还包括:
50.删除模块,用于若所述相似度值小于预设关联相似度阈值,则删除所述关联词语。
51.进一步地,所述装置还包括:
52.输出模块,用于按照所述关联词语所对应的关联关系输出所述搜索结果。
53.根据本发明的又一方面,提供了一种存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述词语搜索方法对应的操作。
54.根据本发明的再一方面,提供了一种终端,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
55.所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述词语搜索方法对应的操作。
56.借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
57.本发明提供了一种词语搜索方法及装置、存储介质、终端,与现有技术相比,本发明实施例通过获取目标搜索领域中待搜索的目标词语;基于关联度对照关系在所述目标搜索领域中搜索与所述目标词语匹配的至少一个关联词语,并确定搜索到的所述关联词语与所述目标词语之间的相似度值,所述关联度对照关系中存储有不同搜索领域中不同搜索词语对应的至少一个关联词语,以及不同关联词语之间处于不同搜索领域中所具有的关联度;若所述相似度值大于或等于预设关联相似度阈值,则将所述关联词语确定为所述目标词语的搜索结果,满足不同领域进行专业性词语的搜索需求,从而大大提高词语搜索的准确性以及效率。
58.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
59.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本搜索领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
60.图1示出了本发明实施例提供的一种词语搜索方法流程图;
61.图2示出了本发明实施例提供的另一种词语搜索方法流程图;
62.图3示出了本发明实施例提供的又一种词语搜索方法流程图;
63.图4示出了本发明实施例提供的一种词语a搜索相似度计算示意图;
64.图5示出了本发明实施例提供的一种词语搜索装置组成框图;
65.图6示出了本发明实施例提供的一种终端的结构示意图。
具体实施方式
66.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本搜索领域的技术人员。
67.针对通在统计指标的词语名称数据库中以sql的like查询方式进行查询,或者采用全文搜索引擎工具对统计指标的词语名称进行分词索引编制,进而实现搜索。但是,上述两种方式对于极强科学专业性的词语,搜索准确性差,无法从其他非统计搜索领域中精准地搜索到统计专业性的目标词语名称,本发明实施例提供了一种词语搜索方法,如图1所示,该方法包括:
68.101、获取目标搜索领域中待搜索的目标词语。
69.本发明实施例中,为了满足不同词语在不同领域中的搜索需求,在进行词语搜索时,首先确定待搜索的目标词语,以及对目标词语进行搜索的目标搜索领域。其中,搜索领域为按照词语含义的学科、商业等进行划分,包括但不限于法律、经济学、生物学、统计学、石油工业、互联网等,对应的,为了实现跨领域的词语搜索,目标词语为非属于目标搜索领域的领域内词语,例如,目标搜索领域为统计学领域,目标词语为经济学领域的“物价”词语,从而进行跨领域的词语搜索。
70.需要说明的是,当前执行主体可以为任意实现词语搜索的终端、服务端,或者嵌入至终端或服务端中的搜索模块、搜索单元,并在当前执行主体中预先构建出不同搜索领域对应的词语库,以便在目标搜索领域中进行词语搜索。
71.102、基于关联度对照关系在所述目标搜索领域中搜索与所述目标词语匹配的至少一个关联词语,并确定搜索到的所述关联词语与所述目标词语之间的相似度值。
72.本发明实施例中,确定目标词语后,结合预先生成的关联度对照关系在目标搜索领域中搜索目标词语的关联词语,从而确定各个关联词语与目标词语之间的相似度值。其中,所述关联度对照关系中存储有不同搜索领域中不同搜索词语对应的至少一个关联词语,以及不同关联词语之间处于不同搜索领域中所具有的关联度,即在对目标词语在目标搜索领域中进行搜索时,按照关联对对照关系查找出在目标搜索领域中,与目标词语对应的关联词语,以及各个关联词语之间处于目标搜索领域时相对于目标词语对应的搜索领域
的关联度。此时,关联词语为与被搜索词语具有关联关系的词语,其中,搜索词语可以为目标词语和关联词语本身,即一个目标词语作为搜索词语在搜索时,按照关联度对照关系搜索与目标词语对应的至少一个关联词语,此时,通过将关联词语作为搜索词语,再次按照关联度对照关系进行搜索,确定关联词语的关联词语,以此类推,从而得到全部的关联词语以及对应的关联度,本发明实施例不做具体限定。对应的,关联度用于表征搜索词语与被搜索词语在对应两个搜索领域之间具有关联性的程度,通过数值进行表示,为预先配置于关联度对照关系中,以便在搜索目标词语的关联词语时,直接确定,本发明实施例不做具体限定。另外,关联度对照关系可以以表格形式存储,也可以为数据对形式存储,本发明实施例不做具体限定。
73.需要说明的是,由于关联度为搜索到的词语与被搜索的词语之间的关系程度,同时,按照关联度对照关系中已配置的关联度依次搜索得到的关联词语,包括与目标词语关联度的词语,也包括与关联词语本身存在关联的词语,因此,计算搜索到的关联词语与目标词语之间的相似度值,从而确定每个关联词语与目标词语之间的相似度。
74.103、若所述相似度值大于或等于预设关联相似度阈值,则将所述关联词语确定为所述目标词语的搜索结果。
75.本发明实施例中,若计算的搜索到的关联词语与目标词语之间的相似度值大于或等于预设关联相似度阈值,则将搜索到的此关联词语作为目标词语的搜索结果。例如,目标词语a,搜索到关联词语b和关联词语c,目标词语a与关联词语b的相似度值大于预设关联相似度阈值0.6,则确定关联词语b为目标词语a的搜索结果,目标词语a与关联词语c的相似度值同时大于预设关联相似度阈值0.6,则同时确定关联词语c为目标词语a的搜索结果。
76.在另一个本发明实施例中,为了进一步限定及说明,如图2所示,步骤101获取目标搜索领域中待搜索的目标词语之前,所述方法还包括:
77.201、从多个数据源自然语言词库中获取各搜索领域中的同义词语、具有包含关系的同类词语、以及简写类词语;
78.202、基于所述同义词语、所述同类词语、以及所述简写类词语建立不同词语之间的关联关系,确定不同词语所对应的关联词语;
79.203、按照预设关联度重合特征为不同关联词语之间配置关联度;
80.204、基于不同关联词语,以及所述关联词语之间配置的关联度生成关联度对照关系。
81.本发明实施例中,在对目标词语在目标搜索领域中进行搜索时,可以准确匹配到与目标词语对应的关联词语,预先生成关联度对照关系。具体的,数据源自然语言词库中存储有不同语言种类、不同领域、不同语言词语来源的词语,例如,中文词库、英文词库、某文献数据库、某度搜索引擎数据库等,从而从数据源自然语言词库中获取不同搜索领域中的同义词语、具有包含关系的同类词语、以及简写类词语,从而建立不同词语之间的关联关系,并确定不同词语对应的关联词语。其中,同义词语为相同含义的词语,例如“很”与“非常”,具有包含关系的同类词语为从相同领域上具有大小包含关系的词语,例如“知识产权”与“发明”,简写类词语为具有相同含义的不同长度的词语,例如“美利坚合众国”与“美国”,本发明实施例不做具体限定。另外,不同搜索领域中的同义词语、具有包含关系的同类词语、以及简写类词语,均可以作为在搜索目标词语时作为搜索标引,查找到与目标词语对应
的关联词语,因此,基于同义词语、同类词语、以及简写类词语建立不同词语之间的关联关系,确定不同词语所对应的关联词语。其中,关联关系用于表征每两个词语之间所具有关联程度,此时关联程度即通过关联度进行描述,确定具有关联关系的任意两个词语均可以作为其中一个词语的关联词语,例如,词语a与词语b具有关联关系,则在基于词语a进行搜索时,词语b为关联词语,在基于词语b进行搜索时,词语a作为关联词语,本发明实施例不做具体限定。并且,在确定关联词语时,每两个关联词语之间具有关联关系,例如,词语a与词语b之间具有关联关系,对应的,若词语c与词语b之间具有具有关联关系,则基于两个关联关系,可以建立一条关联链条,以确定出全部与搜索的目标词语a对应可搜索到的词语b、词语c。
82.需要说明的是,由于关联度用于表征搜索词语与被搜索词语在对应两个搜索领域之间具有关联性的程度,因此,按照预设关联重合特征为不同关联词语之间配置关联度。例如,词语a与词语b之间存在关联关系,基于预设关联重合特征为词语a与词语b之间的关联关系配置关联度0.9。对应的,在对不同关联词语之间配置完关联度后,基于不同关联词语以及关联词语之间配置的关联度生成关联度对照关系,此时,关联度对照关系中存储有不同搜索词语在不同搜索领域中对应的多个关联词语,以及不同关联词语之间处于不同搜索领域中所具有的关联度。
83.在另一个本发明实施例中,为了进一步限定及说明,如图3所示,步骤203按照预设关联度重合特征为不同关联词语之间配置关联度包括:
84.2031、确定具有关联关系的两个关联词语的所属搜索领域,并按照所述搜索领域分别解析所述关联词语的对应词语概念;
85.2032、确定所述词语概念之间的重合度;
86.2033、若所述词语概念的重合度大于或等于预设重合度阈值,则将所述重合度配置为所述关联词语之间的关联度。
87.为了准确对目标词语进行搜索,在配置关联度对照关系时,对于不同关联词语之间的配置的关联度,由于关联度用于表征具体的搜索词语与被搜索词语在对应两个搜索领域之间具有关联性的程度,因此,确定作为搜索词语与被搜索词语的两个关联词语的所属搜索领域,以解析在两个搜索领域中,关联词语分别对应的词语概念。其中,词语概念即为词语所表征的具体语言内容,例如,经济学搜索领域中词语a为“物价”,统计学搜索领域中词语b为“居民消费价格指数。同时,为了确定不同关联词语之间词语概念的重合情况,以配置关联度,则确定两个词语概念之间的重合度,其中,所述重合度用于表征所述关联词语之间在词语概念维度上的相同程度,也即表示为一种词语概念的相似度,此时,可以通过专家经验人为对词语概念进行标记重合度,也可以通过预先配置的词语概念对应重合度配置表进行配置,本发明实施例不做具体限定。具体的,为了使目标词语在搜索时,搜索到关联度较高的关联词语,重合度虽然可以配置为0-1之间的数值范围,则通过配置预设重合度阈值来筛选配置关联度,优先预设重合度阈值为0.6,即使得重合度在0.6-0.99...之间的关联词语的关联度直接按照重合度进行配置。
88.在另一个本发明实施例中,为了进一步限定及说明,步骤确定搜索到的所述关联词语与所述目标词语之间的相似度值包括:确定查找到的所述关联词语之间的关联关系以及对应的关联度;基于所述关联度递归计算所述关联词与所述目标词语之间相对于所述关
联关系的相似度值。
89.为了确定筛选出搜索到的关联词语是否满足搜索需求,计算搜索到的关联词语与目标词语之间的相似度值。其中,由于各个关联词语之前存在对应的关联关系,以及配置的关联度,在计算目标词语与各个关联词语之间的相似度值时,结合关联关系的层级维度将关联度进行相乘得到,即相似度值为按照关联关系进行至少一个关联度相乘得到。如图4所示,词a作为搜索的目标词语,在目标搜索领域进行搜索时,按照关联度对照关系搜索到词b为与词a具有关联关系的关联词语,且关联度为0.9,搜索到词c为与词b具有关联关系的关联词语,且关联度为0.9,搜索到词d为与词c具有关联关系的关联词语,且关联度为0.7,分别计算词a与词b之间的相似度值,即按照关联关系进行递归相乘,则将关联度0.9作为词a与词b之间相似度值,在计算词a与词c之间的相似度值时,即按照词a到词b再到词c的关联关系进行递归相乘,则递归计算词a与词b之间关联度0.9乘以词b与词c之间的关联度0.9,将得到的0.81作为词a与词c之间的相似度值,从而,在计算词a与词d之间的相似度值时,按照词a到词b再到词c最后到词d的关联关系进行递归相乘,即0.9
×
0.9
×
0.7,得到0.567作为词a与词d的相似度值。
90.在另一个本发明实施例中,为了进一步限定及说明,步骤101获取目标搜索领域中待搜索的目标词语之前,所述方法还包括:接收待搜索的文本内容,并对所述文本内容进行分词;若分词后的词语未处于目标搜索领域,则确定分词后的词语为目标词语,以进行关联词语的搜索。
91.为了实现准确地词语搜索目的,满足对文本内容中词语进行搜索的需求,在获取目标词语之前,接收待搜索的文本内容,并对文本内容进行分词,从而确定是否进行本发明实施例中的词语搜索。其中,文本内容可以为包含多个词语的一句话,也可以为包含多个句话的一段文字,本发明实施例不做具体限定。同时,基于自然语言技术对文本内容进行分词,得到多个词语,分词的具体方法可以结合已知自然语言数据库进行词语拆分处理,以得到对一句话或一段文本进行拆分的多个词语。此时,若分词后的词语未处于目标搜索领域,则说明目标搜索领域与此词语不属于相同搜索领域,因此,为了满足对专业性词语的搜索需求,将此词语作为目标搜索领域的目标词语,以进行步骤102-103中的词语搜索方法。
92.在另一个本发明实施例中,为了进一步限定及说明,步骤102确定搜索到的所述关联词语与所述目标词语之间的相似度值之后,所述方法还包括:若所述相似度值小于预设关联相似度阈值,则删除所述关联词语。
93.当计算出目标词语与关联词语之间的相似度值小于预设关联相似度阈值,则说明目标词语与关联词语不匹配,无法直接基于此关联词语作为目标词语的搜索结果,因此,将此关联词语删除即可。
94.在另一个本发明实施例中,为了进一步限定及说明,步骤103将所述关联词语确定为所述目标词语的搜索结果之后,所述方法还包括:按照所述关联词语所对应的关联关系输出所述搜索结果。
95.为了满足用户对词语搜索的显示需求,在确定关联词语后,按照对应的关联关系输出搜索结果,例如,目标词语为“物价”,则按照关联关系搜索链条,输出“居民消费价格指数”、“城镇居民消费价格指数”、“农村居民消费价格指数”、“酒类居民消费价格指数”等,本发明实施例不做具体限定。
96.本发明实施例提供了一种词语搜索方法,与现有技术相比,本发明实施例通过获取目标搜索领域中待搜索的目标词语;基于关联度对照关系在所述目标搜索领域中搜索与所述目标词语匹配的至少一个关联词语,并确定搜索到的所述关联词语与所述目标词语之间的相似度值,所述关联度对照关系中存储有不同搜索领域中不同搜索词语对应的至少一个关联词语,以及不同关联词语之间处于不同搜索领域中所具有的关联度;若所述相似度值大于或等于预设关联相似度阈值,则将所述关联词语确定为所述目标词语的搜索结果,满足不同领域进行专业性词语的搜索需求,从而大大提高词语搜索的准确性以及效率。
97.进一步的,作为对上述图1所示方法的实现,本发明实施例提供了一种词语搜索装置,如图5所示,该装置包括:
98.获取模块31,用于获取目标搜索领域中待搜索的目标词语;
99.搜索模块32,用于基于关联度对照关系在所述目标搜索领域中搜索与所述目标词语匹配的至少一个关联词语,并确定搜索到的所述关联词语与所述目标词语之间的相似度值,所述关联度对照关系中存储有不同搜索领域中不同搜索词语对应的至少一个关联词语,以及不同关联词语之间处于不同搜索领域中所具有的关联度;
100.确定模块33,用于若所述相似度值大于或等于预设关联相似度阈值,则将所述关联词语确定为所述目标词语的搜索结果。
101.进一步地,所述装置还包括:建立模块,配置模块,生成模块,
102.所述获取模块,还用于从多个数据源自然语言词库中获取各搜索领域中的同义词语、具有包含关系的同类词语、以及简写类词语;
103.所述建立模块,用于基于所述同义词语、所述同类词语、以及所述简写类词语建立不同词语之间的关联关系,确定不同词语所对应的关联词语;
104.所述配置模块,用于按照预设关联度重合特征为不同关联词语之间配置关联度;
105.所述生成模块,用于基于不同关联词语,以及所述关联词语之间配置的关联度生成关联度对照关系。
106.进一步地,所述配置模块包括;
107.解析单元,用于确定具有关联关系的两个关联词语的所属搜索领域,并按照所述搜索领域分别解析所述关联词语的对应词语概念;
108.第一确定单元,用于确定所述词语概念之间的重合度,所述重合度用于表征所述关联词语之间在词语概念维度上的相同程度;
109.配置单元,用于若所述词语概念的重合度大于或等于预设重合度阈值,则将所述重合度配置为所述关联词语之间的关联度。
110.进一步地,所述搜索模块包括:
111.第二确定单元,用于确定搜索到的所述关联词语与所述目标词语之间的相似度值包括:
112.第三确定单元,用于确定查找到的所述关联词语之间的关联关系以及对应的关联度;
113.计算单元,用于基于所述关联度递归计算所述关联词与所述目标词语之间相对于所述关联关系的相似度值,所述相似度值为按照关联关系进行至少一个关联度相乘得到。
114.进一步地,所述装置还包括:分词模块,
115.所述分词模块,用于接收待搜索的文本内容,并对所述文本内容进行分词;
116.所述确定模块,还用于若分词后的词语未处于目标搜索领域,则确定分词后的词语为目标词语,以进行关联词语的搜索。
117.进一步地,所述装置还包括:
118.删除模块,用于若所述相似度值小于预设关联相似度阈值,则删除所述关联词语。
119.进一步地,所述装置还包括:
120.输出模块,用于按照所述关联词语所对应的关联关系输出所述搜索结果。
121.本发明实施例提供了一种词语搜索装置,与现有技术相比,本发明实施例通过获取目标搜索领域中待搜索的目标词语;基于关联度对照关系在所述目标搜索领域中搜索与所述目标词语匹配的至少一个关联词语,并确定搜索到的所述关联词语与所述目标词语之间的相似度值,所述关联度对照关系中存储有不同搜索领域中不同搜索词语对应的至少一个关联词语,以及不同关联词语之间处于不同搜索领域中所具有的关联度;若所述相似度值大于或等于预设关联相似度阈值,则将所述关联词语确定为所述目标词语的搜索结果,满足不同领域进行专业性词语的搜索需求,从而大大提高词语搜索的准确性以及效率。
122.根据本发明一个实施例提供了一种存储介质,所述存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的词语搜索方法。
123.图6示出了根据本发明一个实施例提供的一种终端的结构示意图,本发明具体实施例并不对终端的具体实现做限定。
124.如图6所示,该终端可以包括:处理器(processor)402、通信接口(communications interface)404、存储器(memory)406、以及通信总线408。
125.其中:处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。
126.通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。
127.处理器402,用于执行程序410,具体可以执行上述词语搜索方法实施例中的相关步骤。
128.具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
129.处理器402可能是中央处理器cpu,或者是特定集成电路asic(application specific integrated circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。终端包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。
130.存储器406,用于存放程序410。存储器406可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
131.程序410具体可以用于使得处理器402执行以下操作:
132.获取目标搜索领域中待搜索的目标词语;
133.基于关联度对照关系在所述目标搜索领域中搜索与所述目标词语匹配的至少一个关联词语,并确定搜索到的所述关联词语与所述目标词语之间的相似度值,所述关联度对照关系中存储有不同搜索领域中不同搜索词语对应的至少一个关联词语,以及不同关联词语之间处于不同搜索领域中所具有的关联度;
134.若所述相似度值大于或等于预设关联相似度阈值,则将所述关联词语确定为所述
目标词语的搜索结果。
135.显然,本搜索领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
136.以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本搜索领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献