一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于关键字识别分类的海量信息智能搜索系统的制作方法

2022-02-22 03:42:43 来源:中国专利 TAG:


1.本发明涉及一种关键字识别搜索系统,具体地说,涉及基于关键字识别分类的海量信息智能搜索系统。


背景技术:

2.使用者浏览器在搜索东西时,常会将需要搜索东西的关键字输入到浏览器中,使浏览器对输入的关键字有关的数据进行搜索和提取,使被搜索到的数据显示出来,而目前在浏览器搜索有关关键字的数据时,需要在网络中的海量数据进行进行大范围的过滤找寻,而在浏览器搜索数据的过程中,因搜索数据量过大而导致搜索数据的速度过慢,需求使用者对搜索的结果进行等待,延长数据搜索的时间,进而造成对使用者时间的浪费。


技术实现要素:

3.本发明的目的在于提供基于关键字识别分类的海量信息智能搜索系统,以解决上述背景技术中提出的问题。
4.为实现上述目的,提供了基于关键字识别分类的海量信息智能搜索系统,包括信息关键字采集单元、数据判断单元、内部信息处理单元、搜索单元和显示单元;
5.所述信息关键字采集单元用于对准备搜索的关键字进行采集;
6.所述数据判断单元用于判断准备搜索的关键字在系统中是否存在,并根据判断的结果确定关键词搜索的通道;
7.所述内部信息处理单元用于对系统内部有关关键字的数据进行搜索并提取出来;
8.所述内部信息处理单元包括类别识别分类模块、信息存储记录模块和信息数据存储库;
9.所述类别识别分类模块用于识别搜索单元传输来的有关关键字的数据,并对关键字的信息数据进行分类,判别出关键字的类别;
10.所述信息存储记录模块建立关键字类别列表,并接收类别识别分类模块分类完成的关键字的数据,同时根据关键字的类别,对关键字进行记录,并将有关关键字的数据导入到信息数据存储库中;
11.所述信息数据存储库用于存储关键字以及和关键字相关的数据;
12.所述搜索单元用于在数据判断单元判断系统中无关于关键字的信息时,进行联网搜索信息;
13.所述搜索单元包括网络数据采集模块和数据记忆发送模块;
14.所述网络数据采集模块用于对网络上关于关键字的数据进行搜索采集;
15.所述数据记忆发送模块用于将网络数据采集模块搜索到有关关键字的数据传输到类别识别分类模块中,由内部信息处理单元对数据i进行存储;
16.所述显示单元用于将内部信息处理单元和搜索单元搜索的信息进行显示。
17.作为本技术方案的进一步改进,所述信息关键字采集单元包括关键字键入模块和
关键字识别模块;
18.所述关键字键入模块用于使用者将所要搜索的关键字输入到系统中;
19.所述关键字识别模块用于对关键字的类别进行识别,以获得关键字所处的类别。
20.作为本技术方案的进一步改进,所述数据判断单元包括数据匹配模块、匹配数据判断模块和信息提取通道确定模块;
21.所述数据匹配模块用于接收关键字识别模块发送的关键字以及关键字的分类,同时接收信息存储记录模块发送的关键字类别列表,并对关键字及关键字的类别和关键字类别列表进行匹配;
22.所述匹配数据判断模块根据数据匹配模块数据匹配的结果,对系统中是否存在有关关键字的数据进行结果的判断;
23.所述信息提取通道确定模块用于根据匹配数据判断模块判断的结果进行搜索通道的确定。
24.作为本技术方案的进一步改进,所述数据匹配模块采用ac算法对关键字及关键字的类别和关键字类别列表进行匹配,其匹配的步骤为:
25.①
、将关键字类别列表信息o输入到信息提取通道确定模块中,信息提取通道确定模块记录数据;
26.②
、关键字类别列表信息o和接收到关键字及关键字的类别的字符数据c进行匹配,当数据匹配成功,则调到下一个状态t=base[s] c,若数据匹配失败,则跳到下一个状态o=fail[s];
[0027]

、若base[t]《0或者base[o]《0时,则状态t或者o是输出状态,输出模式串output[t]或者output[o],否则则不输出;
[0028]

、将步骤

中形成的t或者o设置为当前状态,取下一个关键字中的字符,重复步骤

和步骤

,直到关键字中的字符完成匹配;
[0029]

、当数据匹配完成后,若无匹配结果,则表明系统中没有关于关键字的数据,若存在匹配结果,则表面系统中存在关键字的数据。
[0030]
作为本技术方案的进一步改进,所述内部信息处理单元还包括数据搜索模块和数据提取模块;
[0031]
所述数据搜索模块用于根据类别识别分类模块分类的数据对信息数据存储库中存储的有关关键字的数据进行搜索;
[0032]
所述数据提取模块用于将数据搜索模块搜索到的数据进行提取出来。
[0033]
作为本技术方案的进一步改进,所述数据搜索模块接收信息数据存储库存储的数据,且在数据搜索模块对信息数据存储库中的数据进行搜索时,类别识别分类模块向信息数据存储库中发送信号,使数据搜索模块便于提取信息数据存储库中的数据。
[0034]
作为本技术方案的进一步改进,所述系统还包括信息整合处理单元,所述信息整合处理单元用于对内部信息处理单元和搜索单元搜索到有关关键字的数据进行整合。
[0035]
作为本技术方案的进一步改进,所述信息整合处理单元包括信息列表排序模块、信息类别标记模块;
[0036]
所述信息列表排序模块对关键字和与关键字有关数据的相似程度进行比较,并根据相似程度数据进行排序显示,加快使用者找寻数据的速度;
[0037]
所述信息类别标记模块用于标记内部信息处理单元和搜索单元中传输的数据。
[0038]
作为本技术方案的进一步改进,所述信息列表排序模块采用汉明距离算法对关键字和有关关键字数据的相似程度来进行排序,其中,汉明距离算法的公式为:
[0039][0040]
其中,表示模2加运算,x为关键字字符码数,y为有关关键字数据字符码数,x=(x1,x2,...,xk),y=(y1,y2,...,yk),d(x,y)为两个数据之间的距离。
[0041]
作为本技术方案的进一步改进,所述显示单元用于接收信息整合处理单元整合的数据,并将接收的数据进行显示,所述显示单元接收信息数据存储库和信息存储记录模块发送的数据,并将接收的数据显示。
[0042]
与现有技术相比,本发明的有益效果:
[0043]
1、该基于关键字识别分类的海量信息智能搜索系统中,通过设置的内部信息处理单元对系统搜索过的数据进行分类存储,使系统在搜索关键字时,当识别出该搜索的关键字的相关数据在系统中有存储,便直接将信息数据存储库中存储的数据进行提取,减少系统在网络上进行大范围数据的找寻,加快有关关键字搜索的速度,减少使用者等到的时间。
[0044]
2、该基于关键字识别分类的海量信息智能搜索系统中,通过设置的数据判断单元对系统中有关关键字的数据进行判断,并根据判断的结果确定信息提取的通道,以便于系统根据信息提取的通道对有关关键字的数据进行搜索,且在系统中没有关于关键字的数据时,将网络数据采集模块搜索到的数据记录并存储在信息数据存储库中,以扩大信息数据存储库存储数据的含量,以便于下次在进行关键字的搜索时,便于从内部信息处理单元中提取,加快关键字相关数据的搜索。
附图说明
[0045]
图1为本发明的整体框图;
[0046]
图2为本发明的信息关键字采集单元框图;
[0047]
图3为本发明的数据判断单元框图;
[0048]
图4为本发明的内部信息处理单元框图;
[0049]
图5为本发明的搜索单元框图;
[0050]
图6为本发明的信息整合处理单元框图。
[0051]
图中各个标号意义为:
[0052]
1、信息关键字采集单元;11、关键字键入模块;12、关键字识别模块;
[0053]
2、数据判断单元;21、数据匹配模块;22、匹配数据判断模块;23、信息提取通道确定模块;
[0054]
3、内部信息处理单元;31、类别识别分类模块;32、数据搜索模块;33、信息数据存储库;34、数据提取模块;35、信息存储记录模块;
[0055]
4、搜索单元;41、网络数据采集模块;42、数据记忆发送模块;
[0056]
5、信息整合处理单元;51、信息列表排序模块;52、信息类别标记模块;
[0057]
6、显示单元。
具体实施方式
[0058]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0059]
实施例1
[0060]
请参阅图1-图6所示,本实施例目的在于,提供了基于关键字识别分类的海量信息智能搜索系统,包括信息关键字采集单元1、数据判断单元2、内部信息处理单元3、搜索单元4和显示单元6;
[0061]
信息关键字采集单元1用于对准备搜索的关键字进行采集,以确定系统搜索的方向,方便系统的下一步操作;
[0062]
信息关键字采集单元1包括关键字键入模块11和关键字识别模块12;
[0063]
关键字键入模块11用于使用者将所要搜索的关键字输入到系统中,以便于系统根据关键字键入模块11输入的关键字进行有关关键字信息的搜索;
[0064]
关键字识别模块12用于对关键字的类别进行识别,以获得关键字所处的类别,方便数据判断单元2根据关键字的类别进行数据的匹配,以便于数据判断单元2判断系统中是否存在有关关键字的数据。
[0065]
数据判断单元2用于判断准备搜索的关键字在系统中是否存在,并根据判断的结果确定关键词搜索的通道;
[0066]
数据判断单元2包括数据匹配模块21、匹配数据判断模块22和信息提取通道确定模块23;
[0067]
数据匹配模块21用于接收关键字识别模块12发送的关键字以及关键字的分类,同时接收信息存储记录模块35发送的关键字类别列表,并对关键字及关键字的类别和关键字类别列表进行匹配;
[0068]
数据匹配模块21采用ac算法对关键字及关键字的类别和关键字类别列表进行匹配,其匹配的步骤为:
[0069]

、将关键字类别列表信息o输入到信息提取通道确定模块23中,信息提取通道确定模块23记录数据;
[0070]

、关键字类别列表信息o和接收到关键字及关键字的类别的字符数据c进行匹配,当数据匹配成功,则调到下一个状态t=base[s] c,若数据匹配失败,则跳到下一个状态o=fail[s];
[0071]

、若base[t]《0或者base[o]《0时,则状态t或者o是输出状态,输出模式串output[t]或者output[o],否则则不输出;
[0072]

、将步骤

中形成的t或者o设置为当前状态,取下一个关键字中的字符,重复步骤

和步骤

,直到关键字中的字符完成匹配;
[0073]

、当数据匹配完成后,若无匹配结果,则表明系统中没有关于关键字的数据,若存在匹配结果,则表面系统中存在关键字的数据;
[0074]
匹配数据判断模块22根据数据匹配模块21数据匹配的结果,对系统中是否存在有关关键字的数据进行结果的判断;
[0075]
信息提取通道确定模块23用于根据匹配数据判断模块22判断的结果进行搜索通道的确定,当匹配数据判断模块22判断出系统中未存储有关关键字的数据时,信息提取通道确定模块23确定采用搜索单元4对关键字进行搜索,当匹配数据判断模块22判断出系统中存储有关关键字饿的数据时,信息提取通道确定模块23确定采用内部信息处理单元3对关键字进行搜索,以此来加快关键字搜索的速度。
[0076]
内部信息处理单元3用于对系统内部有关关键字的数据进行搜索并提取出来,以便于数据的搜索,加快关键字搜索信息的提取速度;
[0077]
内部信息处理单元3包括类别识别分类模块31、信息存储记录模块35和信息数据存储库33;
[0078]
类别识别分类模块31用于识别搜索单元4传输来的有关关键字的数据,并对关键字的信息数据进行分类,判别出关键字的类别,以便于信息存储记录模块35对关键字的存储,方便后期数据信息的提取;
[0079]
信息存储记录模块35建立关键字类别列表,并接收类别识别分类模块31分类完成的关键字的数据,同时根据关键字的类别,对关键字进行记录,并将有关关键字的数据导入到信息数据存储库33中;
[0080]
信息数据存储库33用于存储关键字以及和关键字相关的数据;
[0081]
内部信息处理单元3还包括数据搜索模块32和数据提取模块34;
[0082]
数据搜索模块32用于根据类别识别分类模块31分类的数据对信息数据存储库33中存储的有关关键字的数据进行搜索,以获得保存在信息数据存储库33中的数据;
[0083]
数据提取模块34用于将数据搜索模块32搜索到的数据进行提取出来;
[0084]
数据搜索模块32接收信息数据存储库33存储的数据,且在数据搜索模块32对信息数据存储库33中的数据进行搜索时,类别识别分类模块31向信息数据存储库33中发送信号,使数据搜索模块32便于提取信息数据存储库33中的数据。
[0085]
搜索单元4用于在数据判断单元2判断系统中无关于关键字的信息时,进行联网搜索信息,使关键字表示的信息被显示出来,方便使用者观测对关键字搜索的信息,以便于使用者对搜索的数据的使用;
[0086]
搜索单元4包括网络数据采集模块41和数据记忆发送模块42;
[0087]
网络数据采集模块41用于对网络上关于关键字的数据进行搜索采集;
[0088]
数据记忆发送模块42用于将网络数据采集模块41搜索到有关关键字的数据传输到类别识别分类模块31中,由内部信息处理单元3对数据i进行存储,以便于后期在使用到此关键字时,可从系统中直接提取,加快关键字搜索的速度;
[0089]
系统还包括信息整合处理单元5,信息整合处理单元5用于对内部信息处理单元3和搜索单元4搜索到有关关键字的数据进行整合,以便于使用者根据系统排布的数据的进行相关数据的查找;
[0090]
信息整合处理单元5包括信息列表排序模块51、信息类别标记模块52;
[0091]
信息列表排序模块51对关键字和与关键字有关数据的相似程度进行比较,并根据相似程度数据进行排序显示,加快使用者找寻数据的速度;
[0092]
信息列表排序模块51采用汉明距离算法对关键字和有关关键字数据的相似程度来进行排序,其中,汉明距离算法的公式为:
[0093][0094]
其中,表示模2加运算,x为关键字字符码数,y为有关关键字数据字符码数,x=(x1,x2,...,xk),y=(y1,y2,...,yk),d(x,y)为两个数据之间的距离,当d(x,y)距离越大,则表示两个数据的相似度越低;
[0095]
信息类别标记模块52用于标记内部信息处理单元3和搜索单元4中传输的数据,以便于后期数据的核对。
[0096]
显示单元6用于将内部信息处理单元3和搜索单元4搜索的信息进行显示,以便于使用者的观看和显示。
[0097]
显示单元6用于接收信息整合处理单元5整合的数据,并将接收的数据进行显示,以便于使用者观看到系统搜索的结果,显示单元6接收信息数据存储库33和信息存储记录模块35发送的数据,并将接收的数据显示,以便于使用者了解到系统内部存储的数据。
[0098]
本实施例在使用时,使用者通过关键字键入模块11将需要搜索的关键字输入到系统中,关键字识别模块12对关键字进行识别,获得关键字的类别,数据匹配模块21接收关键字以及关键字识别模块12识别的关键字类别,并将关键字和关键字类别与关键字类别列表进行匹配,匹配数据判断模块22判断信息数据存储库33中是否存在有关关键字,信息提取通道确定模块23根据匹配数据判断模块22的判断结果进行搜索通道的确定;
[0099]
当系统中没有和关键字有关的数据时,通过网络数据采集模块41对网络上有关关键字的数据进行搜索,并将搜索的数据通过数据记忆发送模块42发送到类别识别分类模块31中,类别识别分类模块31对关键字进行分类,并通过信息存储记录模块35将关键字存储进行记录,并将用关关键字的数据存储到信息数据存储库33中供信息数据存储库33存储,以便于数据在下次搜索时使用;
[0100]
当系统中有和关键字有关的数据时,类别识别分类模块31接收关键字,并对关键字进行识别,使数据搜索模块32对信息数据存储库33中的数据进行搜索,并由数据提取模块34将数据搜索模块32搜索到的数据进行提取;
[0101]
信息列表排序模块51接收数据提取模块34和网络数据采集模块41中的数据,并根据和关键字的相似度进行排序,并将排序出的数据通过显示单元6显示出来。
[0102]
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献