一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

专利检索方法、装置、计算机设备及存储介质与流程

2022-11-19 13:13:30 来源:中国专利 TAG:


1.本发明涉及大数据分析技术领域,尤其涉及一种专利检索方法、装置、计算机设备及存储介质。


背景技术:

2.专利是受法律规范保护的发明创造。随着网络技术的发展,专利已经成为保护知识产权的重要组成部分。并且,网上专利资源以其无可比拟的数据优势及检索方便、不受时空限制等特点成为专利检索的主要方式。网上专利检索已逐步发展并成熟起来。
3.现有的专利搜索系统,仅关注专利本身,依然是小众专业人员因研究需要而使用的平台,其搜索页面、专利描述侧重专业化,搜索操作的反馈欠缺智能化,展开检索操作较为困难,存在公开的专利文本对非专利人员的检索技巧要求高,且检索到的专利文本的叙述语言较为专业化,导致大众对专利文本的理解存在难以理解的问题。


技术实现要素:

4.本发明实施例提供一种专利检索方法、装置、计算机设备及存储介质,以解决公开的专利文本对非专利人员的检索技巧要求高,且检索到的专利文本的叙述语言较为专业化,导致大众对专利文本的理解存在难以理解的问题。
5.一种专利检索方法,包括:获取待检索数据,并基于待检索数据,确定数据输入格式;基于数据输入格式,对待检索数据进行格式转换,获取专利检索式;基于专利检索式,在专利数据库中进行检索,获取技术原始专利;采用nlp工具处理技术原始专利,生成口语化目标专利。
6.一种专利检索方法,基于数据输入格式,对待检索数据进行格式转换,获取专利检索式,包括:若数据输入格式为技术语句,则提取待检索数据中的技术关键词,并基于技术关键词生成专利检索式;若数据输入格式为技术关键词,则对待检索数据进行分析和扩展,生成扩展关键词,并基于扩展关键词生成专利检索式。
7.一种专利检索方法,对待检索数据进行格式转换,包括:基于技术口语化数据库,识别待检索数据的口语关键词,并将口语关键词转换为对应的技术关键词。
8.一种专利检索方法,在识别待检索数据的口语关键词之前,还包括;采用技术词典和口语词典进行匹配,生成技术口语化数据库。
9.一种专利检索方法,待检索数据包括口语关键词;对待检索数据进行格式转换,获取专利检索式,包括:基于口语关键词,获取口语关联词;
基于预设检索条件和用户历史行为,获取用户检索意图,并基于用户检索意图获取扩展检索信息;对口语关键词、口语关联词和扩展检索信息进行重组,获取待检索数据对应的专利检索式。
10.一种专利检索方法,获取待检索数据,并基于待检索数据,确定数据输入格式之前,还包括:推送用户检索条件输入框;响应于用户通过用户检索条件输入框的输入内容,生成用于缩小技术原始专利的检索范围的预设检索条件。
11.一种专利检索方法,采用nlp工具处理技术原始专利,生成口语化目标专利,包括:采用nlp 技术对技术原始专利进行标注,抽取技术原始专利中所标注的技术关键词;基于技术口语化数据库,获取与技术关键词对应的口语关键词;采用口语关键词替换技术原始专利中的技术关键词,生成技术原始专利对应的口语化目标专利。
12.一种专利检索装置,包括:确定数据输入格式模块,用于获取待检索数据,并基于待检索数据,确定数据输入格式;获取专利检索式模块,用于基于数据输入格式,对待检索数据进行格式转换,获取专利检索式;获取技术原始专利模块,用于基于专利检索式,在专利数据库中进行检索,获取技术原始专利;生成口语化目标专利模块,用于采用nlp工具处理技术原始专利,生成口语化目标专利。
13.一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述专利检索方法。
14.一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述专利检索方法。
15.上述专利检索方法、装置、计算机设备及存储介质,通过获取待检索数据,通过判断待检索数据的数据输入格式,对专利数据库进行专利检索,当检索到与待检索数据相关联或者相近似的技术原始专利时,再通过nlp工具处理技术原始专利,生成与技术原始专利相对应的口语化目标专利,检索过程智能简便,仅输入需要检索的待检索数据,避免输入复杂的检索式,简化检索过程,降低检索复杂度;通过口语化方式推送口语化目标专利,将专业性较强的技术原始专利转换为通俗易懂的技术文献,为理解专利提供便利。
附图说明
16.为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图
获得其他的附图。
17.图1绘示本发明一实施例中专利检索方法的应用环境示意图;图2绘示本发明第一实施例中专利检索方法的第一流程图;图3绘示本发明第二实施例中专利检索方法的第二流程图;图4绘示本发明第三实施例中专利检索方法的第三流程图;图5绘示本发明第四实施例中专利检索方法的第四流程图;图6绘示本发明第五实施例中专利检索方法的第五流程图;图7绘示本发明一实施例中专利检索装置的示意图;图8绘示本发明一实施例中计算机设备的示意图。
具体实施方式
18.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
19.本发明实施例提供的专利检索方法,可应用在如图1的应用环境中,该专利检索方法应用在专利检索系统中,该专利检索系统包括客户端和服务器,其中,客户端通过网络与服务器进行通信。客户端又称为用户端,是指与服务器相对应,为客户端提供本地服务的程序。进一步地,客户端为计算机端程序、智能计算机设备的app程序或嵌入其他app的第三方小程序。该客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴计算机设备等计算机设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
20.在一实施例中,如图2所示,提供一种专利检索方法,以该方法应用在图1中的服务器为例进行说明,具体包括如下步骤:s10.获取待检索数据,并基于待检索数据,确定数据输入格式。
21.其中,待检索数据包含用户所需要检索的技术内容。
22.具体地,用户在客户端上对待检索数据进行输入,客户端从用户id中获取待检索数据,并进行识别判断,确定数据输入格式。
23.s20.基于数据输入格式,对待检索数据进行格式转换,获取专利检索式。
24.其中,格式转换为对待检索数据转换成客户端所能获取专利检索式的预设格式。
25.具体地,通过判断待检索数据的数据输入格式,判断完成后,会根据判断的结果,对待检索数据判断是否要进行格式转换。若待检索数据的数据输入格式不是客户端能获取专利检索式的格式,则需要将待检索数据进行格式转换,转换成计算机所能获取专利检索式的预设格式。
26.s30.基于专利检索式,在专利数据库中进行检索,获取技术原始专利。
27.其中,待检索数据与专利检索式相关联或者相近似,对应的,专利检索式与技术原始专利相关联或者相近似。
28.具体地,在生成专利检索式后,通过检索模型,使专利检索式与技术原始专利相关联或者相近似。
29.s40.采用nlp工具处理技术原始专利,生成口语化目标专利。
30.其中,nlp(natural language processing)工具是自然语言处理工具,用于处理技术原始专利中的文本信息,技术原始专利与口语化目标专利相互对应。
31.具体地,通过nlp工具处理技术原始专利的文本信息,该文本信息包括说明书摘要、权利要求书、说明书等内容,生成与技术原始专利相对应的口语化目标专利的文本信息,口语化目标专利的文本信息同样包括说明书摘要、权利要求书、说明书等内容。口语化目标专利比技术原始专利较为通俗易懂,从而便于用户理解。
32.本实施例提供的专利检索方法,通过获取待检索数据,通过判断待检索数据的数据输入格式,对专利数据库进行专利检索,当检索到与待检索数据相关联或者相近似的技术原始专利时,再通过nlp工具处理技术原始专利,生成与技术原始专利相对应的口语化目标专利,检索过程智能简便,仅输入需要检索的待检索数据,避免输入复杂的检索式,简化检索过程,降低检索复杂度;通过口语化方式推送口语化目标专利,将专业性较强的技术原始专利转换为通俗易懂的技术文献,为理解专利提供便利。
33.在一实施例中,如图3所示,在步骤s20中,即基于数据输入格式,对待检索数据进行格式转换,获取专利检索式,具体包括如下步骤:s21.若数据输入格式为技术语句,则提取待检索数据中的技术关键词,并基于技术关键词生成专利检索式。
34.s22.若数据输入格式为技术关键词,则对待检索数据进行分析和扩展,生成扩展关键词,并基于扩展关键词生成专利检索式。
35.其中,通过关键词提取模型提取技术关键词,扩展关键词包括补充性技术关键词、关联性技术关键词和组合式技术关键词。
36.具体地,若数据输入格式为技术语句,技术语句中包括多个技术关键词,则可以通过关键词提取模型提取待检索数据中的技术关键词,从而根据技术关键词生成专利检索式,供用户进行选择。若数据输入格式为技术关键词时,设置技术关键词提取阈值。当待检索数据中的技术关键词的数量少于阈值时,对技术关键词进行分析和扩展,生成扩展关键词,其扩展关键词包括补充性技术关键词、关联性技术关键词和组合式技术关键词。补充性技术关键词为后一语素补充说明前一语素,而以前语素的意义为主,关联性技术关键词为技术关键词的近义词或者反义词等内容相关,组合式技术关键词为技术关键词的相互组合。当待检索数据中的技术关键词的数量多于阈值时,适当减少技术关键词,将技术关键词中较为相关的进行合并取舍,直至待检索数据中的技术关键词的数量等于阈值。
37.步骤s21作用在于待检索数据的数据输入格式为技术语句时,直接输入一段内容,可以智能地生成专利检索式供用户进行选择,不需要进行对检索式的思考和编写;步骤s22作用在于待检索数据的数据输入格式为技术关键词时,技术关键词若过少,客户端会智能生产扩展关键词供用户选择,技术关键词若过多,客户端会智能对技术关键词中较为相关的进行合并取舍,进而生产专利检索式,方便用户进行专利检索。
38.在一实施例中,在步骤s20中,即对待检索数据进行格式转换,具体包括如下步骤:s23.基于技术口语化数据库,识别待检索数据的口语关键词,并将口语关键词转换为对应的技术关键词。
39.其中,技术口语化数据库包含有口语关键词和技术关键词,口语关键词和技术关
键词可以相互对应。
40.具体地,从客户端获取技术口语化数据库,当待检索数据中含有口语关键词,且口语关键词并不是专利文本中的技术用语时,则需要时对待检索数据的口语关键词进行识别和转换,根据技术口语化数据库将口语关键词转换为对应的技术关键词。
41.步骤s23作用在于,当口语关键词不转化技术关键词,计算机系统无法识别口语关键词,并对其进行可识别的专利检索,若将口语关键词转换为对应的技术关键词,则可以使口语关键词与技术原始专利的技术关键词相互对应起来,便于计算机系统进行识别,可以较为精准地检索到用户所需要的技术原始专利。
42.在一实施例中,在步骤s23中,即识别待检索数据的口语关键词之前,具体包括如下步骤:s231.采用技术词典和口语词典进行匹配,生成技术口语化数据库。
43.其中,技术词典包含专利文本中的技术关键词,口语词典收录汉语口语中常用的词汇,包含口语化的口语关键词。
44.具体地,通过成对匹配模型对技术词典中的词汇和口语词典的词汇进行匹配,使每一个口语关键词都可以对应专利文本中的技术关键词,再将口语关键词与对应专利文本中的技术关键词相互关联起来,生成新的技术口语化数据库。
45.步骤s231在于,待检索数据的口语关键词进行转换,转换为专利文本中较为专业化的技术关键词,以供普通用户进行专利检索使用,使普通用户也能找到较为精准、快速地所需专利文本。
46.在一实施例中,待检索数据包括口语关键词。如图4所示,在步骤s20中,即对待检索数据进行格式转换,获取专利检索式,具体包括如下步骤:s24.基于口语关键词,获取口语关联词。
47.s25.基于预设检索条件和用户历史行为,获取用户检索意图,并基于用户检索意图获取扩展检索信息。
48.s26.对口语关键词、口语关联词和扩展检索信息进行重组,获取待检索数据对应的专利检索式。
49.其中,预设检索条件包括用户的地区分布、个人偏好词汇、所需国内外专利文本、相关技术领域、关系词,关系词为和、或等表示多者关系的词。
50.具体地,通过对口语关键词进行识别和分析,获取口语关联词,口语关联词为口语关键词的近义词或者反义词等内容相关,用户根据自己的预设检索条件和用户历史行为进行输入,根据深度匹配模型分析用户的检索意图,进而检索出获取扩展检索信息,然后根据口语关键词、口语关联词和扩展检索信息进行重组,从而获取待检索数据对应的专利检索式。
51.步骤s24、s25和s26作用在于,通过预设检索条件和用户历史行为,增加检索条件,可以较为精准地获取专利检索式,并找到最接近的技术原始专利。
52.在一实施例中,在步骤s30,专利检索式包括技术关键词,即基于专利检索式,在专利数据库中进行检索,获取技术原始专利,包括:s31.在所述专利数据库中进行检索,按照与技术关键词最相关的顺序获取技术原始专利。
53.其中,与技术关键词最相关的技术原始专利排序在前,然后依次递减,与技术关键词较不相关的技术原始专利排序在后。
54.具体地,用户输入专利检索式后,通过最相关模型排列出与技术关键词最相关的技术原始专利。
55.步骤s31作用在于,方便用户找到最相关的技术原始专利。
56.在一实施例中,如图5所示,在步骤s10和步骤s20中,即获取待检索数据,并基于待检索数据,确定数据输入格式之前,还包括:s101.推送用户检索条件输入框。
57.s102.响应于用户通过用户检索条件输入框的输入内容,生成用于缩小技术原始专利的检索范围的预设检索条件。
58.其中,用户检索条件输入框用于输入用户的预设检索条件,位于专利检索界面。
59.具体地,用户在专利检索之前,在用户检索条件输入框中输入预设检索条件,计算机对用户检索条件输入框的输入内容进行识别分析,筛选出与预设检索条件相关联的技术原始专利。
60.步骤s101、s102作用在于,用户将预设检索条件输入用户检索条件输入框,缩减技术原始专利的搜索范围,减少计算机的运行成本。
61.在一实施例中,如图6所示,在步骤s40中,即采用nlp工具处理技术原始专利,生成口语化目标专利,具体包括如下步骤:s41.采用nlp 技术对技术原始专利进行标注,抽取技术原始专利中所标注的技术关键词。
62.s42.基于技术口语化数据库,获取与技术关键词对应的口语关键词。
63.s43.采用口语关键词替换技术原始专利中的技术关键词,生成技术原始专利对应的口语化目标专利。
64.其中,nlp 技术对技术原始专利的进行词性标注,采用textrank算法在技术原始专利中抽取技术关键词。
65.具体地,建立专利口语化界面,技术原始专利通过nlp技术进行标注,并通过textrank算法在技术原始专利中抽取技术关键词,技术口语化数据库包含技术原始专利的技术关键词,并技术原始专利的技术关键词与口语关键词可以相对应,则口语关键词可替换技术原始专利中的技术关键词,在专利口语化界面上生成与技术原始专利相对应的口语化目标专利。
66.步骤s41、s42和s43作用在于,通过技术原始专利生成口语化目标专利,普通用户在专利检索后,可以根据口语化目标专利较为清楚、准确地了解到技术原始专利的技术内容,方便普通用户和专业人士的使用。
67.本实施例提供的专利检索方法,通过获取待检索数据,通过判断待检索数据的数据输入格式,对专利数据库进行专利检索,当检索到与待检索数据相关联或者相近似的技术原始专利时,再通过nlp工具处理技术原始专利,生成与技术原始专利相对应的口语化目标专利,检索过程智能简便,仅输入需要检索的待检索数据,避免输入复杂的检索式,简化检索过程,降低检索复杂度。通过口语化方式推送口语化目标专利,将专业性较强的技术原始专利转换为通俗易懂的技术文献,为理解专利提供便利。
68.应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
69.在一实施例中,提供一种专利检索装置,该专利检索装置与上述实施例中专利检索方法一一对应。如图7所示,该专利检索装置包括确定数据输入格式模块、获取专利检索式模块、获取技术原始专利模块和生成口语化目标专利模块,各功能模块详细说明如下:确定数据输入格式模块10,用于获取待检索数据,并基于所述待检索数据,确定数据输入格式。
70.获取专利检索式模块20,用于基于所述数据输入格式,对所述待检索数据进行格式转换,获取专利检索式。
71.获取技术原始专利模块30,用于基于所述专利检索式,在专利数据库中进行检索,获取技术原始专利。
72.生成口语化目标专利模块40,用于采用nlp工具处理所述技术原始专利,生成口语化目标专利。
73.关于专利检索装置的具体限定可以参见上文中对于专利检索方法的限定,在此不再赘述。上述专利检索装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
74.在一实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于专利检索方法相关的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种专利检索方法。
75.在一实施例中,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例专利检索方法,例如图2所示s10至步骤s40。或者,处理器执行计算机程序时实现上述实施例中专利检索装置的各模块/单元的功能,例如图7所示模块10至模块40的功能。为避免重复,此处不再赘述。
76.在一实施例中,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例专利检索方法,例如图2所示s10至步骤s40。或者,该计算机程序被处理器执行时实现上述装置实施例中专利检索装置中各模块/单元的功能,例如图7所示模块10至模块40的功能。为避免重复,此处不再赘述。
77.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术各实施例中所使用的对存储器、存储、数据库或其它存储介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电
可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink) dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
78.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
79.以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献