一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种面向权利要求点的检索方法和装置与流程

2022-10-26 07:02:27 来源:中国专利 TAG:

技术特征:
1.一种面向权利要求点的检索方法,其特征在于,包括如下步骤:步骤1:专利权利要求点语义化模型生成:该模型生成包括专利数据采集、数据预处理、迭代训练、模型生成、模型部署;步骤2:专利权利要求点检索;该检索方法包括了前期专利数据生成向量,向量插入向量数据库,构建索引和检索;步骤3:利用专利权利要求点的检索系统,调用后端检索接口得到top k检索结果,显示到界面上。2.根据权利要求1所述的面向权利要求点的检索方法,其特征在于,所述步骤1的专利权利要求点语义化模型生成方法包括采集原始专利数据,采集完成后并不断同步至源数据库,通过预处理提取专利权利要求点之后,进入设计好的模型生成流水线;进行第一轮训练,生成了初始版本的语义化模型,随后随着专利数据的更新,流水线会根据专利数据的增加自动执行训练任务,进行模型更新。3.根据权利要求1所述的专利权利要求点检索方法,其特征在于,所述步骤2的专利权利要求点的检索,是将原始的专利权利要求点数据通过步骤1的语义模型生成向量数据,然后把向量数据插入向量数据库,接着对向量数据构建索引,然后将待检索技术特征描述数据也生成向量,最后根据该向量进行检索,得到检索结果。4.根据权利要求1所述的专利权利要求点检索方法,其特征在于,步骤3所述专利权利要求点的检索系统,调用后端检索接口得到top k检索结果,显示到界面上。5.根据权利要求1所述的面向权利要求点的检索方法,其特征在于,所述步骤1包括如下具体步骤:步骤1.1:专利数据采集并存储,采集的数据包括专利的正文信息和权利要求书信息;步骤1.2:数据的预处理,提取权利要求点信息,并导出;步骤1.3:原始专利数据经过等量切割成多个数据块,对这些数据块按顺序逐一训练;步骤1.4:把第一个数据块作为初始数据,训练参数为初始默认值,开始第一轮训练,得到第一轮训练的语义化模型和参数;步骤1.5:根据第一轮训练的模型和参数,和第二个数据块,进行第二轮训练,得到第二轮训练的模型和参数;按照此步骤迭代训练,直到将存量训练数据训练完得到最终的训练模型和参数;步骤1.6:随着原始专利数据继续增加,达到可以训练的阈值数据量后,便导出数据,在上一个步骤基础上继续训练,得到最新的训练模型和参数;步骤1.7:最新的模型一旦生成,便直接通过 kubeflow kfserving部署到后端服务中去;步骤1.8:将以上步骤编写成流水线模版,把训练环境打包成docker镜像,实现全流程流水线化和自动化。6.根据权利要求1所述的面向权利要求点的检索方法,其特征在于,所述步骤2包括如下具体步骤:步骤2.1:原始的专利权利要求点数据,经过步骤1生成的语义化模型生成向量,然后把转换的向量逐一插入到向量数据库中;步骤2.2:配置构建索引参数,对向量数据库中的权利要求点数据构建索引;
步骤2.3:构建完索引,进行基于权利要求点的专利检索,将待检索的技术特征描述数据,经过步骤1生成的语义模型生成向量,根据生成向量调用向量数据库的检索接口进行向量检索,得到top k检索结果;步骤2.4:随着采集的专利数据继续增加,达到可以训练的阈值数据量后,便导出数据;对于增量数据,经过步骤1生成的语义化模型转化成向量,然后把转换的向量逐一插入到向量数据库milvus 中;最后对于增量向量数据构建索引。7.根据权利要求1所述的面向权利要求点的检索方法和装置,其特征在于,所述步骤3包括如下具体步骤:步骤3.1:用户在前端输入待检索的技术特征描述数据;步骤3.2:前端输入待检索的技术特征描述数据,经过语义化模型生成向量;步骤3.3:基于生成后的向量,使用向量数据库的接口进行向量检索,得到top k检索结果,并显示在前端。8.一种面向权利要求点的检索装置,包括控制器,其特征在于,所述控制器包括存储器、处理器及存储在存储器上的可在处理器上运行的计算机程序,处理器执行程序时实现如权利要求1-7任一项所述方法的步骤。

技术总结
本发明属于人工智能领域,公开了一种面向权利要求点的检索方法和装置,包括如下步骤:步骤1:专利权利要求点语义化模型生成:流水线生成模型包括专利数据采集、数据预处理、迭代训练、模型生成、模型部署;步骤2:专利权利要求点检索方法;该检索方法包括了前期专利数据生成向量,向量插入向量数据库,构建索引和检索;步骤3:利用专利权利要求点的检索系统,调用后端检索接口得到Top K检索结果,显示到界面上。本发明针对权利要求点的向量检索,大大缩短了专利检索时间,能够以较短的时间提供给用户高质量的专利检索结果。质量的专利检索结果。质量的专利检索结果。


技术研发人员:朱亚光 徐小良
受保护的技术使用者:之江实验室
技术研发日:2022.06.21
技术公布日:2022/10/25
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献