一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于图文多模态融合的文档片段语义相似度判定算法的制作方法

2022-11-28 12:04:32 来源:中国专利 TAG:


1.本发明涉及相似度判定领域,尤其涉及一种基于图文多模态融合的文档片段语义相似度判定算法。


背景技术:

2.今年来,随着互联网上海量图文的积聚,能够有效地组织这些图文数据和准确搜到相关图文成为一个重要的研究课题。很多场合都需要对文档片段的相似度进行检索判断,例如典型的论文查重。现有的文档片段语义相似度判定多通过文档检索的方式,存在一定局限性,因为有很多图片同样披露了相关文档,例如图片的文档标注,图片中的字样等,这就造成文档片段语义相似度判定时的检索范围不够合理,从而影响最终的相似度判定。


技术实现要素:

3.本发明目的是针对背景技术中存在的文档片段语义相似度判定存在局限性的问题,提出一种基于图文多模态融合的文档片段语义相似度判定算法。
4.一方面,本发明提出一种基于图文多模态融合的文档片段语义相似度判定算法,包括以下步骤:
5.s1、对库中的文档和图片进行多模态融合;
6.s2、输入待判断的文档片段;
7.s3、对文档片段进行自动分类标记,给予文档一个或多个类别标记,同时进行文档的向量化表征;
8.s4、对文档的分类标记进行图片检索,得到相似度a,对向量化表征进行文档检索,得到相似度b;
9.s5、根据结合规则对相似度a和相似度b进行整合,得到最终的文档片段语义相似度判定数值。
10.优选的,s1中,多模态融合包括图片的文本标注提取、图片中字样识别和提取、图片分类标记、文档向量化表征、文档分类标记和文档图片相似匹配。
11.优选的,s3中,文本分类方法包括:knn法、svm法、vsm法或bayes法。
12.优选的,s3中,向量化表征方法为平均池化或最大池化,平均池化对表征的矩阵整体进行平均池化,得到向量,最大池化对表征的矩阵整体进行最大池化,得到向量。
13.优选的,s4中,图片检索主要检索与文档分类标记相似或相同的图片分类标记;文档检索通过最近邻向量索引完成,最近邻向量索引方法为基于树的annoy和基于图的hnsw,图片中文本标注和图中的文字字样同样参与到文档检索中。
14.优选的,s5中,罗列相似度匹配检索到的图片和文档。
15.另一方面,本发明提出一种基于图文多模态融合的文档片段语义相似度判定算法的文档片段语义相似度判定系统,包括多模态融合模块、文档标记模块、向量化表征模块、最近邻向量索引模块、图片分类标记模块、图片检索相似度判定模块、文档检索相似度判定
模块和最终相似度判定模块;多模块融合模块用来将文档信息和图片信息进行融合;文档标记模块用来对待判定文档进行分类标记;向量化表征模块用来对待检测文档片段进行向量化表述;最近邻向量索引模块用来根据向量化表征模块输出的向量在文本库中寻找相似或相同的文档向量;图片分类标记模块用来对库中的图片进行分类标记,并提取图片相关的文档标注和图片中的文字信息,得到与图片相关的文档信息,图片相关的文档信息与图片一一对应,图片相关的文档信息归入库中文档内,参与到向量化表征的文档检索中;图片检索相似度判定模块用来对文档的分类标记进行图片检索,得到相似度a;文档检索相似度判定模块用来对向量化表征进行文档检索,得到相似度b;最终相似度判定模块用来结合相似度a和相似度b得出最终相似度数值。
16.与现有技术相比,本发明具有如下有益的技术效果:通过对库中的文档和图片进行多模态融合,然后结合对待检测文档片段的分类标记和向量化表征,分别进行图片检索和文档检索,基于图文多模态融合,有效扩大了文档片段语义相似度判定的检索范围,提高了相似度判定的准确性。
附图说明
17.图1为本发明一种实施例的流程图;
18.图2为文档片段语义相似度判定系统的结构图。
具体实施方式
19.实施例一
20.如图1所示,本发明提出的一种基于图文多模态融合的文档片段语义相似度判定算法,包括以下步骤:
21.s1、对库中的文档和图片进行多模态融合;多模态融合包括图片的文本标注提取、图片中字样识别和提取、图片分类标记、文档向量化表征、文档分类标记和文档图片相似匹配;
22.s2、输入待判断的文档片段;
23.s3、对文档片段进行自动分类标记,给予文档一个或多个类别标记,同时进行文档的向量化表征;文本分类方法包括:knn法、svm法、vsm法或bayes法;向量化表征方法为平均池化或最大池化,平均池化对表征的矩阵整体进行平均池化,得到向量,最大池化对表征的矩阵整体进行最大池化,得到向量;
24.s4、对文档的分类标记进行图片检索,得到相似度a,对向量化表征进行文档检索,得到相似度b;图片检索主要检索与文档分类标记相似或相同的图片分类标记;文档检索通过最近邻向量索引完成,最近邻向量索引方法为基于树的annoy和基于图的hnsw,图片中文本标注和图中的文字字样同样参与到文档检索中;
25.s5、根据结合规则对相似度a和相似度b进行整合,得到最终的文档片段语义相似度判定数值,并罗列相似度匹配检索到的图片和文档。
26.本实施例中,通过对库中的文档和图片进行多模态融合,然后结合对待检测文档片段的分类标记和向量化表征,分别进行图片检索和文档检索,基于图文多模态融合,有效扩大了文档片段语义相似度判定的检索范围,提高了相似度判定的准确性。
27.实施例二
28.如图2所示,基于上述一种基于图文多模态融合的文档片段语义相似度判定算法的文档片段语义相似度判定系统,包括多模态融合模块、文档标记模块、向量化表征模块、最近邻向量索引模块、图片分类标记模块、图片检索相似度判定模块、文档检索相似度判定模块和最终相似度判定模块;多模块融合模块用来将文档信息和图片信息进行融合;文档标记模块用来对待判定文档进行分类标记;向量化表征模块用来对待检测文档片段进行向量化表述;最近邻向量索引模块用来根据向量化表征模块输出的向量在文本库中寻找相似或相同的文档向量;图片分类标记模块用来对库中的图片进行分类标记,并提取图片相关的文档标注和图片中的文字信息,得到与图片相关的文档信息,图片相关的文档信息与图片一一对应,图片相关的文档信息归入库中文档内,参与到向量化表征的文档检索中;图片检索相似度判定模块用来对文档的分类标记进行图片检索,得到相似度a;文档检索相似度判定模块用来对向量化表征进行文档检索,得到相似度b;最终相似度判定模块用来结合相似度a和相似度b得出最终相似度数值。
29.本实施例中,通过对库中的文档和图片进行多模态融合,然后结合对待检测文档片段的分类标记和向量化表征,分别进行图片检索和文档检索,基于图文多模态融合,有效扩大了文档片段语义相似度判定的检索范围,提高了相似度判定的准确性。
30.上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于此,在所属技术领域的技术人员所具备的知识范围内,在不脱离本发明宗旨的前提下还可以作出各种变化。


技术特征:
1.一种基于图文多模态融合的文档片段语义相似度判定算法,其特征在于,包括以下步骤:s1、对库中的文档和图片进行多模态融合;s2、输入待判断的文档片段;s3、对文档片段进行自动分类标记,给予文档一个或多个类别标记,同时进行文档的向量化表征;s4、对文档的分类标记进行图片检索,得到相似度a,对向量化表征进行文档检索,得到相似度b;s5、根据结合规则对相似度a和相似度b进行整合,得到最终的文档片段语义相似度判定数值。2.根据权利要求1所述的基于图文多模态融合的文档片段语义相似度判定算法,其特征在于,s1中,多模态融合包括图片的文本标注提取、图片中字样识别和提取、图片分类标记、文档向量化表征、文档分类标记和文档图片相似匹配。3.根据权利要求1所述的基于图文多模态融合的文档片段语义相似度判定算法,其特征在于,s3中,文本分类方法包括:knn法、svm法、vsm法或bayes法。4.根据权利要求1所述的基于图文多模态融合的文档片段语义相似度判定算法,其特征在于,s3中,向量化表征方法为平均池化或最大池化,平均池化对表征的矩阵整体进行平均池化,得到向量,最大池化对表征的矩阵整体进行最大池化,得到向量。5.根据权利要求1所述的基于图文多模态融合的文档片段语义相似度判定算法,其特征在于,s4中,图片检索主要检索与文档分类标记相似或相同的图片分类标记;文档检索通过最近邻向量索引完成,最近邻向量索引方法为基于树的annoy和基于图的hnsw,图片中文本标注和图中的文字字样同样参与到文档检索中。6.根据权利要求1所述的基于图文多模态融合的文档片段语义相似度判定算法,其特征在于,s5中,罗列相似度匹配检索到的图片和文档。7.根据权利要求1所述的基于图文多模态融合的文档片段语义相似度判定算法,其特征在于,所述文档片段语义相似度判定系统包括多模态融合模块、文档标记模块、向量化表征模块、最近邻向量索引模块、图片分类标记模块、图片检索相似度判定模块、文档检索相似度判定模块和最终相似度判定模块;多模块融合模块用来将文档信息和图片信息进行融合;文档标记模块用来对待判定文档进行分类标记;向量化表征模块用来对待检测文档片段进行向量化表述;最近邻向量索引模块用来根据向量化表征模块输出的向量在文本库中寻找相似或相同的文档向量;图片分类标记模块用来对库中的图片进行分类标记,并提取图片相关的文档标注和图片中的文字信息,得到与图片相关的文档信息,图片相关的文档信息与图片一一对应,图片相关的文档信息归入库中文档内,参与到向量化表征的文档检索中;图片检索相似度判定模块用来对文档的分类标记进行图片检索,得到相似度a;文档检索相似度判定模块用来对向量化表征进行文档检索,得到相似度b;最终相似度判定模块用来结合相似度a和相似度b得出最终相似度数值。

技术总结
本发明涉及相似度判定领域,具体为一种基于图文多模态融合的文档片段语义相似度判定算法,其包括以下步骤:S1、对库中的文档和图片进行多模态融合;S2、输入待判断的文档片段;S3、对文档片段进行自动分类标记,同时进行文档的向量化表征;S4、对文档的分类标记进行图片检索,得到相似度a,对向量化表征进行文档检索,得到相似度b;S5、根据结合规则对相似度a和相似度b进行整合,得到最终的文档片段语义相似度判定数值。本发明中,结合对待检测文档片段的分类标记和向量化表征,分别进行图片检索和文档检索,基于图文多模态融合,有效扩大了文档片段语义相似度判定的检索范围,提高了相似度判定的准确性。似度判定的准确性。似度判定的准确性。


技术研发人员:汤力 杨震乾 梁国迪 潘媛
受保护的技术使用者:云南电网有限责任公司信息中心
技术研发日:2022.08.24
技术公布日:2022/11/25
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献