图片相似度比对方法、装置、计算机设备和存储介质与流程

2022-02-22 07:25:57 来源：中国专利 TAG：

1.本技术涉及图像处理技术领域，特别是涉及一种图片相似度比对方法、装置、计算机设备和存储介质。

背景技术：

2.随着计算机技术的发展，出现了图片相似度比对技术，图片相似度比对技术可用于对不同时期拍摄到的两组图片进行比对，验证两组图片是否为同一场景。举例说明，在进行门头相似度稽核时，可通过比对两组人员拍摄到的门头照进行相似度稽核来验证是否是同一地点，门头相似度稽核主要用于稽核广告与物料是否准确投放。
3.传统技术中，是先通过sift(scale-invariant feature transform，尺度不变特征变换)、surf(speeded up robust features)或orb(oriented fast and rotated brief，面向快速和旋转的brief)等算法分别对两组图片进行特征提取，得到两组图片的特征图，再通过比对两组图片的特征图的相似度进行图片相似度比对的。
4.然而，传统技术存在图片相似度比对准确率低的问题。

技术实现要素：

5.基于此，有必要针对上述技术问题，提供一种能够提高图片相似度比对准确率的图片相似度比对方法、装置、计算机设备和存储介质。
6.一种图片相似度比对方法，所述方法包括：
7.获取待比对图片；
8.分别对待比对图片进行目标检测和文字特征提取，得到与待比对图片对应的目标标识文字特征信息和目标标识位置信息；
9.根据目标标识位置信息，对待比对图片进行裁剪，得到与待比对图片对应的目标标识图片；
10.将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型对目标标识图片进行特征提取，得到目标标识图片的特征向量；
11.根据特征向量和目标标识文字特征信息，得到待比对图片的相似度比对结果。
12.在一个实施例中，分别对待比对图片进行目标检测和文字特征提取，得到与待比对图片对应的目标标识文字特征信息和目标标识位置信息包括：
13.分别对待比对图片进行旋转校正检测，得到角度校正后的待比对图片；
14.对角度校正后的待比对图片进行特征提取，得到与角度校正后的待比对图片对应的特征提取图；
15.根据特征提取图对角度校正后的待比对图片进行目标检测，得到与待比对图片对应的目标标识位置信息，并对角度校正后的待比对图片进行文字特征提取，得到与待比对图片对应的目标标识文字特征信息。
16.在一个实施例中，将目标标识图片分别输入已训练的分类模型，通过已训练的分
类模型对目标标识图片进行特征提取，得到目标标识图片的特征向量包括：
17.将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型中的卷积层对目标标识图片进行卷积，得到卷积后的目标标识图片；
18.通过已训练的分类模型中的归一化层对卷积后的目标标识图片进行归一化处理，得到归一化后的目标标识图片；
19.通过已训练的分类模型中的移动翻转瓶颈卷积网络对归一化后的目标标识图片进行多次移动翻转瓶颈卷积，得到目标标识图片的特征向量。
20.在一个实施例中，在将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型中的卷积层对目标标识图片进行卷积，得到卷积后的目标标识图片之前，还包括：
21.获取与目标标识图片对应的历史标识图片，根据历史标识图片得到训练数据；
22.采用efficientnet_b0网络对训练数据进行分类训练，得到已训练的分类模型。
23.在一个实施例中，根据特征向量和目标标识文字特征信息，得到待比对图片的相似度比对结果包括：
24.根据特征向量计算目标标识图片之间的特征距离；
25.当特征距离小于预设第一距离阈值时，得到相似度比对结果为待比对图片表征同一场景；
26.当特征距离大于预设第二距离阈值时，根据目标标识文字特征信息，确定待比对图片之间的图片文字关系，根据图片文字关系，得到相似度比对结果。
27.在一个实施例中，根据目标标识文字特征信息，确定待比对图片之间的图片文字关系，根据图片文字关系，得到相似度比对结果包括：
28.比对目标标识文字特征信息，得到目标标识图片之间的文字关系，文字关系为包含关系或不包含关系；
29.根据目标标识图片之间的文字关系，得到待比对图片之间的图片文字关系；
30.当图片文字关系为不包含关系时，分别对待比对图片进行明暗检测，根据明暗检测结果，得到相似度比对结果。
31.在一个实施例中，当图片文字关系为不包含关系时，分别对待比对图片进行明暗检测，根据明暗检测结果，得到相似度比对结果包括：
32.当图片文字关系为不包含关系时，通过计算待比对图片的图片平均亮度或已训练明暗检测模型，对待比对图片进行明暗检测，得到待比对图片的明暗检测结果；
33.当待比对图片的明暗检测结果均为非夜间拍摄时，得到相似度比对结果为待比对图片表征不同场景。
34.一种图片相似度比对装置，所述装置包括：
35.获取模块，用于获取待比对图片；
36.处理模块，用于分别对待比对图片进行目标检测和文字特征提取，得到与待比对图片对应的目标标识文字特征信息和目标标识位置信息；
37.裁剪模块，用于根据目标标识位置信息，对待比对图片进行裁剪，得到与待比对图片对应的目标标识图片；
38.特征提取模块，用于将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型对目标标识图片进行特征提取，得到目标标识图片的特征向量；
39.比对模块，用于根据特征向量和目标标识文字特征信息，得到待比对图片的相似度比对结果。
40.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：
41.获取待比对图片；
42.分别对待比对图片进行目标检测和文字特征提取，得到与待比对图片对应的目标标识文字特征信息和目标标识位置信息；
43.根据目标标识位置信息，对待比对图片进行裁剪，得到与待比对图片对应的目标标识图片；
44.将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型对目标标识图片进行特征提取，得到目标标识图片的特征向量；
45.根据特征向量和目标标识文字特征信息，得到待比对图片的相似度比对结果。
46.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：
47.获取待比对图片；
48.分别对待比对图片进行目标检测和文字特征提取，得到与待比对图片对应的目标标识文字特征信息和目标标识位置信息；
49.根据目标标识位置信息，对待比对图片进行裁剪，得到与待比对图片对应的目标标识图片；
50.将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型对目标标识图片进行特征提取，得到目标标识图片的特征向量；
51.根据特征向量和目标标识文字特征信息，得到待比对图片的相似度比对结果。
52.上述图片相似度比对方法、装置、计算机设备和存储介质，通过分别对待比对图片进行目标检测和文字特征提取，得到与待比对图片对应的目标标识文字特征信息和目标标识位置信息，根据目标标识位置信息，对待比对图片进行裁剪，从待比对图片裁剪出目标标识图片，对目标标识图片进行特征提取，得到目标标识图片的特征向量，并提取出目标标识文字特征信息的基础上，利用目标标识图片的特征向量和目标标识文字特征信息，实现对待比对图片的相似度比对结果的确定，得到准确的待比对图片的相似度比对结果。
附图说明
53.图1为一个实施例中图片相似度比对方法的流程示意图；
54.图2为另一个实施例中图片相似度比对方法的流程示意图；
55.图3为一个实施例中图片相似度比对装置的结构框图；
56.图4为一个实施例中计算机设备的内部结构图。
具体实施方式
57.为了使本技术的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本技术进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本技术，并不用于限定本技术。
58.在一个实施例中，如图1所示，提供了一种图片相似度比对方法，本实施例以该方法应用于终端进行举例说明，可以理解的是，该方法也可以应用于服务器，还可以应用于包括终端和服务器的系统，并通过终端和服务器的交互实现。本实施例中，该方法包括以下步骤：
59.步骤102，获取待比对图片。
60.其中，待比对图片是指待比对是否为同一场景的一组图片。比如，在进行门头相似度稽核时，待比对图片具体可以是指两组人员拍摄到的门头照，用于验证是否是同一地点。
61.具体的，当需要进行图片相似度比对时，服务器会获取待比对图片。其中，获取待比对图片的方式具体可以为用户通过终端上传待比对图片至服务器，也可以为服务器直接获取已预先存储的待比对图片。
62.步骤104，分别对待比对图片进行目标检测和文字特征提取，得到与待比对图片对应的目标标识文字特征信息和目标标识位置信息。
63.其中，目标检测是指识别图片中的目标标识以及目标标识的位置，目标标识可根据业务场景自行预先设置，具体可以是指需要进行相似度比对的对象。比如，在进行门头相似度稽核时，目标检测具体可以是指识别图片中的门头以及门头的位置。门头是指企业、事业单位和个体工商户在门口设置的牌匾及相关设施，是一个商铺店门外的装饰形式。又比如，在进行人物相似度稽核时，目标检测具体可以是指识别图片中的人物以及人物的位置。举例说明，常用的目标检测框架包括region proposal cnn(卷积神经网络)提取分类的目标检测框架以及端到端(end-to-end)的目标检测框架。
64.其中，文字特征提取是指识别图片中的文字特征信息。比如，在进行门头相似度稽核时，文字特征提取具体可以是指识别图片中的门头文字。举例说明，常用的文字特征提取方式可以为采用ocr(optical character recognition,光学字符识别)进行文字特征提取。目标标识文字特征信息是指利用文字特征提取，从待比对图片中提取出来的文字信息。目标标识位置信息是指通过目标检测从待比对图片中所识别出的目标标识的位置。比如，目标标识位置信息具体可以是指目标标识在待比对图片中的坐标信息。
65.具体的，服务器会先对待比对图片进行角度校正，得到角度校正后的待比对图片，再分别对角度校正后的待比对图片进行目标检测和文字特征提取，通过进行目标检测，从待比对图片中检测出目标标识，并得到目标标识位置信息，通过进行文字特征提取，从待比对图片中识别出目标标识文字特征信息。
66.步骤106，根据目标标识位置信息，对待比对图片进行裁剪，得到与待比对图片对应的目标标识图片。
67.具体的，在得到目标标识位置信息后，服务器会根据目标标识位置信息，在待比对图片中标注出目标标识图片，对待比对图片进行裁剪，从待比对图片中裁剪出准确的目标标识图片。举例说明，在在进行门头相似度稽核时，在得到门头位置信息后，服务器会根据门头位置信息，对待比对图片进行裁剪，从待比对图片中裁剪出门头照。通过这种方式，能够从待比对图片中裁剪出准确的目标标识图片，从而可以根据准确的目标标识图片实现相似度比对，减少待比对图片中与目标标识图片无关的其他图片特征对相似度比对的干扰，有利于得到准确的相似度比对结果。
68.步骤108，将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型对
目标标识图片进行特征提取，得到目标标识图片的特征向量。
69.其中，已训练的分类模型用于对目标标识图片进行特征提取，得到特征向量，根据特征向量对目标标识图片进行分类。在对目标标识图片进行分类的过程中，已训练的分类模型会先通过多层网络多次对目标标识图片进行特征提取，得到目标标识图片的特征向量，再依据特征向量对目标标识图片进行分类。目标标识图片的特征向量是指用于表示目标标识图片的图片特征的向量。
70.具体的，服务器会将目标标识图片分别输入已训练的分类模型中，通过已训练的分类模型中的多个移动翻转瓶颈卷积网络对目标标识图片进行特征提取，得到目标标识图片的特征向量。
71.步骤110，根据特征向量和目标标识文字特征信息，得到待比对图片的相似度比对结果。
72.其中，相似度比对结果用于表征待比对图片是否为同一场景。比如，相似度比对结果具体可以是待比对图片表征同一场景。又比如，相似度比对结果具体可以是待比对图片表征不同场景。
73.具体的，服务器会先根据特征向量计算目标标识图片之间的特征距离，通过比对特征距离和预设第一距离阈值以及预设第二距离阈值，来判断是否可以得到相似度比对结果，当特征距离小于预设第一距离阈值时，可以直接得到相似度比对结果，当特征距离大于预设第二距离阈值时，服务器会进一步根据目标标识文字特征信息，得到待比对图片的相似度比对结果，当特征距离大于预设第一距离阈值且小于预设第二距离阈值时，服务器会把待比对图片推送给人工终端，由人工终端的工作人员对待比对图片进行比对。
74.上述图片相似度比对方法，通过分别对待比对图片进行目标检测和文字特征提取，得到与待比对图片对应的目标标识文字特征信息和目标标识位置信息，根据目标标识位置信息，对待比对图片进行裁剪，从待比对图片裁剪出目标标识图片，对目标标识图片进行特征提取，得到目标标识图片的特征向量，并提取出目标标识文字特征信息的基础上，利用目标标识图片的特征向量和目标标识文字特征信息，实现对待比对图片的相似度比对结果的确定，得到准确的待比对图片的相似度比对结果。
75.在一个实施例中，分别对待比对图片进行目标检测和文字特征提取，得到与待比对图片对应的目标标识文字特征信息和目标标识位置信息包括：
76.分别对待比对图片进行旋转校正检测，得到角度校正后的待比对图片；
77.对角度校正后的待比对图片进行特征提取，得到与角度校正后的待比对图片对应的特征提取图；
78.根据特征提取图对角度校正后的待比对图片进行目标检测，得到与待比对图片对应的目标标识位置信息，并对角度校正后的待比对图片进行文字特征提取，得到与待比对图片对应的目标标识文字特征信息。
79.其中，旋转校正检测是指检测待比对图片是否为预设正常角度，当待比对图片不为预设正常角度时，需要对待比对图片进行角度校正。比如，进行旋转校正检测可以检测出待比对图片为预设正常角度、旋转90度、旋转180度以及旋转270度的情形，当检测到待比对图片为旋转90度或旋转180度或旋转270度时，需要对待比对图片进行角度校正，将待比对图片校正至预设正常角度。特征提取图是指对角度校正后的待比对图片进行特征提取得到
的特征图，用于表征角度校正后的待比对图片的图片特征。
80.具体的，在分别对待比对图片进行旋转校正检测时，服务器会先通过已训练的图片旋转角度分类模型对待比对图片进行旋转检测，当检测到待比对图片有旋转时，再对待比对图片进行角度校正，将待比对图片旋转到预设正常角度。其中，已训练的图片旋转角度分类模型可以是利用mobilenet_v2网络得到的训练模型，图片旋转角度分类模型的训练样本可分为四类，第一类为预设正常角度数据，第二类为旋转90度数据，第三类为旋转180度数据，第四类为旋转270度数据，通过根据训练样本进行训练，就可以得到图片旋转角度分类模型，该旋转角度分类模型的输出是图片类别，即待比对图片为第一类或第二类或第三类或第四类，当待比对图片为第一类时，不做处理，当待比对图片为第二类或第三类或第四类时，则根据具体类别将待比对图片旋转到预设正常角度，进行角度校正。
81.具体的，服务器可以采用mobilenetv2网络作为特征提取器进行特征提取，得到与角度校正后的待比对图片对应的特征提取图。在得到特征提取图后，服务器会通过预设目标检测网络进行目标检测，得到与待比对图片对应的目标标识位置信息。其中，预设目标检测网络具体可以为由多个卷积层和平均池化层组成的网络，每个卷积层都可以对特征提取图进行特征提取，输出不同大小感受野的特征图，通过在这些不同大小感受野的特征图上进行目标位置和类别的预测，就可以得到与待比对图片对应的目标标识位置信息。在对角度校正后的待比对图片进行文字特征提取时，服务器会先将角度校正后的待比对图片输入resnet网络进行卷积，提取角度校正后的待比对图片的特征图，再将该特征图输入到预设文本行检测模块与文本行识别双向lstm(long short-term memory，长短期记忆网络)网络，得到与待比对图片对应的目标标识文字特征信息。
82.本实施例中，通过分别对待比对图片进行旋转校正检测，得到角度校正后的待比对图片，分别对角度校正后的待比对图片进行目标检测和文字特征提取，得到与待比对图片对应的目标标识文字特征信息和目标标识位置信息，能够实现对目标标识位置信息和目标标识文字特征信息的获取。
83.在一个实施例中，将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型对目标标识图片进行特征提取，得到目标标识图片的特征向量包括：
84.将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型中的卷积层对目标标识图片进行卷积，得到卷积后的目标标识图片；
85.通过已训练的分类模型中的归一化层对卷积后的目标标识图片进行归一化处理，得到归一化后的目标标识图片；
86.通过已训练的分类模型中的移动翻转瓶颈卷积网络对归一化后的目标标识图片进行多次移动翻转瓶颈卷积，得到目标标识图片的特征向量。
87.其中，已训练的分类模型由多个移动翻转瓶颈卷积网络、卷积层、全局平均池化层以及分类层构成，损失函数为交叉熵损失函数。
88.具体的，将目标标识图片分别输入已训练的分类模型后，已训练的分类模型对目标标识图片的处理可分为三个阶段，第一个阶段为通过卷积层对目标标识图片进行卷积，得到卷积后的目标标识图片，通过归一化层对卷积后的目标标识图片进行归一化处理，得到归一化后的目标标识图片。其中，卷积层具体可以为能进行3*3*3的卷积层，归一化层采用的激活函数具体可以为swish激活函数。第二个阶段为通过移动翻转瓶颈卷积网络对归
一化后的目标标识图片进行多次移动翻转瓶颈卷积，得到目标标识图片的特征向量。其中，在移动翻转瓶颈卷积网络中包括多个移动翻转瓶颈卷积。第三个阶段为通过全局平均池化层以及分类层根据目标标识图片的特征向量，对目标标识图片进行分类。
89.举例说明，移动翻转瓶颈卷积网络中可包括16个移动翻转瓶颈卷积，则通过移动翻转瓶颈卷积网络对归一化后的目标标识图片进行多次移动翻转瓶颈卷积，得到目标标识图片的特征向量的方式具体可以分为如下七个阶段：1)对归一化后的目标标识图片进行移动翻转卷积(扩张比例为1，深度卷积核大小为3x3，核步长为1x1，包含压缩与激发操作，无连接失活和连接跳越)，得到第一阶段特征图；2)对第一阶段特征图进行两次移动翻转瓶颈卷积，第一次(扩张比例为6，深度卷积核大小为3x3，核步长为2x2，包含压缩与激发操作，无连接失活核连接跳越)，第二次(扩张比例为6，深度卷积核大小为3x3，核步长为1x1，包含压缩与激发操作，有连接失活和连接跳越)，得到第二阶段特征图；3)对第二阶段特征图进行两次移动翻转瓶颈卷积，第一次(扩张比例为6，深度卷积核大小为5x5，核步长为2x2，包含压缩与激发操作，无连接失活核连接跳越)，第二次(扩张比例为6，深度卷积核大小为5x5，核步长为1x1，包含压缩与激发操作，有连接失活和连接跳越)，得到第三阶段特征图；4)对第三阶段特征图进行三次移动翻转瓶颈卷积，第一次(扩张比例为6，深度卷积核大小为3x3，核步长为2x2，包含压缩与激发操作，无连接失活核连接跳越)，第二次(扩张比例为6，深度卷积核大小为3x3，核步长为1x1，包含压缩与激发操作，有连接失活核连接跳越)，第三次(扩张比例为6，深度卷积核大小为3x3，核步长为1x1，包含压缩与激发操作，有连接失活核连接跳越)，得到第四阶段特征图；5)对第四阶段特征图进行三次移动翻转瓶颈卷积，第一次(扩张比例为6，深度卷积核大小为5x5，核步长为1x1，包含压缩与激发操作，无连接失活核连接跳越)，第二次(扩张比例为6，深度卷积核大小为5x5，核步长为1x1，包含压缩与激发操作，有连接失活核连接跳越)，第三次(扩张比例为6，深度卷积核大小为5x5，核步长为1x1，包含压缩与激发操作，有连接失活核连接跳越)，得到第五阶段特征图；6)对第五阶段特征图进行四次移动翻转瓶颈卷积，第一次(扩张比例为6，深度卷积核大小为5x5，核步长为2x2，包含压缩与激发操作，无连接失活核连接跳越)，第二次(扩张比例为6，深度卷积核大小为5x5，核步长为1x1，包含压缩与激发操作，有连接失活核连接跳越)，第三次(扩张比例为6，深度卷积核大小为5x5，核步长为1x1，包含压缩与激发操作，有连接失活核连接跳越)，第四次(扩张比例为6，深度卷积核大小为5x5，核步长为1x1，包含压缩与激发操作，有连接失活核连接跳越)，得到第六阶段特征图；7)对第六阶段特征图进行一次移动翻转瓶颈卷积(扩张比例为6，深度卷积核大小为3x3，核步长为1x1，包含压缩与激发操作，无连接失活核连接跳越)，得到目标标识图片的特征向量。
90.本实施例中，通过已训练的分类模型中的卷积层、归一化层以及移动翻转瓶颈卷积网络对目标标识图片进行特征提取，得到目标标识图片的特征向量，能够实现对目标标识图片的特征向量的获取。
91.在一个实施例中，在将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型中的卷积层对目标标识图片进行卷积，得到卷积后的目标标识图片之前，还包括：
92.获取与目标标识图片对应的历史标识图片，根据历史标识图片得到训练数据；
93.采用efficientnet_b0网络对训练数据进行分类训练，得到已训练的分类模型。
94.其中，历史标识图片是指可用于训练的标识图片。比如，当在进行门头相似度稽核
时，历史标识图片具体可以是已拍摄的多组门头照，每组门头照中包括两张可比对的门头照。训练数据是指用于进行分类训练的数据。比如，训练数据具体可以包括历史标识图片。又比如，训练数据具体可以包括对历史标识图片进行图像增强后得到的图片集合。efficientnet_b0网络具体可以由多个移动翻转瓶颈卷积模块、卷积层、全局平均池化层以及分类层构成，它能够通过动态调整网络的宽度、深度和分辨率来提升模型的准确率。
95.具体的，服务器可以从预设图片数据库中获取与目标标识图片对应的历史标识图片，通过对历史标识图片进行分类整理和图像增强，得到训练数据，再采用efficientnet_b0网络对训练数据进行分类训练，得到已训练的分类模型。其中，通过对历史标识图片进行分类整理和图像增强，得到训练数据是指，按照应用场景，将历史标识图片分别常规场景、明暗场景、模糊场景以及角度差异场景这四类场景，并引入高斯模糊、均值模糊、中值模糊、高斯噪声、边缘锐化、图像浮雕、改变图片亮度、改变图片色度饱和度、改变图片对比度、随机丢掉10％的像素等进行图像增强。其中，明暗场景表征该组历史标识图片的明暗程度不一致，模糊场景表征该组历史标识图片中存在拍摄模糊的图片，角度差异场景表征该组历史标识图片中各图片的拍摄角度存在差异，除上述场景之外的历史标识图片，都属于常规场景。
96.本实施例中，通过获取与目标标识图片对应的历史标识图片，根据历史标识图片得到训练数据，采用efficientnet_b0网络对训练数据进行分类训练，得到已训练的分类模型，能够实现对已训练的分类模型的获取。
97.在一个实施例中，根据特征向量和目标标识文字特征信息，得到待比对图片的相似度比对结果包括：
98.根据特征向量计算目标标识图片之间的特征距离；
99.当特征距离小于预设第一距离阈值时，得到相似度比对结果为待比对图片表征同一场景；
100.当特征距离大于预设第二距离阈值时，根据目标标识文字特征信息，确定待比对图片之间的图片文字关系，根据图片文字关系，得到相似度比对结果。
101.其中，特征距离具体可以是指特征向量之间的欧式距离。预设第一距离阈值和预设第二距离阈值可按照需要自行设置。比如，第一距离阈值具体可以为0.75，第二距离阈值具体可以为0.99。
102.具体的，服务器会计算特征向量之间的欧式距离，将特征向量之间的欧式距离作为目标标识图片之间的特征距离，比对特征距离与预设第一距离阈值以及预设第二距离阈值，当特征距离小于预设第一距离阈值时，表示目标标识图片之间是比较相似的，服务器会得到相似度比对结果为待比对图片表征同一场景，当特征距离大于预设第二距离阈值时，表示无法仅通过特征距离得到相似度比对结果，服务器会根据目标标识文字特征信息，确定待比对图片之间的图片文字关系，通过图片文字关系，进一步得到相似度比对结果，当特征距离大于预设第一距离阈值且小于预设第二距离阈值时，服务器会认为此时无法通过机器得到相似度比对结果，会把待比对图片推送给人工终端，由人工终端的工作人员对待比对图片进行比对。
103.本实施例中，通过根据特征向量计算目标标识图片之间的特征距离，比对特征距离和预设第一距离阈值以及预设第二距离阈值，当特征距离小于预设第一距离阈值时，得
到相似度比对结果为待比对图片表征同一场景，当特征距离大于预设第二距离阈值时，根据目标标识文字特征信息，确定待比对图片之间的图片文字关系，根据图片文字关系，得到相似度比对结果，能够实现对相似度比对结果的获取。
104.在一个实施例中，根据目标标识文字特征信息，确定待比对图片之间的图片文字关系，根据图片文字关系，得到相似度比对结果包括：
105.比对目标标识文字特征信息，得到目标标识图片之间的文字关系，文字关系为包含关系或不包含关系；
106.根据目标标识图片之间的文字关系，得到待比对图片之间的图片文字关系；
107.当图片文字关系为不包含关系时，分别对待比对图片进行明暗检测，根据明暗检测结果，得到相似度比对结果。
108.具体的，服务器会通过比对目标标识文字特征信息，得到目标标识图片之间的文字关系，当两个目标标识文字特征信息完全相同时，可得到文字关系为包含关系，当一个目标标识文字特征信息完全按顺序出现在另一个目标标识文字特征信息中时，也可得到文字关系为包含关系，除上述两种情况之外，均会得到文字关系为不包含关系。在得到目标标识图片之间的文字关系后，服务器会将目标标识图片之间的文字关系，作为待比对图片之间的图片文字关系，当图片文字关系为不包含关系时，表示待比对图片的目标标识文字特征信息并不相同，服务器可进一步通过分别对待比对图片进行明暗检测，根据明暗检测结果来得到相似度比对结果。当图片文字关系为包含关系时，表示待比对图片的目标标识文字特征信息是相同或相近的，服务器会认为此时无法通过机器得到相似度比对结果，会把待比对图片推送给人工终端，由人工终端的工作人员对待比对图片进行比对。
109.本实施例中，通过比对目标标识文字特征信息，得到目标标识图片之间的文字关系，文字关系为包含关系或不包含关系，根据目标标识图片之间的文字关系，得到待比对图片之间的图片文字关系，当图片文字关系为不包含关系时，分别对待比对图片进行明暗检测，根据明暗检测结果，得到相似度比对结果，能够实现对相似度比对结果的获取。
110.在一个实施例中，当图片文字关系为不包含关系时，分别对待比对图片进行明暗检测，根据明暗检测结果，得到相似度比对结果包括：
111.当图片文字关系为不包含关系时，通过计算待比对图片的图片平均亮度或已训练明暗检测模型，对待比对图片进行明暗检测，得到待比对图片的明暗检测结果；
112.当待比对图片的明暗检测结果均为非夜间拍摄时，得到相似度比对结果为待比对图片表征不同场景。
113.具体的，通过计算待比对图片的图片平均亮度，对待比对图片进行明暗检测，得到待比对图片的明暗检测结果的方式可以为：计算待比对当待比对图片的图片平均亮度，比对图片平均亮度和预设亮度阈值，当图片平均亮度大于预设亮度阈值时，可得到明暗检测结果为非夜间拍摄，当图片平均亮度小于预设亮度阈值时，可得到明暗检测结果为夜间拍摄，亮度阈值可按照需要自行设置，通常设置为80。若为通过已训练明暗检测模型对待比对图片进行明暗检测，只需要将待比对图片输入已训练明暗检测模型，即可得到明暗检测结果，此处对明暗检测模型不做限定，只要能够实现明暗检测均可。在得到待比对图片的明暗检测结果后，若待比对图片的明暗检测结果均为非夜间拍摄，服务器会得到相似度比对结果为待比对图片表征不同场景。
114.本实施例中，通过计算待比对图片的图片平均亮度或已训练明暗检测模型，对待比对图片进行明暗检测，得到待比对图片的明暗检测结果，当待比对图片的明暗检测结果均为非夜间拍摄时，得到相似度比对结果为待比对图片表征不同场景，能够实现对相似度比对结果的获取。
115.如图2所示，通过一个实施例来说明本技术的图片相似度比对方法，该图片相似度比对方法包括以下步骤：
116.步骤202，获取待比对图片；
117.步骤204，分别对待比对图片进行旋转校正检测，得到角度校正后的待比对图片；
118.步骤206，对角度校正后的待比对图片进行特征提取，得到与角度校正后的待比对图片对应的特征提取图；
119.步骤208，根据特征提取图对角度校正后的待比对图片进行目标检测，得到与待比对图片对应的目标标识位置信息，并对角度校正后的待比对图片进行文字特征提取，得到与待比对图片对应的目标标识文字特征信息；
120.步骤210，根据目标标识位置信息，对待比对图片进行裁剪，得到与待比对图片对应的目标标识图片；
121.步骤212，获取与目标标识图片对应的历史标识图片，根据历史标识图片得到训练数据；
122.步骤214，采用efficientnet_b0网络对训练数据进行分类训练，得到已训练的分类模型；
123.步骤216，将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型中的卷积层对目标标识图片进行卷积，得到卷积后的目标标识图片；
124.步骤218，通过已训练的分类模型中的归一化层对卷积后的目标标识图片进行归一化处理，得到归一化后的目标标识图片；
125.步骤220，通过已训练的分类模型中的移动翻转瓶颈卷积网络对归一化后的目标标识图片进行多次移动翻转瓶颈卷积，得到目标标识图片的特征向量；
126.步骤222，根据特征向量计算目标标识图片之间的特征距离；
127.步骤224，比对特征距离和预设第一距离阈值以及预设第二距离阈值，当特征距离小于预设第一距离阈值时，得到相似度比对结果为待比对图片表征同一场景，当特征距离大于预设第二距离阈值时，跳转至步骤226；
128.步骤226，比对目标标识文字特征信息，得到目标标识图片之间的文字关系，文字关系为包含关系或不包含关系；
129.步骤228，根据目标标识图片之间的文字关系，得到待比对图片之间的图片文字关系；
130.步骤230，当图片文字关系为不包含关系时，通过计算待比对图片的图片平均亮度或已训练明暗检测模型，对待比对图片进行明暗检测，得到待比对图片的明暗检测结果；
131.步骤232，当待比对图片的明暗检测结果均为非夜间拍摄时，得到相似度比对结果为待比对图片表征不同场景。
132.应该理解的是，虽然图1-2的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤
的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图1-2中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
133.在一个实施例中，如图3所示，提供了一种图片相似度比对装置，包括：获取模块302、处理模块304、裁剪模块306、特征提取模块308和比对模块310，其中：
134.获取模块302，用于获取待比对图片；
135.处理模块304，用于分别对待比对图片进行目标检测和文字特征提取，得到与待比对图片对应的目标标识文字特征信息和目标标识位置信息；
136.裁剪模块306，用于根据目标标识位置信息，对待比对图片进行裁剪，得到与待比对图片对应的目标标识图片；
137.特征提取模块308，用于将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型对目标标识图片进行特征提取，得到目标标识图片的特征向量；
138.比对模块310，用于根据特征向量和目标标识文字特征信息，得到待比对图片的相似度比对结果。
139.在一个实施例中，处理模块还用于分别对待比对图片进行旋转校正检测，得到角度校正后的待比对图片，对角度校正后的待比对图片进行特征提取，得到与角度校正后的待比对图片对应的特征提取图，根据特征提取图对角度校正后的待比对图片进行目标检测，得到与待比对图片对应的目标标识位置信息，并对角度校正后的待比对图片进行文字特征提取，得到与待比对图片对应的目标标识文字特征信息。
140.在一个实施例中，特征提取模块还用于将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型中的卷积层对目标标识图片进行卷积，得到卷积后的目标标识图片，通过已训练的分类模型中的归一化层对卷积后的目标标识图片进行归一化处理，得到归一化后的目标标识图片，通过已训练的分类模型中的移动翻转瓶颈卷积网络对归一化后的目标标识图片进行多次移动翻转瓶颈卷积，得到目标标识图片的特征向量。
141.在一个实施例中，图片相似度比对装置还包括训练模块，训练模块用于获取与目标标识图片对应的历史标识图片，根据历史标识图片得到训练数据，采用efficientnet_b0网络对训练数据进行分类训练，得到已训练的分类模型。
142.在一个实施例中，比对模块还用于根据特征向量计算目标标识图片之间的特征距离，当特征距离小于预设第一距离阈值时，得到相似度比对结果为待比对图片表征同一场景，当特征距离大于预设第二距离阈值时，根据目标标识文字特征信息，确定待比对图片之间的图片文字关系，根据图片文字关系，得到相似度比对结果。
143.在一个实施例中，比对模块还用于比对目标标识文字特征信息，得到目标标识图片之间的文字关系，文字关系为包含关系或不包含关系，根据目标标识图片之间的文字关系，得到待比对图片之间的图片文字关系，当图片文字关系为不包含关系时，分别对待比对图片进行明暗检测，根据明暗检测结果，得到相似度比对结果。
144.在一个实施例中，比对模块还用于当图片文字关系为不包含关系时，通过计算待比对图片的图片平均亮度或已训练明暗检测模型，对待比对图片进行明暗检测，得到待比对图片的明暗检测结果，当待比对图片的明暗检测结果均为非夜间拍摄时，得到相似度比
对结果为待比对图片表征不同场景。
145.关于图片相似度比对装置的具体限定可以参见上文中对于图片相似度比对方法的限定，在此不再赘述。上述图片相似度比对装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。
146.在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储历史标识图片数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图片相似度比对方法。
147.本领域技术人员可以理解，图4中示出的结构，仅仅是与本技术方案相关的部分结构的框图，并不构成对本技术方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
148.在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：
149.获取待比对图片；
150.分别对待比对图片进行目标检测和文字特征提取，得到与待比对图片对应的目标标识文字特征信息和目标标识位置信息；
151.根据目标标识位置信息，对待比对图片进行裁剪，得到与待比对图片对应的目标标识图片；
152.将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型对目标标识图片进行特征提取，得到目标标识图片的特征向量；
153.根据特征向量和目标标识文字特征信息，得到待比对图片的相似度比对结果。
154.在一个实施例中，处理器执行计算机程序时还实现以下步骤：分别对待比对图片进行旋转校正检测，得到角度校正后的待比对图片；对角度校正后的待比对图片进行特征提取，得到与角度校正后的待比对图片对应的特征提取图；根据特征提取图对角度校正后的待比对图片进行目标检测，得到与待比对图片对应的目标标识位置信息，并对角度校正后的待比对图片进行文字特征提取，得到与待比对图片对应的目标标识文字特征信息。
155.在一个实施例中，处理器执行计算机程序时还实现以下步骤：将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型中的卷积层对目标标识图片进行卷积，得到卷积后的目标标识图片；通过已训练的分类模型中的归一化层对卷积后的目标标识图片进行归一化处理，得到归一化后的目标标识图片；通过已训练的分类模型中的移动翻转瓶颈卷积网络对归一化后的目标标识图片进行多次移动翻转瓶颈卷积，得到目标标识图片的特征向量。
156.在一个实施例中，处理器执行计算机程序时还实现以下步骤：获取与目标标识图片对应的历史标识图片，根据历史标识图片得到训练数据；采用efficientnet_b0网络对训
练数据进行分类训练，得到已训练的分类模型。
157.在一个实施例中，处理器执行计算机程序时还实现以下步骤：根据特征向量计算目标标识图片之间的特征距离；当特征距离小于预设第一距离阈值时，得到相似度比对结果为待比对图片表征同一场景；当特征距离大于预设第二距离阈值时，根据目标标识文字特征信息，确定待比对图片之间的图片文字关系，根据图片文字关系，得到相似度比对结果。
158.在一个实施例中，处理器执行计算机程序时还实现以下步骤：比对目标标识文字特征信息，得到目标标识图片之间的文字关系，文字关系为包含关系或不包含关系；根据目标标识图片之间的文字关系，得到待比对图片之间的图片文字关系；当图片文字关系为不包含关系时，分别对待比对图片进行明暗检测，根据明暗检测结果，得到相似度比对结果。
159.在一个实施例中，处理器执行计算机程序时还实现以下步骤：当图片文字关系为不包含关系时，通过计算待比对图片的图片平均亮度或已训练明暗检测模型，对待比对图片进行明暗检测，得到待比对图片的明暗检测结果；当待比对图片的明暗检测结果均为非夜间拍摄时，得到相似度比对结果为待比对图片表征不同场景。
160.在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：
161.获取待比对图片；
162.分别对待比对图片进行目标检测和文字特征提取，得到与待比对图片对应的目标标识文字特征信息和目标标识位置信息；
163.根据目标标识位置信息，对待比对图片进行裁剪，得到与待比对图片对应的目标标识图片；
164.将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型对目标标识图片进行特征提取，得到目标标识图片的特征向量；
165.根据特征向量和目标标识文字特征信息，得到待比对图片的相似度比对结果。
166.在一个实施例中，计算机程序被处理器执行时还实现以下步骤：分别对待比对图片进行旋转校正检测，得到角度校正后的待比对图片；对角度校正后的待比对图片进行特征提取，得到与角度校正后的待比对图片对应的特征提取图；根据特征提取图对角度校正后的待比对图片进行目标检测，得到与待比对图片对应的目标标识位置信息，并对角度校正后的待比对图片进行文字特征提取，得到与待比对图片对应的目标标识文字特征信息。
167.在一个实施例中，计算机程序被处理器执行时还实现以下步骤：将目标标识图片分别输入已训练的分类模型，通过已训练的分类模型中的卷积层对目标标识图片进行卷积，得到卷积后的目标标识图片；通过已训练的分类模型中的归一化层对卷积后的目标标识图片进行归一化处理，得到归一化后的目标标识图片；通过已训练的分类模型中的移动翻转瓶颈卷积网络对归一化后的目标标识图片进行多次移动翻转瓶颈卷积，得到目标标识图片的特征向量。
168.在一个实施例中，计算机程序被处理器执行时还实现以下步骤：获取与目标标识图片对应的历史标识图片，根据历史标识图片得到训练数据；采用efficientnet_b0网络对训练数据进行分类训练，得到已训练的分类模型。
169.在一个实施例中，计算机程序被处理器执行时还实现以下步骤：根据特征向量计
算目标标识图片之间的特征距离；当特征距离小于预设第一距离阈值时，得到相似度比对结果为待比对图片表征同一场景；当特征距离大于预设第二距离阈值时，根据目标标识文字特征信息，确定待比对图片之间的图片文字关系，根据图片文字关系，得到相似度比对结果。
170.在一个实施例中，计算机程序被处理器执行时还实现以下步骤：比对目标标识文字特征信息，得到目标标识图片之间的文字关系，文字关系为包含关系或不包含关系；根据目标标识图片之间的文字关系，得到待比对图片之间的图片文字关系；当图片文字关系为不包含关系时，分别对待比对图片进行明暗检测，根据明暗检测结果，得到相似度比对结果。
171.在一个实施例中，计算机程序被处理器执行时还实现以下步骤：当图片文字关系为不包含关系时，通过计算待比对图片的图片平均亮度或已训练明暗检测模型，对待比对图片进行明暗检测，得到待比对图片的明暗检测结果；当待比对图片的明暗检测结果均为非夜间拍摄时，得到相似度比对结果为待比对图片表征不同场景。
172.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory，rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory，ram)或外部高速缓冲存储器。作为说明而非局限，ram可以是多种形式，比如静态随机存取存储器(static random access memory，sram)或动态随机存取存储器(dynamic random access memory，dram)等。
173.以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。
174.以上所述实施例仅表达了本技术的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本技术构思的前提下，还可以做出若干变形和改进，这些都属于本技术的保护范围。因此，本技术专利的保护范围应以所附权利要求为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

图片相似度比对方法、装置、计算机设备和存储介质与流程

相关文献

最热文献