一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于私域电商平台中用户图片的识别处理方法、系统和存储介质与流程

2022-06-29 22:15:49 来源:中国专利 TAG:


1.本技术属于计算机分析技术领域,更具体的,涉及一种基于私域电商平台中用户图片的识别处理方法、系统和存储介质。


背景技术:

2.随着互联网发展,电商给生活带来了巨大的改变。人们越来越依赖电商,开始通过社交渠道为电商产生作用。私域电商应势而出,结合了社交与电商的新模式。而社交与电商的结合打通成了这种模式下的一系列问题,例如随着数据量的递增、现有处理技术性能递减,到一定数量级,在互联网行业追求快速匹配的场景几乎不可用。


技术实现要素:

3.有鉴于此,本技术提供了一种基于私域电商平台中用户图片的识别处理方法、系统和存储介质,支持横向扩展,识别匹配速度随着扩展递增,明显提升数据识别处理效率。
4.本技术的具体技术方案如下:
5.本技术第一方面提供一种基于私域电商平台中用户图片的识别处理方法,包括如下步骤:
6.采集目标用户在平台a产生的所有图片资源,将搜集的图片资源进行分解预处理得到缩略图像;
7.计算缩略图像的哈希值生成批量哈希值数据,根据图片信息将批量哈希值数据转化为批量区间数值,并将批量哈希值数据和批量区间数值存入云数据库;
8.获取目标用户在平台b产生的待测图片资源,计算图像的待测哈希值数据并生成对应的待测区间数值;
9.利用待测区间数值在云数据库中搜索相关联的对比图片资源,通过比较待测图片资源和对比图片资源的哈希值判断目标用户的图片相似度。
10.优选的,将搜集的图片资源进行分解预处理具体为:
11.计算图片资源的rgb颜色分量值并判断是否超过阈值;
12.当rgb颜色分量值超过阈值则调整图片资源的数据大小,将图片资源的rgb颜色分量统一限制在阈值以内。
13.优选的,还包括:
14.获取目标用户在平台操作节点下产生的日志信息,筛选日志信息中带有图形标签的数据包,其中,操作节点包括上传、下载和转发;
15.根据数据包中的来源信息、进程信息和安全信息对数据资源进行清洗得到目标用户在平台内的图片资源。
16.优选的,计算缩略图像的哈希值生成批量哈希值数据具体为:
17.获取缩略图像中每个像素的rgb值,其中,取出次高位(16-23)红色分量的信息得
到r值,取出中位(8-15)绿色分量的信息得到g值,取出低位(0-7)蓝色分量的信息得到b值;
18.根据图像的rgb值计算图像的灰度值,将图像的rgb值和灰度值采用差值哈希算法生成图像的哈希值数据。
19.优选的,利用待测区间数值在云数据库中搜索相关联的对比图片资源具体为:
20.获取目标用户的静态信息,分析目标用户的偏好信息和应用信息,根据偏好信息和应用信息对不同区间数值设置不同权重比例;
21.检索区间数据在引入不同权重计算后相关度仍在区间范围内的对比图片资源。
22.优选的,根据图片信息将批量哈希值数据转化为批量区间数值具体为:
23.根据图片信息中的属性信息和功能信息对哈希值数据进行分区,将哈希值数据转化为位于0~32区间的数值;
24.根据预设分配方式将区间数值建立多个区间,并将区间分配到不同的系统节点中。
25.优选的,将批量哈希值数据和批量区间数值存入云数据库具体为:
26.将批量区间数值发送至db并对其引入索引标签;
27.将批量哈希值数据存储于redis中,并建立与批量区间数值的映射关系。
28.优选的,将批量哈希值数据和批量区间数值存入云数据库具体为:
29.采集批量区间数值的数字信息,对数字信息进行格式化处理生成密钥数据;
30.利用密钥数据对redis在进行批量哈希值数据和批量区间数值数据存储时加密。
31.优选的,通过比较待测图片资源和对比图片资源的哈希值判断目标用户的图片相似度具体为:
32.分别获取待测图片资源和对比图片资源的哈希值数据,分析哈希值数据中的数据要素和数据结构,并将数据要素和数据结构进行有序排列;
33.根据排列情况统计待测图片资源和对比图片资源的数据距离,以数据距离的阈值为依据判断目标用户的图片相似度。
34.本技术第二方面提供一种基于私域电商平台中用户图片的识别处理系统,包括存储器和处理器,所述存储器中包括基于私域电商平台中用户图片的识别处理程序,所述基于私域电商平台中用户图片的识别处理程序被所述处理器执行时,实现如下步骤:
35.采集目标用户在平台a产生的所有图片资源,将搜集的图片资源进行分解预处理得到缩略图像;
36.计算缩略图像的哈希值生成批量哈希值数据,根据图片信息将批量哈希值数据转化为批量区间数值,并将批量哈希值数据和批量区间数值存入云数据库;
37.获取目标用户在平台b产生的待测图片资源,计算图像的待测哈希值数据并生成对应的待测区间数值;
38.利用待测区间数值在云数据库中搜索相关联的对比图片资源,通过比较待测图片资源和对比图片资源的哈希值判断目标用户的图片相似度。
39.优选的,将搜集的图片资源进行分解预处理具体为:
40.计算图片资源的rgb颜色分量值并判断是否超过阈值;
41.当rgb颜色分量值超过阈值则调整图片资源的数据大小,将图片资源的rgb颜色分量统一限制在阈值以内。
42.优选的,还包括:
43.获取目标用户在平台操作节点下产生的日志信息,筛选日志信息中带有图形标签的数据包,其中,操作节点包括上传、下载和转发;
44.根据数据包中的来源信息、进程信息和安全信息对数据资源进行清洗得到目标用户在平台内的图片资源。
45.优选的,计算缩略图像的哈希值生成批量哈希值数据具体为:
46.获取缩略图像中每个像素的rgb值,其中,取出次高位(16-23)红色分量的信息得到r值,取出中位(8-15)绿色分量的信息得到g值,取出低位(0-7)蓝色分量的信息得到b值;
47.根据图像的rgb值计算图像的灰度值,将图像的rgb值和灰度值采用差值哈希算法生成图像的哈希值数据。
48.优选的,利用待测区间数值在云数据库中搜索相关联的对比图片资源具体为:
49.获取目标用户的静态信息,分析目标用户的偏好信息和应用信息,根据偏好信息和应用信息对不同区间数值设置不同权重比例;
50.检索区间数据在引入不同权重计算后相关度仍在区间范围内的对比图片资源。
51.优选的,根据图片信息将批量哈希值数据转化为批量区间数值具体为:
52.根据图片信息中的属性信息和功能信息对哈希值数据进行分区,将哈希值数据转化为位于0~32区间的数值;
53.根据预设分配方式将区间数值建立多个区间,并将区间分配到不同的系统节点中。
54.优选的,将批量哈希值数据和批量区间数值存入云数据库具体为:
55.将批量区间数值发送至db并对其引入索引标签;
56.将批量哈希值数据存储于redis中,并建立与批量区间数值的映射关系。
57.优选的,将批量哈希值数据和批量区间数值存入云数据库具体为:
58.采集批量区间数值的数字信息,对数字信息进行格式化处理生成密钥数据;
59.利用密钥数据对redis在进行批量哈希值数据和批量区间数值数据存储时加密。
60.优选的,通过比较待测图片资源和对比图片资源的哈希值判断目标用户的图片相似度具体为:
61.分别获取待测图片资源和对比图片资源的哈希值数据,分析哈希值数据中的数据要素和数据结构,并将数据要素和数据结构进行有序排列;
62.根据排列情况统计待测图片资源和对比图片资源的数据距离,以数据距离的阈值为依据判断目标用户的图片相似度。
63.本技术第三方面提供一种计算机可读存储介质,所述计算机可读存储介质中包括基于私域电商平台中用户图片的识别处理程序,所述基于私域电商平台中用户图片的识别处理程序被处理器执行时,实现所述基于私域电商平台中用户图片的识别处理方法的步骤。
64.综上所述,本技术提供了一种基于私域电商平台中用户图片的识别处理方法、系统和存储介质。通过将目标用户在平台产生的图片资源进行分解预处理得到缩略图像,计算缩略图像的哈希值生成待测哈希值数据,根据图片信息将待测哈希值数据转化为待测区间数值,利用待测区间数值在云数据库中搜索相关联的对比图片资源,通过比较待测图片
资源和对比图片资源的哈希值判断目标用户的图片相似度。本技术通过对开源的图像相识度算法进行各项指标的优化调整,有效提高准确率;同时比对的过程中加入优化步骤,对图片计算出的哈希值再次转化为区间值用于过滤提高图片检索性能,可以根据不同的区间值并行进行识别比对,十分明显的改善比对性能。
附图说明
65.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
66.图1为本技术一种基于私域电商平台中用户图片的识别处理方法的流程图;
67.图2为本技术一种基于私域电商平台中用户图片的识别处理系统的框图。
具体实施方式
68.为使得本技术的目的、特征、优点能够更加的明显和易懂,对本技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本技术一部分实施例,而非全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
69.请参照图1,图1为本技术一种基于私域电商平台中用户图片的识别处理方法的流程图。
70.本技术实施例第一方面提供一种基于私域电商平台中用户图片的识别处理方法,其特征在于,包括如下步骤:
71.s102:采集目标用户在平台a产生的所有图片资源,将搜集的图片资源进行分解预处理得到缩略图像;
72.s104:计算缩略图像的哈希值生成批量哈希值数据,根据图片信息将批量哈希值数据转化为批量区间数值,并将批量哈希值数据和批量区间数值存入云数据库;
73.s106:获取目标用户在平台b产生的待测图片资源,计算图像的待测哈希值数据并生成对应的待测区间数值;
74.s108:利用待测区间数值在云数据库中搜索相关联的对比图片资源,通过比较待测图片资源和对比图片资源的哈希值判断目标用户的图片相似度。
75.需要说明的是,假设平台a与平台b的用户数据隔离,平台的图片资源可以是目标用户在平台操作节点下生成的操作数据,将图片资源的区间数据作为索引搜索相应的图片资源,再调取该图片资源的哈希值作为值进行比对,可以增加识别匹配速度,明显提升数据识别处理效率。
76.根据本技术实施例,将搜集的图片资源进行分解预处理具体为:
77.计算图片资源的rgb颜色分量值并判断是否超过阈值;
78.当rgb颜色分量值超过阈值则调整图片资源的数据大小,将图片资源的rgb颜色分量统一限制在阈值以内。
79.需要说明的是,将图片资源调整为缩略图的形式方便后续的数据分析处理,其中
本技术实施例中可以是将图片资源缩小成一个8x9(高x宽)具有8位rgb颜色分量的图片。
80.根据本技术实施例,还包括:
81.获取目标用户在平台操作节点下产生的日志信息,筛选日志信息中带有图形标签的数据包,其中,操作节点包括上传、下载和转发;
82.根据数据包中的来源信息、进程信息和安全信息对数据资源进行清洗得到目标用户在平台内的图片资源。
83.需要说明的是,根据用户操作信息分析其行为偏好和潜在目的,可以抽取能够真实反映用户行为的图片资源,过滤系统广告等干扰信息。
84.根据本技术实施例,计算缩略图像的哈希值生成批量哈希值数据具体为:
85.获取缩略图像中每个像素的rgb值,其中,取出次高位(16-23)红色分量的信息得到r值,取出中位(8-15)绿色分量的信息得到g值,取出低位(0-7)蓝色分量的信息得到b值;
86.根据图像的rgb值计算图像的灰度值,将图像的rgb值和灰度值采用差值哈希算法生成图像的哈希值数据。
87.需要说明的是,本技术实施例中计算灰度值的公式为:(r*30 g*59 b*11)/100。本技术实施例中采用差值哈希算法计算哈希值数据,具有效率高、准确性高、应用范围广的优点。其中,差值哈希算法主要是采用差异值计算的原理,对矩阵的每一行中相邻的两个元素进行相减得出几个差异值,对差异值进行处理,例如若为正数或0,则记得为1;若为负数,记为0。接着结果结合在一起就得到一个哈希值。
88.根据本技术实施例,利用待测区间数值在云数据库中搜索相关联的对比图片资源具体为:
89.获取目标用户的静态信息,分析目标用户的偏好信息和应用信息,根据偏好信息和应用信息对不同区间数值设置不同权重比例;
90.检索区间数据在引入不同权重计算后相关度仍在区间范围内的对比图片资源。
91.需要说明的是,静态信息包括用户的注册信息、设置信息和订单信息。根据用户的特殊喜好信息对用户图像的区间数据进行不同场景下的权重计算,可以有针对性地筛选对比对象,排除背景值影响,使得分析结果更接近真实情况。
92.根据本技术实施例,根据图片信息将批量哈希值数据转化为批量区间数值具体为:
93.根据图片信息中的属性信息和功能信息对哈希值数据进行分区,将哈希值数据转化为位于0~32区间的数值;
94.根据预设分配方式将区间数值建立多个区间,并将区间分配到不同的系统节点中。
95.需要说明的是,根据图片的属性信息和功能信息对哈希值数据进行分区,将哈希值转化为区间数据,一方面可以便于从多方面多维度进行检索、分析和匹配,另一方面提升数据处理效率和可靠性。本技术实施例中的区间划分是一个节点只持有一个区间,在有n个节点的情况下,将划分键的取值区间均匀划分为n份,然后每个节点持有一块。如果发生数据分布不均匀的情况,可以通过调整区间分布达到均匀情况,这样数据迁移同样会减小。
96.根据本技术实施例,将批量哈希值数据和批量区间数值存入云数据库具体为:
97.将批量区间数值发送至db并对其引入索引标签;
98.将批量哈希值数据存储于redis中,并建立与批量区间数值的映射关系。
99.需要说明的是,批量区间数据反映的是目标用户相关的标签图像样本值,对其引入索引标签提高检索效率和准确性。通过建立批量哈希值与批量区间数值的映射关系,可快速反映检索结果。
100.根据本技术实施例,将批量哈希值数据和批量区间数值存入云数据库具体为:
101.采集批量区间数值的数字信息,对数字信息进行格式化处理生成密钥数据;
102.利用密钥数据对redis在进行批量哈希值数据和批量区间数值数据存储时加密。
103.需要说明的是,利用生成的批量区间数值作为redis存储的密码,可以有效保护用户的数据隐私,并且防止盗取用户数据进行过度营销。密钥数据的生成和功能实现可以是本领域常规的操作手段。
104.在本技术另一实施例中,通过比较待测图片资源和对比图片资源的哈希值判断目标用户的图片相似度具体为:
105.分别获取待测图片资源和对比图片资源的哈希值数据,分析哈希值数据中的数据要素和数据结构,并将数据要素和数据结构进行有序排列;
106.根据排列情况统计待测图片资源和对比图片资源的数据距离,以数据距离的阈值为依据判断目标用户的图片相似度。
107.需要说明的是,本技术实施例中通过判断汉明距离得出结论,其中,汉明距离在8以内得出结论为相同图片。汉明距离是一组二进制数据变成另一组数据所需的步骤数,这个数值可以衡量两张图片的差异,汉明距离越小,则代表相似度越高。本技术实施例中通过在一组随机数据中找到数据结构,通过确定要素之间的相似性,并通过计算它们与要素空间中其他要素之间的距离来工作。
108.请参照图2,图2为本技术一种基于私域电商平台中用户图片的识别处理系统系统的框图。
109.本技术实施例第二方面提供一种基于私域电商平台中用户图片的识别处理系统,包括存储器21和处理器22,所述存储器21中包括基于私域电商平台中用户图片的识别处理程序,所述基于私域电商平台中用户图片的识别处理程序被所述处理器22执行时,实现如下步骤:
110.采集目标用户在平台a产生的所有图片资源,将搜集的图片资源进行分解预处理得到缩略图像;
111.计算缩略图像的哈希值生成批量哈希值数据,根据图片信息将批量哈希值数据转化为批量区间数值,并将批量哈希值数据和批量区间数值存入云数据库;
112.获取目标用户在平台b产生的待测图片资源,计算图像的待测哈希值数据并生成对应的待测区间数值;
113.利用待测区间数值在云数据库中搜索相关联的对比图片资源,通过比较待测图片资源和对比图片资源的哈希值判断目标用户的图片相似度。
114.根据本技术实施例,将搜集的图片资源进行分解预处理具体为:
115.计算图片资源的rgb颜色分量值并判断是否超过阈值;
116.当rgb颜色分量值超过阈值则调整图片资源的数据大小,将图片资源的rgb颜色分量统一限制在阈值以内。
117.根据本技术实施例,还包括:
118.获取目标用户在平台操作节点下产生的日志信息,筛选日志信息中带有图形标签的数据包,其中,操作节点包括上传、下载和转发;
119.根据数据包中的来源信息、进程信息和安全信息对数据资源进行清洗得到目标用户在平台内的图片资源。
120.根据本技术实施例,计算缩略图像的哈希值生成批量哈希值数据具体为:
121.获取缩略图像中每个像素的rgb值,其中,取出次高位(16-23)红色分量的信息得到r值,取出中位(8-15)绿色分量的信息得到g值,取出低位(0-7)蓝色分量的信息得到b值;
122.根据图像的rgb值计算图像的灰度值,将图像的rgb值和灰度值采用差值哈希算法生成图像的哈希值数据。
123.根据本技术实施例,利用待测区间数值在云数据库中搜索相关联的对比图片资源具体为:
124.获取目标用户的静态信息,分析目标用户的偏好信息和应用信息,根据偏好信息和应用信息对不同区间数值设置不同权重比例;
125.检索区间数据在引入不同权重计算后相关度仍在区间范围内的对比图片资源。
126.根据本技术实施例,根据图片信息将批量哈希值数据转化为批量区间数值具体为:
127.根据图片信息中的属性信息和功能信息对哈希值数据进行分区,将哈希值数据转化为位于0~32区间的数值;
128.根据预设分配方式将区间数值建立多个区间,并将区间分配到不同的系统节点中。
129.根据本技术实施例,将批量哈希值数据和批量区间数值存入云数据库具体为:
130.将批量区间数值发送至db并对其引入索引标签;
131.将批量哈希值数据存储于redis中,并建立与批量区间数值的映射关系。
132.根据本技术实施例,将批量哈希值数据和批量区间数值存入云数据库具体为:
133.采集批量区间数值的数字信息,对数字信息进行格式化处理生成密钥数据;
134.利用密钥数据对redis在进行批量哈希值数据和批量区间数值数据存储时加密。
135.在本技术另一实施例中,通过比较待测图片资源和对比图片资源的哈希值判断目标用户的图片相似度具体为:
136.分别获取待测图片资源和对比图片资源的哈希值数据,分析哈希值数据中的数据要素和数据结构,并将数据要素和数据结构进行有序排列;
137.根据排列情况统计待测图片资源和对比图片资源的数据距离,以数据距离的阈值为依据判断目标用户的图片相似度。
138.本技术实施例第三方面提供一种计算机可读存储介质,所述计算机可读存储介质中包括基于私域电商平台中用户图片的识别处理程序,所述基于私域电商平台中用户图片的识别处理程序被处理器执行时,实现所述基于私域电商平台中用户图片的识别处理方法的步骤,具体参见图1对方法步骤的描述,在此不再赘述。
139.在本技术所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为
一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
140.上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
141.另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
142.本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
143.或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
144.以上所述,以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献