一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

电商独立站点匹配方法及其装置、设备、介质、产品与流程

2022-03-23 03:26:36 来源:中国专利 TAG:

技术特征:
1.一种电商独立站点匹配方法,其特征在于,包括如下步骤:获取提供电商服务的至少两个独立站点各自相对应的商品标题列表;计算每个所述的商品标题列表中每个商品标题相对应的哈希指纹,所述哈希指纹为根据商品标题的分词的哈希值匹配相应的分词类型权重后转换而得的等位长二进制编码;计算每两个独立站点之间两两商品标题的哈希指纹之间的数据距离,确定两个独立站点之间的相似商品标题总数;判断每两个独立站点之间的所述相似商品标题总数是否超过预设阈值,当超过预设阈值时判定该两个独立站点为相似站点。2.根据权利要求1所述的电商独立站点匹配方法,其特征在于,获取提供电商服务的至少两个独立站点各自相对应的商品标题列表,包括如下步骤:根据电商平台的站点注册库,获取站点注册库中的注册商户相对应的独立站点;访问各个所述的独立站点的商品数据库,获取各个独立站点的商品数据库中的商品对象的商品标题;将各个独立站点的商品标题构造为该独立站点相对应的商品标题列表。3.根据权利要求1所述的电商独立站点匹配方法,其特征在于,计算每个所述的商品标题列表中每个商品标题相对应的哈希指纹中的步骤中,针对每个所述的商品标题,执行如下步骤:对所述商品标题进行分词,根据各个分词命中的不同类型的分词库确定其分词类型;计算所述各个分词的哈希值,所述哈希值表示为二进制格式;根据相应的分词类型为分词的哈希值按进位匹配权重,其中该进位为1时以该权重的正数形式作为结果值,为0时以该权重的负数形式作为结果值,获得结果值序列构成哈希向量;将所有分词的哈希向量进行向量加和,获得加和结果向量;将加和结果向量映射到二值空间,其中,将数值大于0的元素归一化为1,余者均归一化为0,从而获得所述商品标题相对应的哈希指纹。4.根据权利要求1所述的电商独立站点匹配方法,其特征在于,计算每两个独立站点之间两两商品标题的哈希指纹之间的数据距离,确定两个独立站点之间的相似商品标题总数的步骤中,针对每两个独立站点,执行如下步骤:采用预设相似度计算公式,计算两个独立站点中两两商品标题的哈希指纹之间的数据距离,归一化为相似度数值;将两个独立站点之间两相似度数值构造为相似矩阵,其中每个元素存储其行坐标所表示的一个独立站点的一个商品标题的哈希指纹与其列坐标所表示的另一独立站点的一个商品标题之间的相似度数值;从所述相似矩阵中确定出两个独立站点之间相似度数值超过预设门限的相似商品标题总数。5.根据权利要求4所述的电商独立站点匹配方法,其特征在于,所述相似度计算公式应用如下任意一种算法:欧氏距离算法、余弦相似度算法、汉明距离算法、杰卡德算法、皮尔逊相关系数算法。6.根据权利要求1至5中任意一项所述的电商独立站点匹配方法,其特征在于,判断每
两个独立站点之间的所述相似商品标题总数是否超过预设阈值,当超过预设阈值时判定该两个独立站点为相似站点的步骤之后,包括如下步骤:响应用户访问构成相似站点的任意一个独立站点的访问事件,向该用户推送与被访问的独立站点构成相似站点的其他独立站点。7.一种电商独立站点匹配装置,其特征在于,包括:列表获取模块,用于获取提供电商服务的至少两个独立站点各自相对应的商品标题列表;指纹生成模块,用于计算每个所述的商品标题列表中每个商品标题相对应的哈希指纹,所述哈希指纹为根据商品标题的分词的哈希值匹配相应的分词类型权重后转换而得的等位长二进制编码;相似统计模块,用于计算每两个独立站点之间两两商品标题的哈希指纹之间的数据距离,确定两个独立站点之间的相似商品标题总数;站群判定模块,用于判断每两个独立站点之间的所述相似商品标题总数是否超过预设阈值,当超过预设阈值时判定该两个独立站点为相似站点。8.一种计算机设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至6中任意一项所述的方法的步骤。9.一种计算机可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至6中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。10.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至6任意一项中所述方法的步骤。

技术总结
本申请公开一种电商独立站点匹配方法及其装置、设备、介质、产品,所述方法包括:获取提供电商服务的至少两个独立站点各自相对应的商品标题列表;计算每个所述的商品标题列表中每个商品标题相对应的哈希指纹,所述哈希指纹为根据商品标题的分词的哈希值匹配相应的分词类型权重后转换而得的等位长二进制编码;计算每两个独立站点之间两两商品标题的哈希指纹之间的数据距离,确定两个独立站点之间的相似商品标题总数;判断每两个独立站点之间的所述相似商品标题总数是否超过预设阈值,当超过预设阈值时判定该两个独立站点为相似站点。本申请适于以商品标题相对应的哈希指纹为依据而判定电商平台中不同独立站点之间的相似关系,运算量少,运算效率高。运算效率高。运算效率高。


技术研发人员:郑彦
受保护的技术使用者:广州华多网络科技有限公司
技术研发日:2021.12.16
技术公布日:2022/3/22
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献