一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

相似url的获取方法及其系统、相似用户的获取方法及其系统与流程

2022-02-20 05:10:25 来源:中国专利 TAG:

技术特征:
1.一种相似url的获取方法,其特征在于,包括:获取第一url;获取所述第一url分别在若干搜索词下的第一点击次数;获取在所述若干搜索词下被点击的第二url;获取所述第二url分别在所述若干搜索词下的第二点击次数;根据所述第一点击次数以及所述第二点击次数计算所述第一url与所述第二url的行为相似度;根据所述行为相似度判断所述第二url是否为所述第一url的相似url。2.根据权利要求1所述的相似url的获取方法,其特征在于,所述获取在所述若干搜索词下被点击的第二url的步骤之前还包括:计算所述第一url与所述第二url的共现次数;判断所述共现次数是否小于等于第一阈值,若是,则所述第二url不是所述第一url的相似url。3.根据权利要求1所述的相似url的获取方法,其特征在于,所述行为相似度的计算公式为:其中,sim(url1,url2)表示行为相似度;所述若干搜索词分别为query1、query2、query3、

query
n
,pv
11
表示在搜索query1时点击所述第一url的第一点击次数,pv
21
表示在搜索query2时点击所述第一url的第一点击次数,依次类推;pv
12
表示在搜索query1时点击所述第二url的第二点击次数,pv
22
表示在搜索query2时点击所述第二url的第二点击次数,依次类推;n为所述若干搜索词的总数。4.根据权利要求1所述的相似url的获取方法,其特征在于,所述根据所述行为相似度判断所述第二url是否为所述第一url的相似url的步骤包括:判断所述行为相似度是否大于第二阈值,若是,则所述第二url为所述第一url的相似url。5.根据权利要求1所述的相似url的获取方法,其特征在于,所述根据所述行为相似度判断所述第二url是否为所述第一url的相似url的步骤包括:获取所述第一url的网站的第一标题,以及获取所述第二url的网站的第二标题;计算所述第一标题与第二标题的语义相似度;将所述语义相似度融合所述行为相似度,获得综合相似度;判断所述综合相似度是否大于第三阈值,若是,则所述第二url为所述第一url的相似url。6.一种相似url的获取系统,其特征在于,包括:第一url获取模块,用于获取第一url;第一点击次数获取模块,用于获取所述第一url分别在若干搜索词下的第一点击次数;第二url获取模块,用于获取在所述若干搜索词下被点击的第二url;第二点击次数获取模块,用于获取所述第二url分别在所述若干搜索词下的第二点击
次数;行为相似度计算模块,用于根据所述第一点击次数以及所述第二点击次数计算所述第一url与所述第二url的行为相似度;网站标题获取模块,用于获取所述第一url的网站的第一标题,以及获取所述第二url的网站的第二标题;语义相似度计算模块,用于计算所述第一标题与第二标题的语义相似度;综合相似度计算模块,用于将所述语义相似度融合所述行为相似度,获得综合相似度;相似url判断模块,用于判断所述综合相似度是否大于第三阈值,若是,则所述第二url为所述第一url的相似url。7.一种相似用户的获取方法,其特征在于,包括:获取第一用户;获取所述第一用户分别点击若干网站的第一点击次数;获取点击若干所述网站的所有用户;获取所述所有用户分别点击若干所述网站的第二点击次数;根据所述第一点击次数以及所述第二点击次数进行相似度计算,从所述所有用户中判断出与所述第一用户相似度高的第二用户。8.根据权利要求7所述的相似用户的获取方法,其特征在于,还包括:获取所述第一用户的第一画像数据和第一行为数据;获取所述第二用户的第二画像数据和第二行为数据;将所述第一画像数据和第一行为数据表示成第一向量;将所述第二画像数据和第二行为数据表示成第二向量;根据第一向量以及第二向量计算所述第一用户以及第二用户的相似性分数;判断所述相似性分数是否大于第一阈值,若是,则所述第二用户为所述第一用户的相似用户。9.一种相似用户的获取系统,其特征在于,包括:第一用户获取模块,用于获取第一用户;第一点击次数获取模块,用于获取所述第一用户分别点击若干网站的第一点击次数;用户获取模块,用于获取点击若干所述网站的所有用户;第二点击次数获取模块,用于获取所述所有用户分别点击若干所述网站的第二点击次数;第二用户获取模块,用于根据所述第一点击次数以及所述第二点击次数进行相似度计算,从所述所有用户中判断出与所述第一用户相似度高的第二用户。10.根据权利要求9所述的相似用户的获取系统,其特征在于,还包括:第一数据获取模块,用于获取所述第一用户的第一画像数据和第一行为数据;第二数据获取模块,用于获取所述第二用户的第二画像数据和第二行为数据;第一向量表示模块,用于将所述第一画像数据和第一行为数据表示成第一向量;第二向量表示模块,用于将所述第二画像数据和第二行为数据表示成第二向量;相似用户获取模块,用于根据第一向量以及第二向量计算所述第一用户以及第二用户的相似性分数;判断所述相似性分数是否大于第一阈值,若是,则所述第二用户为所述第一
用户的相似用户。

技术总结
本发明适用于相似性计算技术领域,尤其涉及一种相似url的获取方法及其系统以及相似用户的获取方法及其系统,所述相似url的获取方法包括:获取第一url;获取所述第一url分别在若干搜索词下的第一点击次数;获取在所述若干搜索词下被点击的第二url;获取所述第二url分别在所述若干搜索词下的第二点击次数;根据所述第一点击次数以及所述第二点击次数计算所述第一url与所述第二url的行为相似度;根据所述行为相似度判断所述第二url是否为所述第一url的相似url。借此,本发明可以实现能够有效的进行相似性拓展,将广告等信息进行拓展推广。广。广。


技术研发人员:刘琳 郑旭 熊安斌
受保护的技术使用者:北京奇虎科技有限公司
技术研发日:2020.07.09
技术公布日:2022/1/10
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献