一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

社交网络账号识别方法、装置及电子设备与流程

2022-02-24 13:52:31 来源:中国专利 TAG:

技术特征:
1.一种社交网络账号识别方法,其特征在于,包括:接收社交网络账号发布的多个信息、以及对应的类别和发布时间;根据所述的多个信息的发布时间的先后顺序,将所述多个信息的类别组合成类别序列;从所述类别序列中提取表征至少一种维度的变异特征,其中,所述变异特征表征所述社交网络账号所发布的信息的变异程度;根据所述至少一种维度的变异特征,确定所述社交网络账号的原创识别结果。2.根据权利要求1所述的方法,其特征在于,所述至少一个维度的变异特征包括类别波动特征;所述从所述类别序列中提取表征至少一种维度的变异特征,包括:对所述类别序列进行第一轮采样处理,得到多个第一子序列;根据每个所述第一子序列中末尾类别的出现次数,确定与所述出现次数负相关的第一波动特征;对所述类别序列进行第二轮采样处理,得到多个第二子序列;确定每个所述第二子序列对应的信息与相邻子序列对应的信息之间的类别相似度;确定与所述类别相似度负相关的第二波动特征;将每个所述第一子序列对应的第一波动特征进行融合处理,和/或,将每个所述第二子序列对应的第二波动特征进行融合处理,并将融合处理结果作为所述类别序列的类别波动特征;其中,所述相邻子序列是所述第二子序列之后首个被采集到的子序列。3.根据权利要求2所述的方法,其特征在于,所述对所述类别序列进行第一轮采样处理,得到多个第一子序列,包括:通过第一采样窗口对所述类别序列进行多次滑动采样,将每次滑动后所述第一采样窗口内的多个类别作为采样得到的第一子序列;其中,所述第一采样窗口的长度小于所述类别序列的长度,且所述第一轮采样窗口的滑动步长小于所述第一采样窗口的长度;所述对所述类别序列进行第二轮采样处理,得到多个第二子序列,包括:通过第二采样窗口对所述类别序列进行多次滑动采样,将每次滑动后所述第二采样窗口内的多个类别作为采样得到的第二子序列;其中,所述第二采样窗口的长度小于所述类别序列的长度,且所述第二轮采样窗口的滑动步长等于所述第二采样窗口的长度。4.根据权利要求2所述的方法,其特征在于,所述确定每个所述第二子序列对应的信息与相邻子序列对应的信息之间的类别相似度,包括:针对每个所述第二子序列执行以下处理:将所述第二子序列包括的每个类别对应的词向量组合,得到所述第二子序列的词向量,并将所述相邻子序列包括的每个类别对应的词向量组合,得到所述相邻子序列的词向量;将所述第二子序列的词向量与所述相邻子序列的词向量之间的余弦距离,确定为所述
第二子序列对应的信息与所述相邻子序列对应的信息之间的类别相似度。5.根据权利要求2所述的方法,其特征在于,所述确定每个所述第二子序列对应的信息与相邻子序列对应的信息之间的类别相似度,包括:针对每个所述第二子序列执行以下处理:生成所述第二子序列的词表,其中,所述第二子序列的词表包括所述第二子序列对应的多个信息中每个词语的出现次数,并生成所述相邻子序列的词表,其中,所述相邻子序列的词表包括所述相邻子序列对应的多个信息中每个词语的出现次数;将所述第二子序列的词表与所述相邻子序列的词表之间的相似度,确定为所述子序列对应的信息与相邻子序列对应的信息之间的类别相似度。6.根据权利要求1所述的方法,其特征在于,所述至少一个维度的变异特征包括类别差异特征;所述从所述类别序列中提取表征至少一种维度的变异特征,包括:对所述类别序列进行第三轮采样处理,得到多个第三子序列;确定每个所述第三子序列对应的信息与相邻子序列对应的信息之间的标签重合度;确定与所述标签重合度负相关的子序列差异特征;将每个所述第三子序列的子序列差异特征进行融合处理,将融合处理结果作为所述类别序列的类别差异特征;其中,所述相邻子序列是所述第三子序列之后首个被采集到的子序列。7.根据权利要求6所述的方法,其特征在于,所述确定每个所述第三子序列对应的信息与相邻子序列对应的信息之间的标签重合度,包括:针对每个所述第三子序列执行以下处理:生成所述第三子序列的标签集合,其中,所述第三子序列的标签集合包括所述第三子序列对应的每个信息所关联的标签,并生成所述相邻子序列的标签集合,其中,所述相邻子序列的标签集合包括所述相邻子序列对应的每个信息所关联的标签;确定所述第三子序列的标签集合与所述相邻子序列的标签集合之间的标签重合比例,将所述标签重合比例确定为所述第三子序列对应的信息与相邻子序列对应的信息之间的标签重合度。8.根据权利要求7所述的方法,其特征在于,所述确定所述第三子序列的标签集合与所述相邻子序列的标签集合之间的标签重合比例,包括:确定所述第三子序列的标签集合与所述相邻子序列的标签集合之间的标签交集、以及所述第三子序列的标签集合与所述相邻子序列的标签集合之间的标签并集;根据所述标签交集的标签数目与所述标签并集的标签数目的比值,确定所述第三子序列的标签集合与所述相邻子序列的标签集合之间的标签重合比例;其中,所述标签重合比例与所述标签交集的标签数目正相关、与所述标签并集的标签数目负相关。9.根据权利要求1所述的方法,其特征在于,所述至少一个维度的变异特征包括类别匹配特征;
所述从所述类别序列中提取表征至少一种维度的变异特征,包括:对所述类别序列中进行第四轮采样处理,得到多个第四子序列;确定每个所述第四子序列对应的信息与所述社交网络账号之间的标签匹配度,确定与所述标签匹配度负相关的标签匹配特征;将每个所述第四子序列的标签匹配特征进行融合处理,将融合处理结果作为所述类别序列的类别匹配特征。10.根据权利要求9所述的方法,其特征在于,所述确定每个所述第四子序列对应的信息与所述社交网络账号之间的标签匹配度,包括:针对每个所述第四子序列执行以下处理:生成所述第四子序列的标签集合,其中,所述第四子序列的标签集合包括:所述第四子序列对应的每个信息所关联的标签;生成所述社交网络账号的标签集合,其中,所述社交网络账号的标签集合包括:所述社交网络账号的介绍信息所关联的标签;确定所述第四子序列的标签集合与所述社交网络账号的标签集合之间的标签重合比例,将所述标签重合比例确定为所述第四子序列对应的信息与所述社交网络账号之间的标签匹配度。11.根据权利要求10所述的方法,其特征在于,所述确定所述第四子序列的标签集合与所述社交网络账号的标签集合之间的标签重合比例,包括:确定所述第四子序列的标签集合与所述社交网络账号的标签集合包括的相同标签的数目;根据所述数目确定所述第四子序列的标签集合与所述社交网络账号的集合之间的标签重合比例;其中,所述标签重合比例与所述数目正相关、且与所述社交网络账号的标签集合的标签的数目负相关。12.根据权利要求1所述的方法,其特征在于,所述根据所述至少一种维度的变异特征,确定所述社交网络账号的原创识别结果,包括:确定与任意一种维度的变异特征正相关的变异分数;或者对所述至少一种维度的变异特征进行融合处理,并确定与融合处理结果正相关的变异分数;执行以下操作至少之一:将与所述变异分数所处的分数区间关联的变异等级,确定为所述社交网络账号的变异等级;其中,不同的所述分数区间对应不同的所述变异等级,且所述变异等级与所述社交网络账号的原创程度负相关;当所述变异分数高于或等于变异分数阈值时,确定所述社交网络账号为变异账号,当所述变异分数低于所述变异分数阈值时,确定所述社交网络账号为原创账号。13.一种社交网络账号识别装置,其特征在于,包括:接收模块,用于接收社交网络账号发布的多个信息、以及对应的类别和发布时间;组合模块,用于根据所述的多个信息的发布时间的先后顺序,将所述多个信息的类别组合成类别序列;
提取模块,用于从所述类别序列中提取表征至少一种维度的变异特征,其中,所述变异特征表征所述社交网络账号所发布的信息的变异程度;确定模块,用于根据所述至少一种维度的变异特征,确定所述社交网络账号的原创识别结果。14.一种电子设备,其特征在于,包括:存储器,用于存储可执行指令;处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至12任一项所述的社交网络账号识别方法。15.一种计算机可读存储介质,其特征在于,存储有可执行指令,用于被处理器执行时,实现权利要求1至12任一项所述的社交网络账号识别方法。

技术总结
本申请提供了一种社交网络账号识别方法、装置、电子设备及计算机可读存储介质;方法包括:接收社交网络账号发布的多个信息、以及对应的类别和发布时间;根据所述的多个信息的发布时间的先后顺序,将所述多个信息的类别组合成类别序列;从所述类别序列中提取表征至少一种维度的变异特征,其中,所述变异特征表征所述社交网络账号所发布的信息的变异程度;根据所述至少一种维度的变异特征,确定所述社交网络账号的原创识别结果。通过本申请,能够准确识别出账号的原创属性。识别出账号的原创属性。识别出账号的原创属性。


技术研发人员:刘刚
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2020.08.20
技术公布日:2022/2/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献