一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

关键词提取方法、装置及电子设备与流程

2021-11-03 12:52:00 来源:中国专利 TAG:

技术特征:
1.一种短视频的关键词提取方法,其特征在于,包括:对搜索请求字符串进行策略筛选来获得表征用户搜索意图的搜索文本;将所述搜索文本与对应短视频进行连接来获得所述对应短视频的关键词集合;从所述关键词集合确定所述对应短视频的最终关键词。2.如权利要求1所述的关键词提取方法,其特征在于,所述对搜索请求字符串进行策略筛选来获得表征用户搜索意图的搜索文本的步骤包括:通过利用预设时间区间内的搜索日志数据来获得所述搜索请求字符串;通过对所述搜索请求字符串进行初筛来获得能够表征用户搜索意图的普通搜索文本和过滤文本字符;对所述过滤文本字符进行再次筛选,并对再次筛选获得的文本字符进行标准化来获得话题文本;通过合并所述普通搜索文本和所述话题文本来获得所述搜索文本。3.如权利要求1所述的关键词提取方法,其特征在于,所述将所述搜索文本与对应短视频进行连接来获得所述对应短视频的关键词集合的步骤包括:从所述搜索文本确定文本搜索量大于或等于第一阈值的搜索文本;通过利用短视频累计消费数据确定与所述文本搜索量大于或等于第一阈值的搜索文本关联的短视频;将所述文本搜索量大于或等于第一阈值的搜索文本与所述短视频中的展现量大于或等于第二阈值的短视频进行连接来获得所述对应短视频的关键词集合。4.如权利要求3所述的关键词提取方法,其特征在于,在从所述搜索文本确定文本搜索量大于或等于第一阈值的搜索文本之前,所述方法还包括:去除所述搜索日志数据中的无效数据,在通过利用短视频累计消费数据确定与所述文本搜索量大于或等于第一阈值的搜索文本关联的短视频之前,所述方法还包括:去除所述短视频累计消费数据中的无效数据。5.如权利要求1所述的关键词提取方法,其特征在于,所述从所述关键词集合确定所述对应短视频的最终关键词的步骤包括:确定所述关键词集合中的与所述对应短视频的作者名不相似的关键词;利用确定的与所述对应短视频的作者名不相似的关键词来形成所述对应短视频的关键词候选集合;从所述关键词候选集合中确定所述对应短视频的最终关键词。6.如权利要求5所述的关键词提取方法,其特征在于,所述确定所述关键词集合中的与所述对应短视频的作者名不相似的关键词的步骤包括:计算所述对应短视频的作者名的词向量与所述关键词集合中的每一个关键词的词向量之间的余弦距离;将所述关键词集合中的所述余弦距离小于或等于第三阈值的关键词确定为与所述对应短视频的作者名不相似的关键词。7.一种短视频的关键词提取装置,其特征在于,包括:策略筛选模块,被配置为对搜索请求字符串进行策略筛选来获得表征用户搜索意图的搜索文本;
关联模块,被配置为将所述搜索文本与对应短视频进行连接来获得所述对应短视频的关键词集合;关键词确定模块,被配置为从所述关键词集合确定所述对应短视频的最终关键词。8.一种电子设备,其特征在于,包括:处理器;用于存储所述处理器可执行指令的存储器,其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的关键词提取方法。9.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得装置能够执行如权利要求1到6中任一项所述的关键词提取方法。10.一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1至6中任一项所述的关键词提取方法。

技术总结
本公开关于一种关键词提取方法、装置及电子设备,其中,所述关键词提取方法包括:对搜索请求字符串进行策略筛选来获得表征用户搜索意图的搜索文本;将所述搜索文本与对应短视频进行连接来获得所述对应短视频的关键词集合;从所述关键词集合确定所述对应短视频的最终关键词。关键词。关键词。


技术研发人员:陈天然 孟攀飞 马倩雯 陈凯
受保护的技术使用者:北京达佳互联信息技术有限公司
技术研发日:2021.08.10
技术公布日:2021/11/2
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献