一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

IPTV家庭用户年龄及性别分布预测系统和方法与流程

2022-08-17 00:35:16 来源:中国专利 TAG:

技术特征:
1.一种iptv家庭用户年龄及性别分布预测系统,包括:话单数据处理模块,用于基于原始话单形成用户行为数据结构;节目单数据处理模块,用于将节目单数据与所述用户行为数据结构进行匹配,得到用户收视记录;媒资数据处理模块,用于收集全网影片信息形成媒资标签;以及用户年龄及性别分布预测模块,用于计算用户的观影程度,并基于所述用户收视记录和所述媒资标签用户贴上性别-年龄段标签。2.如权利要求1所述的系统,其特征在于:所述话单数据处理模块用于将探针采集到的原始用户播放行为数据进行清洗、转换、拆分、合并,并映射而形成所述用户行为数据结构。3.如权利要求1所述的系统,其特征在于:所述节目单数据处理模块进一步用于将节目名称以及频道名称标准化。4.如权利要求1所述的系统,其特征在于:所述媒资数据处理模块收集的影片信息包括片名、主演、类别、年份、评分、简介、已有观影记录信息样本。5.如权利要求4所述的系统,其特征在于:所述观影记录信息样本包括男女观影比率以及各年龄段观影比率。6.如权利要求1所述的系统,其特征在于,所述观影程度用于表达用户对于影片的喜好程度,通过以下公式进行计算:观影程度=观影时长/影片时长。7.如权利要求1所述的系统,其特征在于,所述用户年龄及性别分布预测模块采用高斯混合模型gmm与最大期望em算法对用户的性别特征向量和年龄段特征向量进行聚类分析以及求解,其中性别特征向量通过以下公式进行计算:性别特征向量=观察程度
×
性别指向数值;年龄段特征向量通过以下公式进行计算:年龄段特征向量=观察程度
×
年龄段指向数值。8.一种iptv家庭用户年龄及性别分布预测方法,包括以下步骤:采集用户播放行为数据;对所采集的用户播放行为数据进行处理,生成用户行为数据结构;对节目单的数据进行处理,将节目名称和频道名称进行标准化;将标准化后的得到的节目单数据与所生成的用户行为数据结构进行匹配,得到用户收视记录;基于所述用户收视记录计算用户的观影程度,其中观影程度=观影时长/影片时长;收集全网影片信息以及样本信息形成媒资标签;以及为用户贴上性别-年龄段标签。9.如权利要求8所述的方法,其特征在于,对所采集的用户播放行为数据进行处理包括清洗、转换、拆分、合并操作,包括清洗掉用户id为空、频道名为空的数据,以及对非直播数据等进行校验。
10.如权利要求8所述的方法,其特征在于,为用户贴上性别-年龄段标签包括采用高斯混合模型gmm与最大期望em算法对用户的性别特征向量和年龄段特征向量进行聚类分析以及求解,其中性别特征向量和年龄段特征向量分别通过以下公式进行计算:性别特征向量=观影程度
×
性别指向数值;以及年龄段特征向量=观察程度
×
年龄段指向数值。

技术总结
本发明公开了一种IPTV家庭用户年龄及性别分布预测系统和方法。根据本发明,话单数据处理模块对原始话单数据进行处理形成用户行为数据结构;节目单数据处理模块将节目单数据与用户行为数据结构进行匹配,得到用户收视记录;媒资数据处理模块收集全网影片信息形成媒资标签;用户年龄及性别分布预测模块计算用户的观影程度,并基于用户收视记录和媒资标签用户贴上性别-年龄段标签。本发明的IPTV家庭用户年龄及性别分布预测方案将全网媒资信息和用户观看IPTV的行为数据以及节目单数据相融合,对家庭成员的年龄及性别分布预测分析准确率高,更加合理地反映了家庭中各用户观影的兴趣偏好。趣偏好。趣偏好。


技术研发人员:王璐
受保护的技术使用者:天翼数字生活科技有限公司
技术研发日:2021.12.07
技术公布日:2022/8/15
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献