一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于大数据和电子商务的产品评论真实性检测方法与流程

2022-02-20 16:16:02 来源:中国专利 TAG:

技术特征:
1.一种基于大数据和电子商务的产品评论真实性检测方法,其特征在于,接收目标用户通过用户终端发布的目标产品评论;所述目标产品评论为目标用户在购买目标产品后对目标产品的评论;从数据库获取目标产品的关联轨迹数据,并提取关联轨迹数据的关联时空特征,然后将关联时空特征映射到时空特征空间得到关联时空特征矩阵;根据关联时空特征矩阵获取目标用户在关联周期内浏览过的所有产品,并将目标用户在关联周期内浏览过的作为关联产品,然后获取关联产品的地址标识符;所述地址标识符用于对产品购买地址进行唯一标识;将所述关联时空特征矩阵分解为浏览顺序矩阵、浏览时长矩阵和产品属性矩阵,并根据浏览顺序矩阵、浏览时长矩阵和产品属性矩阵生成若干个三元复合坐标;所述三元复合坐标包括第一坐标、第二坐标和第三坐标;根据地址标识符将关联产品与三元复合坐标进行映射以生成若干个二元组,并根据所有的二元组获取目标产品评论的第一异常判断值;所述二元组包括地址标识符和三元复合坐标;从数据库获取目标用户的历史购买数据,并提取历史购买数据的历史时空特征,然后将历史时空特征映射到时空特征空间得到历史时空特征矩阵;根据历史时空特征矩阵构建目标用户的产品分布图,并根据所述产品分布图获取目标产品评论的异常系数;从数据库获取目标产品的所有历史产品评论,并分别提取目标产品评论和历史产品评论的特征,然后分别将其映射到特征向量空间以得到目标评论向量和若干个历史评论向量;根据目标评论向量和历史评论向量构建目标产品的评论结构图,并根据所述评论结构图获取目标产品评论的第二异常判断值;根据异常系数、第一异常判断值和第二异常判断值计算目标产品评论的可信度,并在目标产品评论的可信度小于可信度阈值时将目标产品评论标记为异常产品评论。2.根据权利要求1所述的方法,其特征在于,所述目标产品的关联轨迹数据为目标用户在关联周期内在电商平台的浏览轨迹数据;所述关联周期为目标用户购买目标产品前的第一预设时间段;所述目标用户的历史购买数据为目标用户在历史周期内在电商平台购买的产品的相关数据;所述历史周期为目标用户在购买目标产品前的第二预设时间段。3.根据权利要求2所述的方法,其特征在于,所述用户终端为用户使用的具有通信功能和数据传输功能的设备,其包括:智能手表、智能手机、笔记本电脑、平板电脑和台式电脑。4.根据权利要求1至3之一所述的方法,其特征在于,根据浏览顺序矩阵、浏览时长矩阵和产品属性矩阵生成三元复合坐标包括:根据地址标识符将浏览顺序矩阵分解为若干个浏览顺序向量,并根据地址标识符将浏览时长矩阵分解为若干个浏览时长向量,然后根据地址标识符产品属性矩阵分解为若干个产品属性向量;将地址标识符相同的浏览顺序向量、浏览时长向量和产品属性向量作为一个三元向量组以得到若干个三元向量组;三元向量组包括浏览顺序向量、浏览时长向量和产品属性向量;
遍历所有三元向量组并将正在遍历的三元向量组作为目标三元向量组;将目标三元向量组中的浏览顺序向量映射到第一维特征空间以得到目标第一坐标,并将目标三元向量组中的浏览时长向量映射到第二维特征空间以得到目标第二坐标,然后将目标三元向量组中的产品属性向量映射到第三维特征空间以得到目标第三坐标;根据目标第一坐标、目标第二坐标和目标第三坐标生成相应目标三元向量组的复合三元坐标;重复以上步骤,直到遍历完所有的三元向量组以生成每个三元向量组的复合三元坐标。5.根据权利要求4所述的方法,其特征在于,根据所有的二元组获取目标产品评论的第一异常判断值包括:遍历所有的关联产品,并将正在遍历的关联产品作为目标关联产品,然后获取目标关联产品的三元复合坐标;将目标关联产品作为一个新的产品类型,并将该产品类型的属性坐标设置为目标关联产品的第三坐标,然后将该产品类型的时长坐标设置为目标关联产品的第二坐标;判断是否还存在没有遍历的关联产品;在存在没有遍历的关联产品时,继续遍历关联产品,并将正在遍历的关联产品作为目标关联产品,然后分别计算目标关联产品的第三坐标与各产品类型的属性坐标的距离将其作为属性距离;将数值最小的属性距离作为最小属性距离,并判断最小属性距离是否小于距离阈值;在最小属性距离小于距离阈值时,将目标关联产品加入最小属性距离对应的产品类型,并根据目标关联产品的第二坐标和第三坐标更新相应产品类型的属性坐标和时长坐标;在最小属性距离大于或等于距离阈值时,将目标关联产品作为一个新的产品类型,并将该产品类型的属性坐标设置为目标关联产品的第三坐标,将该产品类型的时长坐标设置为目标关联产品的第二坐标;重复以上步骤,直到不存在没有遍历的关联产品;在不存在没有遍历的关联产品时,根据每个产品类型的时长坐标计算每个产品类型的浏览值,并将数值最大的浏览值作为最大浏览值,然后将最大浏览值对应的产品类型作为目标产品类型。6.根据权利要求5所述的方法,其特征在于,根据所有的二元组获取目标产品评论的第一异常判断值包括:获取目标产品的属性特征,并将目标产品的属性特征映射到特征向量空间以得到目标产品的产品属性向量;将目标产品的产品属性向量映射到第三维特征空间以得到目标产品的产品属性坐标;获取目标产品类型的属性坐标,并将目标产品类型的属性坐标作为目标属性坐标;计算目标属性坐标与产品属性坐标间的距离以得到目标产品与目标产品类型的属性距离,并根据属性距离得到目标产品评论的第一异常判断值。7.根据权利要求1至6之一所述的方法,其特征在于,所述根据产品分布图获取目标产品评论的一场系数包括:根据历史购买数据获取历史时序特征,并根据历史时序特征将产品分布图分解为若干个产品分布子图;使用无监督学习算法将每个产品分布子图表示为一维向量以得到每个产品分布子图的图特征向量,并根据每个产品分布子图的图特征向量与标准特征向量的余弦相似度获取
每个产品分布子图的异常值,然后将异常值大于异常阈值的产品分布子图作为异常产品分布子图;利用图卷积网络将每个异常产品分布子图转换为对应的线图,并分别提取每个异常产品子分布图和其对应的线图的图特征以得到每个异常产品子分布图的第一图特征和第二图特征;将每个异常产品分布子图的第一图特征和第二图特征进行拼接得到每个异常产品分布子图的图结构特征,并将每个异常产品分布子图的图结构特征进行线性变换以得到每个异常产品分布子图的异常子系数,然后将所有异常产品分布子图的异常子系数进行加权求和得到目标产品评论的异常系数。8.根据权利要求7所述的方法,其特征在于,根据异常系数、第一异常判断值和第二异常判断值计算目标产品评论的可信度包括:其中,s为可信度,p为第一异常判断值,q为第二异常判断值,r为异常系数,e为自然底数,t为调节系数。

技术总结
本发明涉及一种基于大数据和电子商务的产品评论真实性检测方法,其包括:将关联时空特征矩阵分解为浏览顺序矩阵、浏览时长矩阵和产品属性矩阵,并根据浏览顺序矩阵、浏览时长矩阵和产品属性矩阵生成若干个三元复合坐标。根据地址标识符将关联产品与三元复合坐标进行映射生成若干个二元组,并根据所有二元组获取第一异常判断值。根据历史时空特征矩阵构建产品分布图,并根据产品分布图获取异常系数。根据目标评论向量和历史评论向量获取评论结构图,并根据评论结构图获取第二异常判断值。根据异常系数、第一异常判断值和第二异常判断值计算目标产品评论的可信度,并在可信度小于可信度阈值时将目标产品评论标记为异常产品评论。评论。评论。


技术研发人员:ꢀ(51)Int.Cl.G06Q30/00
受保护的技术使用者:郑璨
技术研发日:2021.11.02
技术公布日:2022/1/14
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献