一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于神经网络的电商评论投票的社交系统的制作方法

2022-07-10 12:42:19 来源:中国专利 TAG:


1.本发明涉及商品推荐技术领域,尤其涉及基于神经网络的电商评论投票的社交系统。


背景技术:

2.随着科技的不断发展,社会信息化进程的加快,电子商务交易平台的不断完善,越来越多的人们通过网上购物的方式来获取自己所需的商品,商品的种类可以涉及到人们日常生活的方方面面,为人们生活提供了极大的便利,由于现在各个电商平台上的商品种类繁多,用户在购物时,往往需要花费大量的时间进行挑选才能找到自己需要的商品,因此各个商家为了保证用户体验,均提供了针对用户的个性化推送服务。
3.现有常用的分为被动推荐和主动推荐两种系统。主动推荐是根据使用者的消费、浏览、评分等历史纪录数据进行推荐工作,通过算法预测用户的兴趣点,进行对应的推荐。被动推荐则需要具备相应的知识内容进行产品的过滤,同时强烈依赖用户的评分信息。
4.目前常用的技术是内容过滤算法以及协同过滤算法。前者通过使用者的多次浏览以及注重浏览情况,对客户进行筛选与分类,优势是专注于对用户关注产品的内容和描述,能够快速筛选用户所需。后者是根据用户行为所产生的数据进行计算。其需要一个关于用户和产品的海量数据集,用于判别模式及推荐的运算。协同过滤能够有效除去数据系数以及预测精度较低等问题,是现有的无论是理论或是具体实施上都是最有效推荐系统。
5.同时电商评论投票问答和分享推荐算法,主要基于机器学习、规则和深度神经网络的方法,随着大数据技术的发展以及语言的形式越来越多元化,深度神经网络技术成为了自然语言处理领域的主流技术,在情感分析领域也取得了很大的突破,通过向量进行特征融合构成多元特征词向量,可以有效捕捉用户的情感特征,更适合推荐任务。
6.但是现有的推荐系统缺陷明显,其实现是掌握了海量的用户信息,如用户的性别、年龄、收入水平、地理位置以及生活方式等,再加上对用户搜索、浏览行为的记录从而达到推荐目的。同时在训练过程中参数数量较少,计算过程较简单,在面对样本空间巨大的自然语言领域,其表达能力相对于复杂的目标函数会有不足,而在巨大样本空间内相对稀疏的语言样本,又对机器学习模型的拟合能力有着更高的要求,无法从少量的样本集合集中自动抓取到数据的本质特征,在海量互联网数据被应用之前,如此表示存在着严重的数据稀疏问题。
7.因此不管是主动推荐亦或是被动推荐因其不考虑前后联系,也就丢失了单词之间的顺序信息,所以具有对文本的语义信息表达不到位的情况,上述缺陷使得现有系统不能帮助没有科技知识的用户选择高科技产品,而且新产品由于缺少评分信息,推荐系统不能有效的对其进行推荐。


技术实现要素:

8.1.要解决的技术问题
9.本发明的目的是为了解决现有技术中现有系统不能帮助没有科技知识的用户选择高科技产品,而且新产品由于缺少评分信息,推荐系统不能有效对其进行推荐的问题,而提出的基于神经网络的电商评论投票的社交系统。
10.2.技术方案
11.为了实现上述目的,本发明采用了如下技术方案:
12.基于神经网络的电商评论投票的社交系统,包括数据采集系统、数据处理系统和数据应用系统,所述数据采集系统的输出端与数据处理系统的输入端连接,所述数据处理型的输出端与数据应用系统的输入端连接;
13.所述数据采集系统包括原始数据的采集和用户数据的采集;
14.所述数据处理系统包括自组织神经网络模型和多元特征词向量结构模型,所述自组织神经网络模型的输出端与多元特征词向量结构模型的输入端通过联络矩阵链接;
15.所述数据应用系统包括对处理已有产品数据、预测新产品得分、用户购物需求的抓取和用户购物需求的推荐;
16.所述原始数据输出端与自组织神经网络模型的输入端连接,所述用户数据的的输出端与多元特征词向量结构模型的输入端连接。
17.优选地,所述原始数据包括用户对己购产品的评论投票数据和用户对己购产品服务意向数据。
18.优选地,所述用户数据包括用户性别、用户的年龄、收入水平、地理位置、生活方式和用户搜索浏览记录。
19.优选地,所述原始数据输出端与自组织神经网络模型的输入端连接通过定量接口链接。
20.优选地,所述自组织神经网络模型的处理过程包括以下步骤:
21.步骤1:利用som模型监督式学习,根据评分值对产品进行分类;
22.步骤2:训练som模型对已有的产品数据进行评分;
23.步骤3:然后预测新产品数据评分。
24.优选地,所述多元特征词向量结构模型的处理过程为通过实现注意力机制给编码层输出编码分配权重,来获取有效的局部信息和减少噪音数据的影响。
25.优选地,所述步骤1中将动态维护l个产品的属性数量的拓扑结构,
26.||c
il-wv
bmu
||=mink{||c
il-w
vk
||}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1.1)
27.wv(t 1)=wv(t) θ(t)α(t)(c
il
(t)-wv(t))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1.2)
28.上式中c
il
表示实例i的标准l的目标输入向量,wv表示当前权重向量,bmu为与输入向量c
il
具有最近欧几里德距离的神经元,θ(t)是受限于bmu距离的领域函数,α(t)是时间限制因子,t为当前时问游标。
29.优选地,所述步骤2中训练som模型对已有的产品数据进行评分,作为监督式学习的起始点,先规格化数据,随机产生拓扑节点的权重向量脚wv;获取属于“已有的产品数据”的输入向量c
il
并且遍历拓扑中的每一个节点,计算节点与权重向量附的欧式距离;计算有最短欧式距离的bmu,bmu的计算如公式(1.1)所示,如果对于c
il
的评分rc等于对于bmu的评分rb,用公式(1.2)收紧bmu周边的临近节点;如果不相等,找下一个bmu直到rc等于rb。
30.优选地,所述步骤3中在cnn中控制计算的公式如下:
31.h
t
=σ(ux
t
wh
t-1
)
ꢀꢀ
(1.3)
32.公式(1.3)中h0常使用0向量来做为初始化以方便计算,是在时间t后的输出,是一个关于所有用户特征的概率矢量,计算可得:
33.t=softmax(vh
t
)
ꢀꢀ
(1.4)
34.其中公示(1.1)、(1.2)、(1.3)和(1.4)中将rc作为c
il
的评分值。
35.所述注意力机制中的权重计算公式:
[0036][0037]
其中a
t
是需要计算的分配权重,向量m
t
是需要分配权重的向量,f(m
t
,n)是两者之间相互影响的函数,l表示m
t
中需要分配的权重的向量个数,最后对a
t
进一步进行归一处理,使得权重之和为1,可得:
[0038][0039]vt
表示计算权重向量,wa和ua分别表示计算过程中的权重和偏执矩阵;
[0040]
同时以双向的多元特征词向量结构的模型,设此时输出向量矩阵为:a={a1,a2,a3,...,an}通过联立公示可以得到:
[0041]
m=tanh(a)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2.3)
[0042]
a=softmax(w
t
m)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2.4)
[0043]
由(2.3)(2.4)得到:
[0044]
γ=aanꢀꢀ
(2.5)
[0045]
上述式中:tanh函数可以将a的值大小转换到[-1,1]之间,dw是原始输入字的向量维度,w是训练过程中的参数向量,w
t
是转置向量,α的大小为n,由此可得:
[0046]h*
=tanh(γ)
ꢀꢀ
(2.6)
[0047]
将通过权重分配的向量γ输入tanh函数中得到最终的向量输出。
[0048]
3.有益效果
[0049]
相比于现有技术,本发明的优点在于:
[0050]
(1)本发明中,可广泛应用于电子商务、深度挖掘以及社交网络平台等领域,通过对用户历史的评论投票问答的倾向,能够获取用户对己购产品服务的意向及满意情况,从而实现企业通过用户对商品评论以及分享推荐情况了解到产品的优劣,从而改善产品质量和服务,及时调整销售策略,保证销售质量。
[0051]
(2)本发明中,通过社交系统深度学习的非线性网络结构,主动捕捉用户的潜在特征,将量数据映射到统一维度,实现自动获取用户行为与其兴趣喜好潜在在联系,并借此预测未上线产品的用户潜在评分以及可能推荐情况,从而能够及时调整产品质量服务,实现对于用户消费心理的把握。
附图说明
[0052]
图1为本发明提出的基于神经网络的电商评论投票的社交系统的整体框架设计图。
具体实施方式
[0053]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
[0054]
实施例1:
[0055]
参照图1,基于神经网络的电商评论投票的社交系统,包括数据采集系统、数据处理系统和数据应用系统,数据采集系统的输出端与数据处理系统的输入端连接,数据处理型的输出端与数据应用系统的输入端连接;
[0056]
数据采集系统包括原始数据的采集和用户数据的采集;
[0057]
数据处理系统包括自组织神经网络模型和多元特征词向量结构模型,自组织神经网络模型的输出端与多元特征词向量结构模型的输入端通过联络矩阵链接;
[0058]
数据应用系统包括对处理已有产品数据、预测新产品得分、用户购物需求的抓取和用户购物需求的推荐;
[0059]
原始数据输出端与自组织神经网络模型的输入端连接,用户数据的的输出端与多元特征词向量结构模型的输入端连接。
[0060]
本发明中,原始数据包括用户对己购产品的评论投票数据和用户对己购产品服务意向数据。
[0061]
本发明中,用户数据包括用户性别、用户的年龄、收入水平、地理位置、生活方式和用户搜索浏览记录。
[0062]
本发明中,原始数据输出端与自组织神经网络模型的输入端连接通过定量接口链接。
[0063]
实施例2:
[0064]
其具有上述实施例的实施内容,其中,对于上述实施例的具体实施方式可参阅上述描述,此处的实施例不作重复详述;而在本技术实施例中,其与上述实施例的区别在于:
[0065]
自组织神经网络模型的处理过程包括以下步骤:
[0066]
步骤1:利用som模型监督式学习,根据评分值对产品进行分类;
[0067]
步骤2:训练som模型对已有的产品数据进行评分;
[0068]
步骤3:然后预测新产品数据评分。
[0069]
本发明中,多元特征词向量结构模型的处理过程为通过实现注意力机制给编码层输出编码分配权重,来获取有效的局部信息和减少噪音数据的影响。
[0070]
实施例3:
[0071]
其具有上述实施例的实施内容,其中,对于上述实施例的具体实施方式可参阅上述描述,此处的实施例不作重复详述;而在本技术实施例中,其与上述实施例的区别在于:
[0072]
步骤1中将动态维护l个产品的属性数量的拓扑结构,
[0073]
||c
il-wv
bmu
||=mink{||c
il-wvk||}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1.1)
[0074]
wv(t 1)=wv(t) θ(t)α(t)(c
il
(t)-wv(t))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1.2)
[0075]
上式中c
il
表示实例i的标准l的目标输入向量,wv表示当前权重向量,bmu为与输入向量c
il
具有最近欧几里德距离的神经元,θ(t)是受限于bmu距离的领域函数,α(t)是时间限制因子,t为当前时问游标。
[0076]
实施例4:
[0077]
其具有上述实施例的实施内容,其中,对于上述实施例的具体实施方式可参阅上述描述,此处的实施例不作重复详述;而在本技术实施例中,其与上述实施例的区别在于:
[0078]
步骤2中训练som模型对已有的产品数据进行评分,作为监督式学习的起始点,先规格化数据,随机产生拓扑节点的权重向量脚wv;获取属于“已有的产品数据”的输入向量c
il
并且遍历拓扑中的每一个节点,计算节点与权重向量附的欧式距离;计算有最短欧式距离的bmu,bmu的计算如公式(1.1)所示,如果对于c
il
的评分rc等于对于bmu的评分rb,用公式(1.2)收紧bmu周边的临近节点;如果不相等,找下一个bmu直到rc等于rb。
[0079]
实施例5:
[0080]
其具有上述实施例的实施内容,其中,对于上述实施例的具体实施方式可参阅上述描述,此处的实施例不作重复详述;而在本技术实施例中,其与上述实施例的区别在于:
[0081]
神经网络在机器翻译任务中表现出极大的潜力。与传统的rnn不同的是,cnn能够处理可变长度的序列输入,它具有一个反复的隐藏状态,其每次的激活依赖于前一个时间。如果输入序列是一个四个字的句子,那么网络将被展开成一个4层的神经网络,每个单词都有一个层。
[0082]
步骤3中采用cnn预测新产品数据评分,其中cnn控制计算的公式如下:
[0083]ht
=σ(ux
t
wh
t-1
)
ꢀꢀ
(1.3)
[0084]
公式(1.3)中h0常使用0向量来做为初始化以方便计算,是在时间t后的输出,是一个关于所有用户特征的概率矢量,计算可得:
[0085]
t=soft max(vh
t
)
ꢀꢀ
(1.4)
[0086]
其中公示(1.1)、(1.2)、(1.3)和(1.4)中将rc作为c
il
的评分值,整合图1中“已有的产品数据”和“新产品数据”作为系统中使用的数据集合,从而可以通过联络矩阵链接两部分形成了有效推荐系统模型,运用该新推荐系统模型,实现了预测新产品的得分,并通过采集用户的偏好进行产品的排行推荐。
[0087]
实施例6:
[0088]
其具有上述实施例的实施内容,其中,对于上述实施例的具体实施方式可参阅上述描述,此处的实施例不作重复详述;而在本技术实施例中,其与上述实施例的区别在于:
[0089]
注意力机制中的权重计算公式:
[0090][0091]
其中a
t
是需要计算的分配权重,向量m
t
是需要分配权重的向量,f(m
t
,n)是两者之间相互影响的函数,l表示m
t
中需要分配的权重的向量个数,最后对a
t
进一步进行归一处理,使得权重之和为1,可得:
[0092][0093]vt
表示计算权重向量,wa和ua分别表示计算过程中的权重和偏执矩阵;
[0094]
同时以双向的多元特征词向量结构的模型,设此时输出向量矩阵为:a={a1,a2,a3,...,an}通过联立公示可以得到:
[0095]
m=tanh(a)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2.3)
[0096]
a=soft max(w
t
m)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2.4)
[0097]
由(2.3)(2.4)得到:
[0098]
γ=aanꢀꢀ
(2.5)
[0099]
上述式中:tanh函数可以将a的值大小转换到[-1,1]之间,dw是原始输入字的向量维度,w是训练过程中的参数向量,w
t
是转置向量,α的大小为n,由此可得:
[0100]h*
=tanh(γ)
ꢀꢀ
(2.6)
[0101]
将通过权重分配的向量γ输入tanh函数中得到最终的向量输出。
[0102]
本发明中,由于神经网络可以获取用户数据特征,利用多元特征词向量结构来搭建模型,通过了残差思想搭建了两层双向循环神经网络的编码层,从而获得用户在不同维度上各自的商品与产品服务的购买倾向,即针对商品、事件等只给出一个情感态度的情感分析明显达不到这样的要求,粒度更细,提取信息更全面的细粒度情感分析应运而生,发明将细粒度情感分析应用到商品评论,保证了对用户购物需求的抓取与推荐。
[0103]
以上,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献