一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于图像视觉特征的产品品质快速鉴别方法与流程

2022-11-28 10:36:44 来源:中国专利 TAG:


1.本发明属于品质鉴别技术领域,尤其涉及一种基于图像视觉特征的产品品质快速鉴别方法。


背景技术:

2.产品质量(quality)指的是在商品经济范畴,企业依据特定的标准,对产品进行规划、设计、制造、检测、计量、运输、储存、销售、售后服务、生态回收等全程的必要的信息披露。产品质量是由各种要素所组成的,这些要素亦被称为产品所具有的特征和特性。不同的产品具有不同的特征和特性,其总和便构成了产品质量的内涵。产品质量要求反映了产品的特性和特性满足顾客和其他相关方要求的能力。顾客和其他质量要求往往随时间而变化,与科学技术的不断进步有着密切的关系;然而,现有基于图像视觉特征的产品品质快速鉴别方法通常使用的防伪方式是条形码,但此种防伪方式是以明文的形式将产品的唯一号码写在产品上,伪造者可以在获取到正品的号码后,直接将正品上的号码印制到伪造品上,此种防伪方式也就很难起到防伪的作用;同时,现有技术中对英文评论进行挖掘与评价的方法在中文领域不适用的问题。
3.通过上述分析,现有技术存在的问题及缺陷为:
4.(1)现有基于图像视觉特征的产品品质快速鉴别方法通常使用的防伪方式是条形码,但此种防伪方式是以明文的形式将产品的唯一号码写在产品上,伪造者可以在获取到正品的号码后,直接将正品上的号码印制到伪造品上,此种防伪方式也就很难起到防伪的作用。
5.(2)现有技术中对英文评论进行挖掘与评价的方法在中文领域不适用的问题。


技术实现要素:

6.针对现有技术存在的问题,本发明提供了一种基于图像视觉特征的产品品质快速鉴别方法。
7.本发明是这样实现的,一种基于图像视觉特征的产品品质快速鉴别方法包括:
8.步骤一,构建产品标准图像数据库;通过机器视觉图像采集装置采集合格产品的图像信息,生成标准图像数据;将标准图像数据存入产品标准图像数据库;
9.步骤二,通过机器视觉图像采集装置采集目标产品图像,并对产品真伪进行验证;
10.步骤三,将采集的目标产品图像与产品标准图像数据库中图像进行对比;结果判断,如果对比结果一致,则判断产品合格,如果不一致,则将该待检测产品剔除;
11.步骤四,对产品特征进行挖掘与评价。
12.进一步,所述对产品真伪进行验证方法如下:
13.(1)构建产品数据库,发送预先获取的产品特征数据;将获取的产品特征数据存入产品数据库中;
14.(2)接收加密数据,所述加密数据是设置在产品上的加密芯片在接收到所述产品
特征数据后,使用预先存储在加密芯片中的加密密钥将所述产品特征数据和预先储存在加密芯片中的产品数据进行加密后得到并发出的;
15.(3)使用本地存储的解密密钥对所述加密数据进行解密;若解密成功,则从所述加密数据中得到待验证的产品特征数据和所述产品数据;判断所述待验证的产品特征数据是否满足预设的验证条件,若是,则确定所述产品为真,且显示所述产品数据;
16.发送的所述产品特征数据包括所述发送时的即时时间值,即发送时间值,所述待验证的产品特征数据包括待验证的发送时间值;
17.所述判断所述待验证的产品特征数据是否满足预设的验证条件包括:
18.判断待验证的发送时间值是否与所述解密成功的即时时间值的差值在预先设定的范围内;
19.所述即时时间值包括使用终端发送的当前时间或当前的时间与其他数字的组合;
20.所述即时时间值是从时间点开始到进行发送动作当前时间为止,其间经过的秒值或分钟值或小时值。
21.进一步,所述预先设定的范围为2秒至10秒。
22.进一步,所述产品数据包括,真伪验证数据;
23.所述方法还包括,判断所述真伪验证数据是否与预先存储在本地的验证数据相同;
24.若是,且所述判断所述待验证的产品特征数据是否满足预设的验证条件的结果为是,则确定所述产品为真,且显示所述产品数据。
25.进一步,所述使用本地存储的解密密钥对所述加密数据进行解密还包括:
26.若解密失败,则确定所述产品为假,且显示表示所述产品为假的数据。
27.进一步,所述加密芯片为nfc芯片;
28.所述加密密钥和所述解密密钥为非对称密钥;
29.所述接收包括:
30.向所述加密芯片发送接收加密数据的指令数据;
31.接收所述加密数据,所述加密数据是加密终端在接收到所述预先获取的产品特征数据后,使用预先存储在加密芯片中的加密密钥将所述产品特征数据和预先储存在加密芯片中的产品数据进行加密后得到,且在接收到所述指令数据后发出的。
32.进一步,所述对产品特征进行挖掘与评价方法如下:
33.1)通过提取程序随机抓取多条用户对于目标产品的文本评论数据训练感情词典与产品特征词典;确定目标产品,并从电子商务平台上抓取多条不同用户对于目标产品的文本评论数据;
34.2)根据所述感情词典与产品特征词典,依次从每条所述文本评论数据中抽取出产品特征-感情词语对,并使用所述产品特征-感情词语对迭代更新所述感情词典与产品特征词典,直到多条所述文本评论数据均被处理;
35.3)对所有被抽取出的所述产品特征-感情词语对进行统计,获得该产品的产品特征与感情评价;
36.所述通过提取程序随机抓取多条用户对于目标产品的文本评论数据方法:
37.随机抓取多条数据获取步骤,获取网页上的产品评论数据;对评论数据进行统计
归类;
38.产品评论数据处理步骤,对产品评论数据进行分词、词性标注、及去停用词处理从而得到分词结果;
39.计算词向量步骤,使用word2vec算法,输入分词结果,计算产品评论数据中每个词的词向量;
40.观点提取步骤,使用种子词典结合观点提取规则处理产品评论数据,获得观点提取结果,观点提取结果包括产品评论对象和产品评论观点信息;
41.新产品评论对象获取步骤,结合产品评论数据和观点提取结果,使用crf模型发现新产品评论对象,并将新产品评论对象添加到新词候选集中,所述crf模型是条件随机场模型;
42.过滤步骤,使用词向量和过滤规则对新词候选集中的产品评论对象进行过滤,形成新词词集;
43.更新步骤,将新词词集中的产品评论对象添加到种子词典中,从而更新种子词典;
44.重复依次执行观点提取步骤、新产品评论对象获取步骤、过滤步骤、和更新步骤,直到不出现新产品评论对象或达到迭代次数后,执行观点提取步骤,从而得到最新的观点提取结果;
45.在所述新产品评论对象获取步骤中包括如下步骤:
46.构造训练语料步骤,从观点提取结果中得到产品评论对象,生成crf模型的训练语料;
47.训练集建立步骤,建立交叉验证训练集,并使用交叉验证方法把训练语料分成规定份数,并按规定比例组合成训练集和测试集,然后对训练集和测试集分别进行训练,从而得到crf模型;
48.提取步骤,使用crf模型进行新产品评论对象提取;
49.交叉训练判断步骤,判断是否完成交叉训练,如果是,那么执行新词候选集生成步骤,否则执行提取步骤;
50.新词候选集生成步骤,生成新词候选集,并将新产品评论对象添加到新词候选集中;
51.在所述过滤步骤中包括如下步骤:
52.a.计算相似度步骤,计算新词候选集中的新产品评论对象与种子词典中的分类中心词的相似度;
53.b.处理判断步骤,若相似度高于阈值且新词候选集中的新产品评论对象不在种子词典内,那么执行步骤c,否则从新词候选集中将该新产品评论对象删除后再执行步骤c;
54.c.判断是否完成对新词候选集的过滤,若是,那么执行步骤d,否则执行步骤a;
55.d.将新词候选集中的产品评论对象添加到新词词集中;
56.在所述计算词向量步骤中,word2vec算法计算产品评论数据中每个词的词向量使用向量余弦值来度量词语之间的相似性,具体公式如下:
57.58.其中vi=(vi1,vi2,...,vin)表示第i个词的词向量,vc=(vc1,vc2,...,vcn)表示分类c中心词的词向量,分类中心词取每个分类在产品评论数据中出现频率最高的词语,由于使用word2vec算法获得的词向量的模为1,上述公式可以简化为:
[0059][0060]
在所述计算词向量步骤中,对属于每个类别的相似性加上偏移修正,修正后的相似性计算公式如下:
[0061][0062]
其中max(simc)表示与分类c中心词的相似度最大值;
[0063]
第i个新产品评论对象的判定函数为:
[0064][0065]
其中m是分类总数,n是crf模型得到的新产品评论对象总数。
[0066]
所述随机抓取多条用户对于产品的文本评论数据训练感情词典包括:
[0067]
确定每条所述随机抓取的文本评论数据为正面评价或负面评价;
[0068]
对每条所述随机抓取的文本评论数据进行分词处理,并对分词处理得到的每个词进行词性标注;
[0069]
使用朴素贝叶斯方法将分词处理得到的每个形容词按照该形容词的出现次数计算该形容词的在正面评价与负面评价中的先验概率;
[0070]
根据该形容词的在正面评价与负面评价中的先验概率将该形容词归为正面词语或负面词语,并加入所述感情词典中;
[0071]
所述对每条所述随机抓取的文本评论数据进行分词处理时,也将表情符号、标点符号、习惯用语与基于正则表达式的句型模板视为单词进行分词处理;对分词处理得到的每个词进行词性标注时,也将表情符号、标点符号、习惯用语与基于正则表达式的句型模板视为单词进行词性标注,并标注为形容词;
[0072]
随机抓取多条用户对于产品的文本评论数据训练产品特征词典包括:
[0073]
对每条所述随机抓取的文本评论数据进行分词处理,并对分词处理得到的每个词进行词性标注;
[0074]
提取出分词处理得到的所有独立名词并加入所述产品特征词典中;
[0075]
提取出分词处理得到的所有多个名词直接相连形成的复合词,并将所述复合词整体作为单个名词加入所述产品特征词典中;
[0076]
提取出分词处理得到的所有多个名词之间以“的”相连形成的短语,并将所述短语整体作为单个名词加入所述产品特征词典中。
[0077]
进一步,所述根据所述感情词典与产品特征词典,依次从每条所述文本评论数据中抽取出产品特征-感情词语对包括:
[0078]
依次指定每条所述文本评论数据,并对所述被指定文本评论数据进行预处理;
[0079]
从预处理后的所述被指定文本评论数据中提取出与所述感情词典记载相匹配的单词,作为所述被指定文本评论数据的感情词汇;
[0080]
从预处理后的所述被指定文本评论数据中提取出与所述产品特征词典记载相匹配的单词,作为所述被指定文本评论数据的产品特征词汇;
[0081]
根据所述感情词汇与产品特征词汇,通过“产品特征-感情”模型在预处理后的所述被指定文本评论数据中提取出多个产品特征-感情词语对。
[0082]
进一步,所述对所述被指定文本评论数据进行预处理包括:
[0083]
将所述被指定文本评论数据分割为按一定顺序连接的多个单词;
[0084]
对所述每个单词进行词性标注;
[0085]
根据所述提取出的感情词汇与产品特征词汇,通过“产品特征-感情”模型在预处理后的所述被指定文本评论数据中提取出多个产品特征-感情词语对包括:
[0086]
依次指定每个所述感情词汇,根据所述被指定感情词汇在预处理后的所述被指定文本评论数据中的单词位置,提取该位置以前预先指定长度内所有词性被标注为名词的单词,并将所述被指定感情词汇与每个词性被标注为名词的所述单词一一建立产品特征-感情词语对,直到每个所述感情词汇都被指定过;
[0087]
依次指定每个所述产品特征词汇,根据所述被指定产品特征词汇在预处理后的所述被指定文本评论数据中的单词位置,提取该位置以后预先指定长度内所有词性被标注为形容词的单词,并将所述被指定产品特征词汇与每个词性被标注为形容词的所述单词一一建立产品特征-感情词语对,直到每个所述产品特征词汇都被指定过。
[0088]
进一步,所述使用所述产品特征-感情词语对迭代更新所述感情词典与产品特征词典包括:
[0089]
将所述产品特征-感情词语对中的感情部分单词并入所述感情词典中;
[0090]
将所述产品特征-感情词语对中的产品特征部分单词并入所述产品特征词典中。
[0091]
结合上述的技术方案和解决的技术问题,请从以下几方面分析本发明所要保护的技术方案所具备的优点及积极效果为:
[0092]
第一、针对上述现有技术存在的技术问题以及解决该问题的难度,紧密结合本发明的所要保护的技术方案以及研发过程中结果和数据等,详细、深刻地分析本发明技术方案如何解决的技术问题,解决问题之后带来的一些具备创造性的技术效果。具体描述如下:
[0093]
本发明通过对产品真伪进行验证方法在对产品真伪进行验证的时候不需要使用到互联网,简化了产品真伪验证的步骤,提高了真伪验证方法的可靠性,并且不需要网络流量使用费,提高了对产品真伪验证的速度;同时,通过对产品特征进行挖掘与评价方法使用训练感情词典与产品特征词典,抓取多条不同用户对于目标产品的文本评论数据抽取出产品特征-感情词语对迭代更新感情词典与产品特征词典,并统计获得该产品的产品特征与感情评价的技术手段,能够在中文领域上挖掘与评价产品的特征并进行统计分析,为中文电子商务的综合评价提供数据支持。
[0094]
第二,把技术方案看做一个整体或者从产品的角度,本发明所要保护的技术方案具备的技术效果和优点,具体描述如下:
[0095]
本发明通过对产品真伪进行验证方法在对产品真伪进行验证的时候不需要使用到互联网,简化了产品真伪验证的步骤,提高了真伪验证方法的可靠性,并且不需要网络流
量使用费,提高了对产品真伪验证的速度;同时,通过对产品特征进行挖掘与评价方法使用训练感情词典与产品特征词典,抓取多条不同用户对于目标产品的文本评论数据抽取出产品特征-感情词语对迭代更新感情词典与产品特征词典,并统计获得该产品的产品特征与感情评价的技术手段,能够在中文领域上挖掘与评价产品的特征并进行统计分析,为中文电子商务的综合评价提供数据支持。
附图说明
[0096]
图1是本发明实施例提供的基于图像视觉特征的产品品质快速鉴别方法流程图。
[0097]
图2是本发明实施例提供的对产品真伪进行验证方法流程图。
[0098]
图3是本发明实施例提供的对产品特征进行挖掘与评价方法流程图。
具体实施方式
[0099]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0100]
一、解释说明实施例。为了使本领域技术人员充分了解本发明如何具体实现,该部分是对权利要求技术方案进行展开说明的解释说明实施例。
[0101]
如图1所示,本发明提供一种基于图像视觉特征的产品品质快速鉴别方法包括以下步骤:
[0102]
s101,构建产品标准图像数据库;通过机器视觉图像采集装置采集合格产品的图像信息,生成标准图像数据;将标准图像数据存入产品标准图像数据库;
[0103]
s102,通过机器视觉图像采集装置采集目标产品图像,并对产品真伪进行验证;
[0104]
s103,将采集的目标产品图像与产品标准图像数据库中图像进行对比;结果判断,如果对比结果一致,则判断产品合格,如果不一致,则将该待检测产品剔除;
[0105]
s104,对产品特征进行挖掘与评价。
[0106]
本发明通过对产品真伪进行验证方法在对产品真伪进行验证的时候不需要使用到互联网,简化了产品真伪验证的步骤,提高了真伪验证方法的可靠性,并且不需要网络流量使用费,提高了对产品真伪验证的速度;同时,通过对产品特征进行挖掘与评价方法使用训练感情词典与产品特征词典,抓取多条不同用户对于目标产品的文本评论数据抽取出产品特征-感情词语对迭代更新感情词典与产品特征词典,并统计获得该产品的产品特征与感情评价的技术手段,能够在中文领域上挖掘与评价产品的特征并进行统计分析,为中文电子商务的综合评价提供数据支持。
[0107]
如图2所示,本发明提供的对产品真伪进行验证方法如下:
[0108]
s201,构建产品数据库,发送预先获取的产品特征数据;将获取的产品特征数据存入产品数据库中;
[0109]
s202,接收加密数据,所述加密数据是设置在产品上的加密芯片在接收到所述产品特征数据后,使用预先存储在加密芯片中的加密密钥将所述产品特征数据和预先储存在加密芯片中的产品数据进行加密后得到并发出的;
[0110]
s203,使用本地存储的解密密钥对所述加密数据进行解密;若解密成功,则从所述
加密数据中得到待验证的产品特征数据和所述产品数据;判断所述待验证的产品特征数据是否满足预设的验证条件,若是,则确定所述产品为真,且显示所述产品数据;
[0111]
本发明通过对产品真伪进行验证方法在对产品真伪进行验证的时候不需要使用到互联网,简化了产品真伪验证的步骤,提高了真伪验证方法的可靠性,并且不需要网络流量使用费,提高了对产品真伪验证的速度。
[0112]
发送的所述产品特征数据包括所述发送时的即时时间值,即发送时间值,所述待验证的产品特征数据包括待验证的发送时间值;
[0113]
所述判断所述待验证的产品特征数据是否满足预设的验证条件包括:
[0114]
判断待验证的发送时间值是否与所述解密成功的即时时间值的差值在预先设定的范围内;
[0115]
所述即时时间值包括使用终端发送的当前时间或当前的时间与其他数字的组合;
[0116]
所述即时时间值是从时间点开始到进行发送动作当前时间为止,其间经过的秒值或分钟值或小时值。
[0117]
本发明提供的预先设定的范围为2秒至10秒。
[0118]
本发明提供的产品数据包括,真伪验证数据;
[0119]
所述方法还包括,判断所述真伪验证数据是否与预先存储在本地的验证数据相同;
[0120]
若是,且所述判断所述待验证的产品特征数据是否满足预设的验证条件的结果为是,则确定所述产品为真,且显示所述产品数据。
[0121]
本发明提供的使用本地存储的解密密钥对所述加密数据进行解密还包括:
[0122]
若解密失败,则确定所述产品为假,且显示表示所述产品为假的数据。
[0123]
本发明提供的加密芯片为nfc芯片;
[0124]
所述加密密钥和所述解密密钥为非对称密钥;
[0125]
所述接收包括:
[0126]
向所述加密芯片发送接收加密数据的指令数据;
[0127]
接收所述加密数据,所述加密数据是加密终端在接收到所述预先获取的产品特征数据后,使用预先存储在加密芯片中的加密密钥将所述产品特征数据和预先储存在加密芯片中的产品数据进行加密后得到,且在接收到所述指令数据后发出的。
[0128]
如图3所示,本发明提供的对产品特征进行挖掘与评价方法如下:
[0129]
s301,通过提取程序随机抓取多条用户对于目标产品的文本评论数据训练感情词典与产品特征词典;确定目标产品,并从电子商务平台上抓取多条不同用户对于目标产品的文本评论数据;
[0130]
s302,根据所述感情词典与产品特征词典,依次从每条所述文本评论数据中抽取出产品特征-感情词语对,并使用所述产品特征-感情词语对迭代更新所述感情词典与产品特征词典,直到多条所述文本评论数据均被处理;
[0131]
s303,对所有被抽取出的所述产品特征-感情词语对进行统计,获得该产品的产品特征与感情评价;
[0132]
本发明通过对产品特征进行挖掘与评价方法使用训练感情词典与产品特征词典,抓取多条不同用户对于目标产品的文本评论数据抽取出产品特征-感情词语对迭代更新感
情词典与产品特征词典,并统计获得该产品的产品特征与感情评价的技术手段,能够在中文领域上挖掘与评价产品的特征并进行统计分析,为中文电子商务的综合评价提供数据支持。
[0133]
所述通过提取程序随机抓取多条用户对于目标产品的文本评论数据方法:
[0134]
随机抓取多条数据获取步骤,获取网页上的产品评论数据;对评论数据进行统计归类;
[0135]
产品评论数据处理步骤,对产品评论数据进行分词、词性标注、及去停用词处理从而得到分词结果;
[0136]
计算词向量步骤,使用word2vec算法,输入分词结果,计算产品评论数据中每个词的词向量;
[0137]
观点提取步骤,使用种子词典结合观点提取规则处理产品评论数据,获得观点提取结果,观点提取结果包括产品评论对象和产品评论观点信息;
[0138]
新产品评论对象获取步骤,结合产品评论数据和观点提取结果,使用crf模型发现新产品评论对象,并将新产品评论对象添加到新词候选集中,所述crf模型是条件随机场模型;
[0139]
过滤步骤,使用词向量和过滤规则对新词候选集中的产品评论对象进行过滤,形成新词词集;
[0140]
更新步骤,将新词词集中的产品评论对象添加到种子词典中,从而更新种子词典;
[0141]
重复依次执行观点提取步骤、新产品评论对象获取步骤、过滤步骤、和更新步骤,直到不出现新产品评论对象或达到迭代次数后,执行观点提取步骤,从而得到最新的观点提取结果;
[0142]
在所述新产品评论对象获取步骤中包括如下步骤:
[0143]
构造训练语料步骤,从观点提取结果中得到产品评论对象,生成crf模型的训练语料;
[0144]
训练集建立步骤,建立交叉验证训练集,并使用交叉验证方法把训练语料分成规定份数,并按规定比例组合成训练集和测试集,然后对训练集和测试集分别进行训练,从而得到crf模型;
[0145]
提取步骤,使用crf模型进行新产品评论对象提取;
[0146]
交叉训练判断步骤,判断是否完成交叉训练,如果是,那么执行新词候选集生成步骤,否则执行提取步骤;
[0147]
新词候选集生成步骤,生成新词候选集,并将新产品评论对象添加到新词候选集中;
[0148]
在所述过滤步骤中包括如下步骤:
[0149]
a.计算相似度步骤,计算新词候选集中的新产品评论对象与种子词典中的分类中心词的相似度;
[0150]
b.处理判断步骤,若相似度高于阈值且新词候选集中的新产品评论对象不在种子词典内,那么执行步骤c,否则从新词候选集中将该新产品评论对象删除后再执行步骤c;
[0151]
c.判断是否完成对新词候选集的过滤,若是,那么执行步骤d,否则执行步骤a;
[0152]
d.将新词候选集中的产品评论对象添加到新词词集中;
[0153]
在所述计算词向量步骤中,word2vec算法计算产品评论数据中每个词的词向量使用向量余弦值来度量词语之间的相似性,具体公式如下:
[0154][0155]
其中vi=(vi1,vi2,...,vin)表示第i个词的词向量,vc=(vc1,vc2,...,vcn)表示分类c中心词的词向量,分类中心词取每个分类在产品评论数据中出现频率最高的词语,由于使用word2vec算法获得的词向量的模为1,上述公式可以简化为:
[0156][0157]
在所述计算词向量步骤中,对属于每个类别的相似性加上偏移修正,修正后的相似性计算公式如下:
[0158][0159]
其中max(simc)表示与分类c中心词的相似度最大值;
[0160]
第i个新产品评论对象的判定函数为:
[0161][0162]
其中m是分类总数,n是crf模型得到的新产品评论对象总数。
[0163]
所述随机抓取多条用户对于产品的文本评论数据训练感情词典包括:
[0164]
确定每条所述随机抓取的文本评论数据为正面评价或负面评价;
[0165]
对每条所述随机抓取的文本评论数据进行分词处理,并对分词处理得到的每个词进行词性标注;
[0166]
使用朴素贝叶斯方法将分词处理得到的每个形容词按照该形容词的出现次数计算该形容词的在正面评价与负面评价中的先验概率;
[0167]
根据该形容词的在正面评价与负面评价中的先验概率将该形容词归为正面词语或负面词语,并加入所述感情词典中;
[0168]
所述对每条所述随机抓取的文本评论数据进行分词处理时,也将表情符号、标点符号、习惯用语与基于正则表达式的句型模板视为单词进行分词处理;对分词处理得到的每个词进行词性标注时,也将表情符号、标点符号、习惯用语与基于正则表达式的句型模板视为单词进行词性标注,并标注为形容词;
[0169]
随机抓取多条用户对于产品的文本评论数据训练产品特征词典包括:
[0170]
对每条所述随机抓取的文本评论数据进行分词处理,并对分词处理得到的每个词进行词性标注;
[0171]
提取出分词处理得到的所有独立名词并加入所述产品特征词典中;
[0172]
提取出分词处理得到的所有多个名词直接相连形成的复合词,并将所述复合词整
体作为单个名词加入所述产品特征词典中;
[0173]
提取出分词处理得到的所有多个名词之间以“的”相连形成的短语,并将所述短语整体作为单个名词加入所述产品特征词典中。
[0174]
本发明提供的根据所述感情词典与产品特征词典,依次从每条所述文本评论数据中抽取出产品特征-感情词语对包括:
[0175]
依次指定每条所述文本评论数据,并对所述被指定文本评论数据进行预处理;
[0176]
从预处理后的所述被指定文本评论数据中提取出与所述感情词典记载相匹配的单词,作为所述被指定文本评论数据的感情词汇;
[0177]
从预处理后的所述被指定文本评论数据中提取出与所述产品特征词典记载相匹配的单词,作为所述被指定文本评论数据的产品特征词汇;
[0178]
根据所述感情词汇与产品特征词汇,通过“产品特征-感情”模型在预处理后的所述被指定文本评论数据中提取出多个产品特征-感情词语对。
[0179]
本发明提供的对所述被指定文本评论数据进行预处理包括:
[0180]
将所述被指定文本评论数据分割为按一定顺序连接的多个单词;
[0181]
对所述每个单词进行词性标注;
[0182]
根据所述提取出的感情词汇与产品特征词汇,通过“产品特征-感情”模型在预处理后的所述被指定文本评论数据中提取出多个产品特征-感情词语对包括:
[0183]
依次指定每个所述感情词汇,根据所述被指定感情词汇在预处理后的所述被指定文本评论数据中的单词位置,提取该位置以前预先指定长度内所有词性被标注为名词的单词,并将所述被指定感情词汇与每个词性被标注为名词的所述单词一一建立产品特征-感情词语对,直到每个所述感情词汇都被指定过;
[0184]
依次指定每个所述产品特征词汇,根据所述被指定产品特征词汇在预处理后的所述被指定文本评论数据中的单词位置,提取该位置以后预先指定长度内所有词性被标注为形容词的单词,并将所述被指定产品特征词汇与每个词性被标注为形容词的所述单词一一建立产品特征-感情词语对,直到每个所述产品特征词汇都被指定过。
[0185]
本发明提供的使用所述产品特征-感情词语对迭代更新所述感情词典与产品特征词典包括:
[0186]
将所述产品特征-感情词语对中的感情部分单词并入所述感情词典中;
[0187]
将所述产品特征-感情词语对中的产品特征部分单词并入所述产品特征词典中。
[0188]
二、应用实施例。为了证明本发明的技术方案的创造性和技术价值,该部分是对权利要求技术方案进行具体产品上或相关技术上的应用实施例。
[0189]
本发明通过对产品真伪进行验证方法在对产品真伪进行验证的时候不需要使用到互联网,简化了产品真伪验证的步骤,提高了真伪验证方法的可靠性,并且不需要网络流量使用费,提高了对产品真伪验证的速度;同时,通过对产品特征进行挖掘与评价方法使用训练感情词典与产品特征词典,抓取多条不同用户对于目标产品的文本评论数据抽取出产品特征-感情词语对迭代更新感情词典与产品特征词典,并统计获得该产品的产品特征与感情评价的技术手段,能够在中文领域上挖掘与评价产品的特征并进行统计分析,为中文电子商务的综合评价提供数据支持。
[0190]
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。
硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、cd或dvd-rom的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
[0191]
三、实施例相关效果的证据。本发明实施例在研发或者使用过程中取得了一些积极效果,和现有技术相比的确具备很大的优势,下面内容结合试验过程的数据、图表等进行描述。
[0192]
本发明通过对产品真伪进行验证方法在对产品真伪进行验证的时候不需要使用到互联网,简化了产品真伪验证的步骤,提高了真伪验证方法的可靠性,并且不需要网络流量使用费,提高了对产品真伪验证的速度;同时,通过对产品特征进行挖掘与评价方法使用训练感情词典与产品特征词典,抓取多条不同用户对于目标产品的文本评论数据抽取出产品特征-感情词语对迭代更新感情词典与产品特征词典,并统计获得该产品的产品特征与感情评价的技术手段,能够在中文领域上挖掘与评价产品的特征并进行统计分析,为中文电子商务的综合评价提供数据支持。
[0193]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献