一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

汽车知识图谱的构建方法及装置

2022-10-26 16:31:32 来源:中国专利 TAG:


1.本发明涉及人工智能技术领域,具体涉及一种汽车知识图谱的构建方法及装置。


背景技术:

2.汽车行业辐射整条产业链,是制造业软/硬件实力的双重标杆。近来,外部环境动荡变化和市场竞争格局演化施以企业极大冲击和压力。外部环境高度不确定时,企业更依赖外部知识来源,进而有针对性地迭代创新。
3.知识图谱(knowledge graph,kg)促使了知识产生模式从专家系统驱动转变为数据驱动。基于此,构建面向汽车行业产品创新的知识图谱将为实现用户数据化参与创新提供高效地技术实现途径。
4.然而,现有技术缺乏涉及汽车行业的知识图谱的构建方法。


技术实现要素:

5.本发明旨在至少解决相关技术中存在的技术问题之一。为此,本发明提出一种汽车知识图谱的构建方法,可以提高汽车知识图谱的全面性以及准确性。
6.本发明还提出一种汽车知识图谱的构建装置。
7.本发明还提出一种电子设备、非暂态计算机可读存储介质以及计算机程序产品。
8.根据本发明第一方面实施例的汽车知识图谱的构建方法,包括:
9.将汽车行业领域的目标语料输入至目标模型,得到所述目标模型输出的目标三元组数据;每一目标三元组数据包括汽车行业领域的两个不同实体,以及所述两个不同实体之间的关系;
10.基于所述目标三元组数据构建汽车知识图谱;
11.其中,所述目标模型包括:
12.第一子模型,用于确定所述目标语料为第一语料,对所述第一语料进行实体识别以及关系识别,得到所述目标三元组数据;
13.第二子模型,用于确定所述目标语料为具有情感词的情感语料,对所述情感语料进行实体识别以及关系识别,得到所述目标三元组数据;
14.第三子模型,用于确定所述目标语料为具有比较句的比较语料,对所述比较语料进行实体识别以及关系识别,得到所述目标三元组数据;
15.所述第一语料为不包括情感词以及比较句的语料。
16.本发明实施例提供的汽车知识图谱的构建方法,通过在对常规语料进行实体识别以及关系识别得到三元组数据的基础上,进一步对情感语料以及比较语料进行实体识别以及关系识别得到三元组,再根据得到的所有三元组构建汽车知识图谱,可以提高汽车知识图谱的全面性以及准确性。
17.根据本发明的一个实施例,所述对所述情感语料进行关系识别,包括:
18.对所述情感语料的情感极性进行识别;
19.根据所述情感语料的情感极性确定所述两个不同实体之间的关系。
20.根据本发明的一个实施例,所述对所述比较语料进行关系识别,包括:
21.对比较语料的比较关系进行识别;
22.根据所述比较语料的比较关系确定所述两个不同实体之间的关系。
23.根据本发明的一个实施例,所述对所述比较语料的比较关系进行识别,包括:
24.基于双向长短期记忆神经网络bi-lstm和条件随机场crf对所述比较语料中的比较关系进行抽取,得到所述比较关系。
25.根据本发明的一个实施例,所述确定所述目标语料为具有比较句的比较语料,包括:
26.将所述目标语料输入至快速文本fasttext模型,得到所述fasttext模型输出的文本分类结果;
27.根据所述文本分类结果,确定所述目标语料为具有比较句的比较语料。
28.根据本发明的一个实施例,所述基于所述目标三元组数据构建汽车知识图谱,包括:
29.确定多个目标三元组数据中的各实体,并将各实体进行匹配;
30.根据所述匹配结果构建所述汽车知识图谱。
31.根据本发明的一个实施例,所述基于所述目标三元组数据构建汽车知识图谱,包括:
32.根据预设的三元组数据构建汽车知识图谱的本体模型;
33.基于所述目标三元组数据对所述本体模型进行扩展,得到所述汽车知识图谱。
34.根据本发明第二方面实施例的汽车知识图谱的构建装置,包括:
35.关系确定模块,用于将汽车行业领域的目标语料输入至目标模型,得到所述目标模型输出的目标三元组数据;每一目标三元组数据包括汽车行业领域的两个不同实体,以及所述两个不同实体之间的关系;
36.图谱构建模块,用于基于所述目标三元组数据构建汽车知识图谱;
37.其中,所述目标模型包括:
38.第一子模型,用于确定所述目标语料为第一语料,对所述第一语料进行实体识别以及关系识别,得到所述目标三元组数据;
39.第二子模型,用于确定所述目标语料为具有情感词的情感语料,对所述情感语料进行实体识别以及关系识别,得到所述目标三元组数据;
40.第三子模型,用于确定所述目标语料为具有比较句的比较语料,对所述比较语料进行实体识别以及关系识别,得到所述目标三元组数据;
41.所述第一语料为不包括情感词以及比较句的语料。
42.本发明实施例提供的汽车知识图谱的构建装置,通过在对常规语料进行实体识别以及关系识别得到三元组数据的基础上,进一步对情感语料以及比较语料进行实体识别以及关系识别得到三元组,再根据得到的所有三元组构建汽车知识图谱,可以提高汽车知识图谱的全面性以及准确性。
43.根据本发明第三方面实施例的电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第
一方面实施例的汽车知识图谱的构建方法。
44.根据本发明第四方面实施例的非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面实施例的汽车知识图谱的构建方法。
45.根据本发明第五方面实施例的计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面实施例的汽车知识图谱的构建方法。
46.本发明实施例中的上述一个或多个技术方案,至少具有如下技术效果之一:
47.通过对情感语料的情感极性进行识别,并根据情感语料的情感极性确定两个不同实体之间的关系,可以实现从情感极性入手得到目标三元组数据,从而提高了汽车知识图谱的全面性和准确性。
48.进一步地,通过利用fasttext模型对目标语料进行文本分类,从而确定目标语料是否为具有比较句的比较语料,可以使得判断结果准确。
49.本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
50.为了更清楚地说明本发明实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
51.图1是本发明实施例提供的汽车知识图谱的构建方法的流程示意图;
52.图2是本发明实施例的汽车知识图谱的示意图;
53.图3是本发明实施例提供的bert模型的整体结构示意图;
54.图4是本发明实施例提供的bi-lstm与crf的架构示意图;
55.图5是本发明实施例提供的汽车知识图谱的构建装置的结构示意图;
56.图6是本发明实施例提供的电子设备的实体结构示意图。
具体实施方式
57.下面结合附图和实施例对本发明的实施方式作进一步详细描述。以下实施例用于说明本发明,但不能用来限制本发明的范围。
58.在本发明实施例的描述中,需要说明的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明实施例和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明实施例的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
59.在本发明实施例的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明实施例中的具体含义。
60.在本发明实施例中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
61.在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
62.图1是本发明实施例提供的汽车知识图谱的构建方法的流程示意图。参照图1,本发明实施例提供的软汽车知识图谱的构建方法,可以包括:
63.步骤110、将汽车行业领域的目标语料输入至目标模型,得到目标模型输出的目标三元组数据;每一目标三元组数据包括汽车行业领域的两个不同实体,以及两个不同实体之间的关系;
64.步骤120、基于目标三元组数据构建汽车知识图谱;
65.其中,目标模型包括:
66.第一子模型,用于确定目标语料包括第一语料,对第一语料进行实体识别以及关系识别,得到目标三元组数据;
67.第二子模型,用于确定目标语料包括具有情感词的情感语料,对情感语料进行实体识别以及关系识别,得到目标三元组数据;
68.第三子模型,用于确定目标语料包括具有比较句的比较语料,对比较语料进行实体识别以及关系识别,得到目标三元组数据;
69.第一语料为不包括情感词以及比较句的语料。
70.需要说明的是,本发明实施例提供的汽车知识图谱的构建方法,执行主体可以是计算机设备,例如手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,umpc)、上网本或者个人数字助理(personal digital assistant,pda)等。
71.在步骤110中,可以将目标语料输入至目标模型,得到目标模型输出的目标三元组数据。
72.需要说明的是,目标语料可以是汽车行业领域的各种语料,例如来自社交媒体、平台电商和互动社区等渠道的涉及汽车销售以及售后的数据、用户行为数据(例如用户评论数据等)、市场研究数据、产品分析数据等。
73.在获取目标语料后,可以将目标语料数据输入至训练好的目标模型,并得到目标模型输出的目标三元组数据。
74.目标模型可以包括第一子模型、第二子模型以及第三子模型。其中,
75.第一子模型可以用于确定目标语料包括第一语料,对第一语料进行实体识别以及关系识别,得到目标三元组数据;
76.当将目标语料输入至目标模型后,第一子模型会首先判断目标语料是否为第一语料。第一语料可以是常规语料,即不包括情感词以及比较句的语料。当第一子模型确定目标语料为第一语料时,第一子模型会从目标语料中抽取实体关键词和实体间关系,并基于抽取出的实体关键词和实体间关系得到目标三元组数据。
77.第二子模型可以用于确定目标语料为具有情感词的情感语料,对情感语料进行实体识别以及关系识别,得到目标三元组数据;
78.当目标语料输入至目标模型后,第二子模型会首先判断目标语料是否为具有情感词的情感语料。当第二子模型确定目标语料为具有情感词的情感语料时,第二子模型会对该情感语料进行实体识别以及关系识别,以得到目标三元组数据。
79.第三子模型可以用于确定目标语料为具有比较句的比较语料,对比较语料进行实体识别以及关系识别,得到目标三元组数据;
80.当目标语料输入至目标模型后,第三子模型会首先判断目标语料是否为具有比较句的比较语料。当第三子模型确定目标语料为具有比较句的比较语料时,第三子模型会对该比较语料进行实体识别以及关系识别,以得到目标三元组数据。
81.需要说明的是,目标三元组可以由(或属性)组成。实体、属性、实体与实体(属性)之间的关系的示例如表1所示:
82.表1实体、属性、实体与实体(属性)之间的关系示例表
83.实体关系实体(属性)实体(属性)值汽车维度归属品牌汽车维度类型动力汽车维度市场细分市场汽车维度车系产品名称汽车维度分类一级配置汽车维度技术二级配置品牌归属厂商领克品牌归属厂商凯迪拉克品牌归属厂商奇瑞路虎动力类型动力源新能源动力类型动力源燃油细分市场市场市场利基小型轿车细分市场市场市场利基皮卡细分市场市场市场利基跑车产品名称车系型号驭胜s330产品名称车系型号名爵hs产品名称车系型号宝马5系一级配置分类技术分类主/被动安全装备
一级配置分类技术分类内部配置一级配置分类技术分类辅助/操控配置二级配置技术技术细节abs防抱死二级配置技术技术细节内置行车记录仪二级配置技术技术细节电磁感应悬架
84.在步骤120中,可以基于步骤110中得到的所有目标三元组数据进行汽车知识图谱的构建。
85.在一个实施例中,可以确定步骤110中得到的所有目标三元组数据中的各实体,并将各实体进行匹配;再根据匹配的结果构建汽车知识图谱。
86.例如,目标三元组1为:目标三元组2为:则目标三元组1中的实体“动力”与目标三元组2中的实体“动力”匹配成功,则目标三元组1与目标三元组2可以组成汽车知识图谱中的一个分支:最终得到的汽车知识图谱的示例如图2所示(图2所示仅为汽车知识图谱的部分内容)。
87.在一个实施例中,可以根据预设的三元组数据构建汽车知识图谱的本体模型;再基于目标三元组数据对本体模型进行扩展,得到汽车知识图谱。
88.例如,可以借助领域专家知识来引导构建本体模型,确定汽车包含的重要维度,例如品牌、动力源、细分市场、车型名称以及技术配置等,以诸如等形式的(或属性)三元组形成本体模型。并以该本体模型为基础,结合步骤110中得到的所有目标三元组数据进行本体模型结构上的拓展,从而得到汽车知识图谱。
89.例如,本体模型中包括预设的三元组1:目标三元组3为:则可以结合目标三元组3对预设的三元组1进行扩展得到汽车知识图谱中的一个分支:最终得到的汽车知识图谱的示例如图2所示(图2所示仅为汽车知识图谱的部分内容)。
90.本发明实施例提供的汽车知识图谱的构建方法,通过在对常规语料进行实体识别以及关系识别得到三元组数据的基础上,进一步对情感语料以及比较语料进行实体识别以及关系识别得到三元组,再根据得到的所有三元组构建汽车知识图谱,可以提高汽车知识图谱的全面性以及准确性。
91.在一个实施例中,对情感语料进行关系识别,可以包括:
92.对情感语料的情感极性进行识别;
93.根据情感语料的情感极性确定两个不同实体之间的关系。
94.具体地,可以基于bert(bidirectional encoder representations from transformers)预训练模型来实现对情感语料的情感极性进行识别。bert模型的整体结构如图3所示。bert的本质是在没有人工标注的海量语料数据上运行监督学习,即自监督学习,为单词学习一个好的特征表示,所以bert提供的是一个供其它nlp(natural language process)任务迁移学习的特征表示,可以根据任务微调或者固定之后作为特征提取器。
95.bert是一个多任务语言表示模型,使用更能彻底捕捉语句中双向关系的多层transformer作为算法的主要框架,transformer是一个encoder-decoder的结构,由若干个编码器和解码器堆叠形成。主要步骤如下:
96.第一步,使用词向量表示技术将情感语料中的单词映射为实数向量;
97.第二步,使用wordpiece方法将单词划分成一组有限的公共子词单元进行数据预处理,使在单词的有效性和字符的灵活性之间取得一个折中的平衡;
98.第三步,通过两个自监督任务mlm(mask language model)和nsp(next sentence prediction)进行预训练。mlm是指在训练的时候随机从输入语料上遮蒙(mask)掉一些单词,然后通过的上下文预测该单词;而nsp的任务是判断某句子是否是另一句子的下文,如果是的话输出

isnext’,否则输出

notnext’;
99.最后,对于特定的任务只需要添加一个输出层来进行微调整(fine-tuning)即可,如图5的右半部分所示。
100.例如,对于汽车领域的情感语料的情感极性的识别,基于bert预训练模型的微调整阶段输出层的正负情感判断基于以下两种逻辑:
101.(1)对于汽车领域的情感语料的情感极性进行识别,基于bert预训练模型的微调整阶段输出层的正负情感判断基于以下两种逻辑:
102.a、优先使用输出的标签关键词与预定义字典中的指标关键词进行精准匹配,通过计算指标数的占比情况来判断整句的正负情感,如果正面指标数》负面指标数,则判为“正面”;如果正面指标数《负面指标数,则判为“负面”;如果正面指标数=负面指标数,则判为“中性”;
103.b、当输出的标签关键词与预定义字典中的指标关键词无法匹配上时,则通过需要大量的人工标注语料输入的机器学习方式进行系统程序判断。
104.根据以上方法,将情感语料提取出关键的标签,并按照情感倾向分成正面或负面(去除了中性)。
105.例如,对于语料“a系列汽车存在漏机油的情况”而言,可以识别得到其情感极性为负面,则可以根据该负面的情感极性从语料“a系列汽车存在漏机油的情况”得到实体“a系列汽车”与“漏机油”之间的关系为“存在问题”,并最终可以得到三元组:
106.对于语料“b系列汽车的动力强劲”而言,可以识别得到其情感极性为正面,则可以根据该正面的情感极性从语料“b系列汽车的动力强劲”得到实体“b系列汽车”与“动力强劲”之间的关系为“具有优点”,并最终可以得到三元组:
107.本发明实施例提供的汽车知识图谱的构建方法,通过对情感语料的情感极性进行识别,并根据情感语料的情感极性确定两个不同实体之间的关系,可以实现从情感极性入手得到目标三元组数据,从而提高了汽车知识图谱的全面性和准确性。
108.在一个实施例中,确定目标语料包括具有比较句的比较语料,可以包括:
109.将目标语料输入至快速文本fasttext模型,得到fasttext模型输出的文本分类结果;
110.根据文本分类结果,确定目标语料包括具有比较句的比较语料。
111.可选地,可以采用对词向量和句子分类进行高效学习训练的工具库fasttext模型来实现比较句的识别与分析,从而与bert模型形成补充,提升对比较句识别与分析的准确率。
112.对于每一个目标语料而言,第一步是将目标语料的所有单词向量化(即word embedding)后作为输入;第二步是将输入的所有向量在隐藏层进行平均化处理得到新的向量;第三步输出预测的标签值。具体地:
113.第一步:输入层,将目标语料的文本内容按照子节顺序进行大小为n的窗口滑动操作,最终形成窗口为n的字节片段序列w;
114.第二步:隐藏层,将第一步中输入的向量相加再求平均,得到一个新的向量ww,然后将这个向量输入到输出层;
115.第三步:输出层,按照一般的多分类思想,输出应该采用一个基于线性分类思想的softmax函数,但是在标准的softmax中,计算一个类别的softmax概率时需要对所有类别概率做归一化,在ww的维度n*1比较高且分类种类k比较多的时候,计算量会比较大,非常耗时。因此,根据类别的频率构造霍夫曼(huffman)编码树来代替标准softmax作为输出而非向量,通过分层softmax(hierarchical softmax)可以将复杂度从n降低到logn。
116.经过fasttext模型,就能得到目标语料的文本分类结果,从而确定目标语料是否为具有比较句的比较语料。
117.本发明实施例提供的汽车知识图谱的构建方法,通过利用fasttext模型对目标语料进行文本分类,从而确定目标语料是否为具有比较句的比较语料,可以使得判断结果准确。
118.在一个实施例中,对比较语料进行关系识别,可以包括:
119.对比较语料的比较关系进行识别;
120.根据所述比较语料的比较关系确定所述两个不同实体之间的关系。
121.在一个实施例中,可以基于双向长短期记忆神经网络bi-lstm和条件随机场crf对比较语料中的比较关系进行抽取,得到比较关系。
122.bi-lstm和crf的架构如图4所示。参照图4,bi-lstm神经网络结构模型分为2个独立的lstm,输入序列分别以正序和逆序输入至2个lstm神经网络同时进行特征提取,将2个输出向量(即提取后的特征向量)进行拼接后形成的词向量作为该词的最终特征表达,能同时处理上下文信息。
123.最后,crf能够学习句子级标签的上下文信息,通过邻近标签的关系获得一个最优的预测序列,因而crf通过统计标签直接的转移概率对bi-lstm的结果加以限制。在bi-lstm层上增加crf层可以输出更加合理的标签,两者可以形成互补,因为前者善于处理长距离的文本信息,但无法处理相邻标签之间的依赖关系。
124.具体在汽车行业,从目标语料中识别并分析比较句,可认为是识别aspect(属性)标签和对应的情感标签,可转化为序列标注的问题,lstm中的输入门、输出门、记忆门以及独特的细胞状态,可以对评论序列的前向信息进行一个较好的提取。但是,评价者在属性之后的评价也可能对之前的属性的情感造成影响,之后的属性也可能对其之前的情感造成影响。例如:“c型号车后排空间还是可以的,但是没有d型号车的大”。因此考虑使用bi-lstm和crf,使得模型能很好的利用前后向的相关信息,提取出更好的特征,进而提高准确率。
125.在一个实施例中,可以基于规则库对比较语料中的比较关系进行抽取,得到比较关系。
126.例如,可以首先由具有行业领域知识的专家根据抽取任务的要求设计出一些包含词汇、句法和语义特征的规则(或称为模式)形成规则库,然后在文本分析的过程中基于正则表达式寻找与这些模式相匹配的实例,从而推导出实体之间的语义关系。基于规则库的方法需要领域专家构建大规模的知识库,这需要有专业技能的专家付出大量劳动,成本较高且领域适用性强,但对于特定的领域的抽取具有较好的准确率。
127.在得到比较语料中的比较关系之后,即可根据比较语料的比较关系确定两个不同实体之间的关系。
128.例如,对于比较语料“b系列车比a系列车的动力稳定”而言,通过识别比较关系,可以确定两个不同实体之间的关系如下:b系列车相对于a系列车为正向竞争,a系列车相对于b系列车为反向竞争。
129.基于此,可以得到如下三元组:基于此,可以得到如下三元组:
130.本发明实施例提供的汽车知识图谱的构建方法,通过对比较语料的比较关系进行识别,并根据比较语料的比较关系确定两个不同实体之间的关系,可以实现从比较句入手得到目标三元组数据,从而提高了汽车知识图谱的全面性和准确性。
131.本发明实施例还提供一种汽车知识图谱的构建装置,该装置与上文描述的汽车知识图谱的构建方法可相互对应参照。
132.图5是本技术实施例提供的汽车知识图谱的构建装置的结构示意图。参照图5,本发明实施例提供的汽车知识图谱的构建装置,可以包括:
133.关系确定模块510,用于将汽车行业领域的目标语料输入至目标模型,得到所述目标模型输出的目标三元组数据;每一目标三元组数据包括汽车行业领域的两个不同实体,以及所述两个不同实体之间的关系;
134.图谱构建模块520,用于基于所述目标三元组数据构建汽车知识图谱;
135.其中,所述目标模型包括:
136.第一子模型,用于确定所述目标语料为第一语料,对所述第一语料进行实体识别以及关系识别,得到所述目标三元组数据;
137.第二子模型,用于确定所述目标语料为具有情感词的情感语料,对所述情感语料进行实体识别以及关系识别,得到所述目标三元组数据;
138.第三子模型,用于确定所述目标语料为具有比较句的比较语料,对所述比较语料进行实体识别以及关系识别,得到所述目标三元组数据;
139.所述第一语料为不包括情感词以及比较句的语料。
140.本发明实施例提供的汽车知识图谱的构建装置,通过在对常规语料进行实体识别以及关系识别得到三元组数据的基础上,进一步对情感语料以及比较语料进行实体识别以及关系识别得到三元组,再根据得到的所有三元组构建汽车知识图谱,可以提高汽车知识图谱的全面性以及准确性。
141.在一个实施例中,所述关系确定模块510,具体用于:
142.对所述情感语料的情感极性进行识别;
143.根据所述情感语料的情感极性确定所述两个不同实体之间的关系。
144.在一个实施例中,所述关系确定模块510,具体用于:
145.对比较语料的比较关系进行识别;
146.根据所述比较语料的比较关系确定所述两个不同实体之间的关系。
147.在一个实施例中,所述关系确定模块510,具体用于:
148.基于双向长短期记忆神经网络bi-lstm和条件随机场crf对所述比较语料中的比较关系进行抽取,得到所述比较关系。
149.在一个实施例中,所述关系确定模块510,具体用于:
150.将所述目标语料输入至快速文本fasttext模型,得到所述fasttext模型输出的文本分类结果;
151.根据所述文本分类结果,确定所述目标语料为具有比较句的比较语料。
152.在一个实施例中,所述图谱构建模块520,具体用于:
153.确定多个目标三元组数据中的各实体,并将各实体进行匹配;
154.根据所述匹配结果构建所述汽车知识图谱。
155.在一个实施例中,所述图谱构建模块520,具体用于:
156.根据预设的三元组数据构建汽车知识图谱的本体模型;
157.基于所述目标三元组数据对所述本体模型进行扩展,得到所述汽车知识图谱。
158.图6示例了一种电子设备的实体结构示意图,如图6所示,该电子设备可以包括:处理器(processor)610、通信接口(communications interface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令,以执行如下方法:
159.将汽车行业领域的目标语料输入至目标模型,得到所述目标模型输出的目标三元组数据;每一目标三元组数据包括汽车行业领域的两个不同实体,以及所述两个不同实体之间的关系;
160.基于所述目标三元组数据构建汽车知识图谱;
161.其中,所述目标模型包括:
162.第一子模型,用于确定所述目标语料为第一语料,对所述第一语料进行实体识别以及关系识别,得到所述目标三元组数据;
163.第二子模型,用于确定所述目标语料为具有情感词的情感语料,对所述情感语料进行实体识别以及关系识别,得到所述目标三元组数据;
164.第三子模型,用于确定所述目标语料为具有比较句的比较语料,对所述比较语料进行实体识别以及关系识别,得到所述目标三元组数据;
165.所述第一语料为不包括情感词以及比较句的语料。
166.此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施
例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
167.另一方面,本发明实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:
168.将汽车行业领域的目标语料输入至目标模型,得到所述目标模型输出的目标三元组数据;每一目标三元组数据包括汽车行业领域的两个不同实体,以及所述两个不同实体之间的关系;
169.基于所述目标三元组数据构建汽车知识图谱;
170.其中,所述目标模型包括:
171.第一子模型,用于确定所述目标语料为第一语料,对所述第一语料进行实体识别以及关系识别,得到所述目标三元组数据;
172.第二子模型,用于确定所述目标语料为具有情感词的情感语料,对所述情感语料进行实体识别以及关系识别,得到所述目标三元组数据;
173.第三子模型,用于确定所述目标语料为具有比较句的比较语料,对所述比较语料进行实体识别以及关系识别,得到所述目标三元组数据;
174.所述第一语料为不包括情感词以及比较句的语料。
175.又一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法,例如包括:
176.将汽车行业领域的目标语料输入至目标模型,得到所述目标模型输出的目标三元组数据;每一目标三元组数据包括汽车行业领域的两个不同实体,以及所述两个不同实体之间的关系;
177.基于所述目标三元组数据构建汽车知识图谱;
178.其中,所述目标模型包括:
179.第一子模型,用于确定所述目标语料为第一语料,对所述第一语料进行实体识别以及关系识别,得到所述目标三元组数据;
180.第二子模型,用于确定所述目标语料为具有情感词的情感语料,对所述情感语料进行实体识别以及关系识别,得到所述目标三元组数据;
181.第三子模型,用于确定所述目标语料为具有比较句的比较语料,对所述比较语料进行实体识别以及关系识别,得到所述目标三元组数据;
182.所述第一语料为不包括情感词以及比较句的语料。
183.以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
184.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上
述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
185.最后应说明的是,以上实施方式仅用于说明本发明,而非对本发明的限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行各种组合、修改或者等同替换,都不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围中。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献