一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于知识图谱的DHI报告解读方法、系统及存储介质与流程

2021-11-18 01:24:00 来源:中国专利 TAG:

一种基于知识图谱的dhi报告解读方法、系统及存储介质
技术领域
1.本发明涉及一种dhi报告解读方法、系统即存储介质,属于畜牧养殖技术领域。


背景技术:

2.dhi(dairy herd improvement)奶牛生产性能测定对指导牧场实施奶牛群改良具有重大意义。目前,dhi报告在实际应用中存在以下问题:
3.(1)dhi报告的解读尚未形成规范化的知识体系,这些知识仅仅是专家经验或记载于部分专业书籍中,不成体系,无法充分用于指导dhi报告的分析;
4.(2)由于问题(1),导致能够专业解读dhi报告的人员存在较大缺口,绝大多数牧场完全依赖dhi检测中心根据测定结果出具的初步解读报告,该报告仅依据测定结果进行大致判断,未能充分结合牧场生产实际进行深入分析,导致其欠缺实用性;
5.(3)市面常见的牛场管理软件如cndhi、freedms等,其仅限于分析dhi关键指标的走势、指标的预警等数据统计功能,牧场管理人员面对指标的数值曲线仍茫然无措,这些软件未能结合专家知识给出指导性结论,因而无法有效发挥和利用dhi报告的价值。
6.以上原因导致牧场参测的积极性不高,极大地影响我国dhi测定工作的深入推广和普及。


技术实现要素:

7.本发明是为了解决目前尚没有一种针对于dhi报告的自动解读方法,从而导致dhi报告解读不仅效率低,而且不能客观、准确、有效的利用dhi报告的信息的问题。
8.一种基于知识图谱的dhi报告解读方法,包括以下步骤:
9.s1、获取牧场的dhi数据,dhi指标数据包括本月数据和历史数据两种;
10.本月数据直接使用dhi检测中心根据中国奶牛生产性能测定分析系统制作完成的dhi报告文件;
11.历史数据则通过遍历历史dhi报告文件中的相关指标数据,按照既定的字段获取关指标数据;
12.s2、对dhi指标数据进行分析,分析指标数据包括静态分析和动态分析两方面:
13.静态分析是根据各项指标的本月数据,按照各指标正常范围值标准,找到异常指标,并对应形成事实描述;
14.动态分析是结合各指标的本月数据和历史数据,分析各指标近期的变化规律,并对应形成事实描述;
15.s3、结合dhi领域知识图谱对动态分析的结果进行问题诊断,问题诊断的过程包括问题定位,所述的问题定位是基于dhi领域知识图谱,将动态分析的事实描述作为“性能指标/症状”实体,计算得到事实描述是由某种影响因素影响而发生的概率,记为p(fac):
16.p(fac)=p(fac|sym)
·
p
prior
(sym)
17.其中,p(fac|sym)是性能指标/症状与影响因素之间的条件概率,也就是实体之间
边的权重;p
prior
(sym)为性能指标/症状的先验概率;
18.所述的dhi领域知识图谱包含“性能指标/症状”、“影响因素”、“解决措施”三类实体及实体关系;“影响因素”和“性能指标/症状”两类实体构成三元组,“影响因素”和“性能指标/症状”实体之间边设置权重,权重为两类实体之间的条件概率p(fac|sym),所述两类实体之间的条件概率确定过程包括以下步骤:
19.获取参与者qn针对于“性能指标/症状i”反馈的各“影响因素j”及对应分数ij;
20.基于某个性能指标/症状i,将所有的参与者对应的的影响因素j进行统计得到影响因素集合j={jm},m=1,2,
……
,m,m为某个性能指标/症状i对应的所有影响因素的总数;
21.按照影响因素设置m个影响位次;
22.针对参与者qn,分别对给出的影响因素j按照对应的分数进行排序;然后统计参与者qn排在第一位的影响因素数量,将数量最多的影响因素作为第一影响位次;再统计参与者qn排在第二位的影响因素数量,将数量最多的影响因素作为第二影响位次;依次进行统计并的得到对应的影响位次,直至得到m个影响位次;
23.从第一影响位次开始,至第m个影响位次结束,针对于每个影响位次分别计算对应影响位次所体现的因素的得分,包括以下步骤:
24.针对影响位次m对应的影响因素pj,统计参与者qn对影响因素pj的排序与影响位次m是一致的情况下的参与者qn'以及qn'给出的影响因素pj的分数,并qn'的数量计算qn'给出影响因素pj对应分数的平均分;所述平均分即为“影响因素pj”和“性能指标/症状”两类实体之间的条件概率;
25.参与者qn对影响因素pj的排序与影响位次m是一致的情况,即:基于参与者qn的排序结果,参与者qn也将影响因素pj排在了该参与者给出排序结果的第m位。
26.进一步地,问题诊断的过程还包括给出指导措施建议,指导措施建议是基于定位得到的影响因素,从dhi领域知识图谱中根据“影响因素”与“解决措施”两类实体之间的关系,确定该影响因素对应的解决措施。
27.进一步地,所述的p
prior
(sym)初始值根据历史dhi报告及牧场记录数据统计计算得到,并按照月份数据进行更新。
28.进一步地,所述的dhi领域知识图谱为预先构建好的,构建过程包括以下步骤:
29.(1)构造dhi领域本体,dhi领域本体包含“性能指标/症状”、“影响因素”、“解决措施”三类实体及实体关系;
30.(2)将dhi测定与应用指导相关资料电子化后得到的电子文本作为标注对象,以本体为标注依据,对电子文本数据进行语义标注,形成标注数据;
31.(3)利用标注数据中的数据作为训练数据,按照dhi领域知识图谱的本体结构,从互联网文本中抽取实体和实体关系,得到扩充数据,形成完整的dhi领域知识图谱。
32.一种基于知识图谱的dhi报告解读系统,包括:
33.dhi数据获取单元,用于获取牧场的dhi数据;
34.dhi指标数据包括本月数据和历史数据两种;本月数据直接使用dhi检测中心根据中国奶牛生产性能测定分析系统制作完成的dhi报告文件;历史数据则通过遍历历史dhi报告文件中的相关指标数据,按照既定的字段获取关指标数据;
35.dhi指标数据分析单元,用于对dhi指标数据进行分析;
36.分析指标数据包括静态分析和动态分析两方面:
37.静态分析是根据各项指标的本月数据,按照各指标正常范围值标准,找到异常指标,并对应形成事实描述;
38.动态分析是结合各指标的本月数据和历史数据,分析各指标近期的变化规律,并对应形成事实描述;
39.问题诊断单元,用于调取dhi领域知识图谱对动态分析的结果进行问题诊断;问题诊断单元包括问题定位模块,所述问题定位模块基于dhi领域知识图谱,将动态分析的事实描述作为“性能指标/症状”实体,计算得到事实描述是由某种影响因素影响而发生的概率;
40.数据库,数据库用于存储dhi领域知识图谱;
41.所述的dhi领域知识图谱包含“性能指标/症状”、“影响因素”、“解决措施”三类实体及实体关系;“影响因素”和“性能指标/症状”两类实体构成三元组,“影响因素”和“性能指标/症状”实体之间边设置权重。
42.进一步地,所述系统还包括众包数据获取单元;
43.所述众包数据获取单元用于向不同用户提供“性能指标/症状”和对应的“影响因素”选项,以及用户添加选项,用户通过添加选项添加“性能指标/症状”和“影响因素”内容;
44.所述众包数据获取单元还用于获取不同参与者反馈的“性能指标/症状”,以及每个“性能指标/症状”对应的“影响因素”及影响因素相应的分数。
45.进一步地,所述系统还包括边权重计算单元,用于计算“影响因素”和“性能指标/症状”实体之间边的权重,具备包括以下步骤:
46.获取参与者qn针对于“性能指标/症状i”反馈的各“影响因素j”及对应分数ij;
47.基于某个性能指标/症状i,将所有的参与者对应的的影响因素j进行统计得到影响因素集合j={jm},m=1,2,
……
,m,m为某个性能指标/症状i对应的所有影响因素的总数;
48.按照影响因素设置m个影响位次;
49.针对参与者qn,分别对给出的影响因素j按照对应的分数进行排序;然后统计参与者qn排在第一位的影响因素数量,将数量最多的影响因素作为第一影响位次;再统计参与者qn排在第二位的影响因素数量,将数量最多的影响因素作为第二影响位次;依次进行统计并的得到对应的影响位次,直至得到m个影响位次;
50.从第一影响位次开始,至第m个影响位次结束,针对于每个影响位次分别计算对应影响位次所体现的因素的得分,包括以下步骤:
51.针对影响位次m对应的影响因素pj,统计参与者qn对影响因素pj的排序与影响位次m是一致的情况下的参与者qn'以及qn'给出的影响因素pj的分数,并qn'的数量计算qn'给出影响因素pj对应分数的平均分;所述平均分即为“影响因素pj”和“性能指标/症状”两类实体之间的条件概率,条件概率即为“影响因素pj”和对应“性能指标/症状”实体之间边的权重;
52.参与者qn对影响因素pj的排序与影响位次m是一致的情况,即:基于参与者qn的排序结果,参与者qn也将影响因素pj排在了该参与者给出排序结果的第m位。
53.进一步地,所述性能指标/症状的先验概率确定单元,用于根据历史dhi报告及牧
场记录数据计算性能指标/症状的先验概率p
prior
(sym),为问题诊断单元提供用于计算事实描述是由某种影响因素影响发生概率的性能指标/症状的先验概率。
54.进一步地,所述问题诊断单元还包括指导措施建议模块,所述指导措施建议模块基于定位得到的影响因素,从dhi领域知识图谱中根据“影响因素”与“解决措施”两类实体之间的关系,确定该影响因素对应的解决措施。
55.一种存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现所述的一种基于知识图谱的dhi报告解读方法。
56.有益效果:
57.1、本发明能够通过构建的dhi领域知识图谱,将dhi报告解读涉及到的知识进行显性化和量化表达,即:影响因素、测定参数异常与事实症状之间的复杂共生关系及影响程度,实现dhi报告自动解读,能够实现有效的利用dhi报告信息指导畜牧养殖过程。
58.2、利用本发明能够替代目前dhi检测中心报告分析人员的部分工作,无需为了向牧场提供初步结论而对各个dhi报告进行整合、对比分析,并撰写文字解读报告,不仅具有效率高的优点,而且不依赖人员的经验,可以在保证提高工作效率的同时,还能够保证客观有效的利用dhi报告的信息,进而保证解读的准确性,能够更好的辅助牧场管理人员根据实际生产、管理情况,对照解读结果,排除并定位导致dhi测定指标异常的原因。
附图说明
59.图1为dhi领域本体示意图;
60.图2为基于知识图谱的dhi报告解读方法的流程示意图。
具体实施方式
61.具体实施方式一:
62.本实施方式所述的一种基于知识图谱的dhi报告解读方法,包括以下步骤:
63.1、dhi领域知识图谱构建:
64.(1)构造dhi领域本体,如图1所示,dhi领域本体包含“性能指标/症状”、“影响因素”、“解决措施”三类实体及实体关系;所述性能指标/症状是指奶牛所体现的用于呈现健康状态的指标或者奶牛所体现的症状;
65.例如:性能指标为“体细胞异常”,其影响因素之一是饲料原料存在问题,该问题还可能表现出“乳脂率低”、“蹄病发病率上升”等症状;
66.(2)将dhi测定与应用指导相关的专业书籍、文献电子化后得到的电子文本作为标注对象,以本体为标注依据,对电子文本数据进行语义标注,形成标注数据;
67.(3)利用标注数据中的数据作为训练数据,按照dhi领域知识图谱的本体结构,采用有监督、半监督和无监督的方法从百度百科等互联网文本中抽取实体和实体关系,得到扩充数据,形成完整的dhi领域知识图谱。
68.(4)对于dhi知识图谱中包含“影响因素”和“性能指标/症状”两类实体的三元组,计算两类实体之间的条件概率,记为p(fac|sym),作为实体之间边的权重。
69.p(fac|sym)通过众包计算方式获得,即:通过众包软件将有可能导致某性能指标/症状的所有影响因素提供给参与者(牧场生产人员、牧场管理人员、领域专家等),由各个参
与者对这些因素的影响程度进行排序并打分,例如:导致性能指标“脂蛋比偏高”的影响因素有“饲料中添加过瘤胃脂肪”、“热应激”、“干物质采食量不足”、“瘤胃菌体蛋白合成不足”等4个,分别记为i1、i2、i3、i4,参与者a排序及打分结果为i1(0.6)、i3(0.2)、i2(0.1)、i4(0.1),参与者b排序及打分结果为i1(0.4)、i2(0.2)、i3(0.2)、i4(0.2),参与者c排序及打分结果为i1(0.4)、i4(0.2)、i2(0.1)、i3(0.1),参与者d排序及打分结果为i1(0.5)、i3(0.2)、i4(0.2)、i2(0.1),以此即可获得若干参与者的经验数据;
70.根据数据,按照先排序后打分的原则计算各影响因素与某性能指标/症状的权重,即按少数服从多数,从每一位次中选择该位次中出现次数最多的影响因素作为该位次的影响因素,并对该位次中该影响因素的参与者打分值求平均值,作为该影响因素与该性能指标/症状之间的权重;
71.例如:基于上述参与者a、b、c、d的数据,首先对各影响因素排序,在a、b、c、d四个参与者数据中,为了排序方便和计算权重具有统一的标准,本实施方式中将每个参数者所有的性能指标的分值总和确定为1,实际上每个分数就是对应的概率,概率总和为1,其中a四个指标i1、i2、i3、i4打分0.6、0.1、0.2、0.1,当对其进行排序后为i1、i3、i2、i4;基于a、b、c、d四个参与者数据,在第一位次中i1出现次数最多,因此i1处于第一位次;在第二位次中i3出现次数最多,因此i3处于第二位次;以此类推,得到排序结果为i1、i3、i2、i4。其次,基于确定的排序结果,按照第一位次至最后位次的顺序,选取出在相应位次中给出了对应位次参与者的打分计算排序后处于各位次影响因素与性能指标/症状的权重,对于i1,计算参与者a、b、c、d都在第一位次给出了i1,那么计算所有参与者给出i1打分的均值,得到i1权重为(0.6 0.4 0.4 0.5)/4=0.475;对于i3,计算参与者a、d在第二位次给出了i3,那么计算a、d给出i3打分的均值,得到i3权重为(0.2 0.2)/2=0.2;对于i2,计算参与者a、c打分的均值,得到i2权重为(0.1 0.1)/2=0.1;对于i4,计算参与者a、b打分的均值,得到i4权重为(0.1 0.2)/2=0.15。以此类推,即可得到各个性能指标/症状与各个影响因素之间的关联强度,构成相关性系数矩阵,表示性能指标/症状与影响因素两类实体之间边的权重。
72.特别地,众包软件除向众包参与者提供固定的影响因素供其排序打分外,还提供影响因素补充功能,即参与者认为问题所提供的固定影响因素不足时,可反馈新的影响因素,并同固定影响因素一起排序打分,反馈众包系统,经过统计并经过领域专家确认后,将新的影响因素作为实体节点更新到知识图谱中,对应的权重值作为该影响因素与性能指标/症状之间边的权重。例如:性能指标“脂蛋比偏高”的影响因素有i1、i2、i3、i4,参与者e接到问题后,认为“蛋白质质量不理想”也可能导致“脂蛋比偏高”,则参与者e可添加该影响因素,记为i5,并对i1、i2、i3、i4、i5进行排序打分后,反馈众包系统。
73.2、dhi指标数据获取:
74.获取牧场的dhi数据,dhi指标数据包括本月数据和历史数据两种,本月数据直接使用dhi检测中心根据中国奶牛生产性能测定分析系统(cndhi)制作完成的dhi报告文件,通过软件自动提取得到,该方法简单、高效,能够提供基础测定数据及相关统计指标,例如平均产犊间隔、泌乳天数、乳脂率、蛋白率、脂蛋比、高峰奶、高峰日、持续力、尿素氮等;历史数据则通过软件遍历历史dhi报告文件中的相关指标数据,按照既定的字段获取关指标数据存入数据库。
75.3、指标数据统计分析:
76.分析指标数据包括静态分析和动态分析两方面;
77.静态分析是根据各项指标的本月数据,按照各指标正常范围值标准,找到异常指标,并对应形成事实描述,例如脂蛋比正常范围值为1.12

1.30,若本月脂蛋比的值为1.54,则表现为“脂蛋比偏高”;
78.动态分析是结合各指标的本月数据和历史数据,分析各指标近期的变化规律,并对应形成事实描述,例如产奶量上两个月的值分别为41.6kg和30.0kg,若本月产奶量值为24.4kg,则表现为“产奶量持续下降”。
79.4、问题诊断:
80.结合dhi领域知识图谱对动态分析的结果进行问题诊断,问题诊断包括问题定位和指导措施建议两方面;
81.问题定位是基于dhi领域知识图谱,将动态分析的事实描述作为“性能指标/症状”实体,计算得到事实描述是由某种影响因素影响而发生的概率,记为p(fac):
82.p(fac)=p(fac|sym)
·
p
prior
(sym)
83.其中,p(fac|sym)是性能指标/症状与影响因素之间的条件概率,也就是实体之间边的权重;p
prior
(sym)为性能指标/症状的先验概率,p
prior
(sym)初始值根据历史dhi报告及牧场记录数据统计计算得到,即:性能指标的先验概率为历史dhi报告中出现该指标异常的报告数占总报告数的比重;症状的先验概率为牧场记录数据中出现该症状的奶牛数占奶牛总数的比重。此外,p
prior
(sym)可逐月更新,例如:5月份时,计算p
prior
(sym)的值采用截至4月份的dhi报告及牧场记录数据;6月份时,计算p
prior
(sym)的值采用截至5月份的dhi报告及牧场记录数据;
84.指导措施建议是根据定位得到的影响因素,从dhi领域知识图谱中根据“影响因素”与“解决措施”两类实体之间的关系,找到该影响因素对应的解决措施,反馈给用户。
85.系统流程及模块构成如图2所示。
86.实施例
87.(1)根据某牧场本月dhi报告,提取到其全群平均乳脂率为4.24%,乳蛋白率为2.76%,脂蛋比为1.54;高脂蛋比牛群的平均尿素氮水平为22.33毫克/100毫升;
88.(2)脂蛋比的标准范围为1.12

1.30,该牛群脂蛋比1.54>1.30,判定该牛群存在“脂蛋比偏高”问题,对应生成“脂蛋比偏高”的事实描述;尿素氮水平的标准范围为10

18毫克/100毫升,该牛群中高脂蛋比牛群平均尿素氮水平22.33毫克/100毫升>18毫克/100毫升,判定该部分牛群存在“尿素氮水平过高”问题,对应生成“高脂蛋比牛群尿素氮水平过高”的事实描述;
89.(3)依据dhi领域知识图谱,根据“脂蛋比偏高”指标,初步定位影响因素为“饲料中添加过瘤胃脂肪”,结合“高脂蛋比牛群尿素氮水平过高”症状,进一步定位影响因素为“饲料蛋白过剩和能量不足”、“蛋白质质量不理想”、“饲料中的粗蛋白未被有效利用”。
90.(4)依据dhi领域知识图谱,根据(3)中的影响因素,对应找到解决措施,分别为“增加蛋白源中过瘤胃蛋白质的供给”、“在饲料中添加有益菌”、“在饲槽中放置舔砖”。
91.通过以上过程,能够自动分析并定位dhi指标异常所反映的牧场生产、管理问题,并对应给出解决措施,极大地减轻了dhi检测中心dhi报告分析人员的负担,且提高了dhi测定的实用性,有助于dhi测定工作在我国的全面推广。
92.本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献