一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于进行医疗导诊的方法及装置、电子设备、存储介质

2023-02-10 19:10:10 来源:中国专利 TAG:


1.本技术涉及深度学习技术领域,例如涉及一种用于进行医疗导诊的方法及装置、电子设备、存储介质。


背景技术:

2.目前,由于分诊制度的薄弱,门诊病人一般在没有卫生专业人员转诊的情况下到大医院就诊。由于不知道应该在哪个医疗专业部门登记,门诊病人不得不排长队咨询接待人员或者通过医院的医疗导诊系统来实现对患者的导诊。
3.在实现本公开实施例的过程中,发现相关技术中至少存在如下问题:
4.相关技术中在通过医疗导诊系统对用户进行导诊时,由于传统的文本嵌入向量是线性的,难以获取用户主诉文本中的上下文信息,从而导致医疗导诊的准确性低、医疗导诊效果差的情况,难以满足用户的需求。


技术实现要素:

5.为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
6.本公开实施例提供了一种用于进行医疗导诊的方法及装置、电子设备、存储介质,以能够提高医疗导诊的准确性。
7.在一些实施例中,所述用于进行医疗导诊的方法,包括:获取用户咨询文本,利用预设的预训练模型获取所述用户咨询文本对应的第一特征嵌入向量,所述预训练模型用于获取融合上下文信息的特征嵌入向量。利用预设的医学知识图谱获取所述用户咨询文本对应的医学知识实体,所述医学知识图谱中存储有多个医学知识实体和各医学知识实体之间的实体关系。获取所述医学知识实体对应的第二特征嵌入向量。利用所述第一特征嵌入向量和所述第二特征嵌入向量进行知识融合,获得第三特征嵌入向量。根据所述第一特征嵌入向量和所述第三特征嵌入向量确定所述用户咨询文本对应的导诊科室。
8.在一些实施例中,利用预设的预训练模型获取所述用户咨询文本对应的第一特征嵌入向量,包括:将所述用户咨询文本输入所述预训练模型中,获得所述用户咨询文本对应的第一备选特征嵌入向量。利用预设的卷积神经网络对第一备选特征嵌入向量进行降维处理,获得所述用户咨询文本对应的第一特征嵌入向量。
9.在一些实施例中,利用预设的医学知识图谱获取所述用户咨询文本对应的医学知识实体,包括:对所述用户咨询文本进行实体识别获得备选实体集合,所述备选实体集合中包括若干个第一备选实体。从所述医学知识图谱中查找出与各所述第一备选实体存在实体关系的第二备选实体。将各所述第一备选实体和各所述第二备选实体确定为所述用户咨询文本对应的医学知识实体。
10.在一些实施例中,获取所述医学知识实体对应的第二特征嵌入向量,包括:将所述
医学知识实体输入预设的图神经网络模型中,获得所述医学知识实体对应的第二特征嵌入向量。
11.在一些实施例中,利用所述第一特征嵌入向量和所述第二特征嵌入向量进行知识融合,获得第三特征嵌入向量,包括:根据所述第一特征嵌入向量和所述第二特征嵌入向量获取所述医学知识实体对应的重要性。根据第一预设算法利用所述重要性和所述第二特征嵌入向量进行计算,获得所述第三特征嵌入向量。
12.在一些实施例中,根据所述第一特征嵌入向量和所述第二特征嵌入向量获取所述医学知识实体对应的重要性,包括:根据第二预设算法利用所述第一特征嵌入向量和所述第二特征嵌入向量进行计算,获得所述医学知识实体对应的第二备选特征嵌入向量。根据第三预设算法利用所述第二备选特征嵌入向量进行计算,获得所述医学知识实体对应的重要性。
13.在一些实施例中,根据所述第一特征嵌入向量和所述第三特征嵌入向量确定所述用户咨询文本对应的导诊科室,包括:将所述第一特征嵌入向量和所述第三特征嵌入向量进行连接,获得目标向量。根据第四预设算法利用所述目标向量进行计算,获得导诊科室的概率分布。将所述概率分布中概率最大的导诊科室确定为所述用户咨询文本对应的导诊科室。
14.在一些实施例中,所述用于进行医疗导诊的装置包括:处理器和存储有程序指令的存储器,所述处理器被配置为在执行所述程序指令时,执行上述用于进行医疗导诊的方法。
15.在一些实施例中,所述电子设备包括上述的用于进行医疗导诊的装置。
16.在一些实施例中,所述存储介质存储有程序指令,所述程序指令在运行时,执行上述的用于进行医疗导诊的方法。
17.本公开实施例提供的用于进行医疗导诊的方法及装置、电子设备、存储介质,可以实现以下技术效果:通过利用融合上下文信息的第一特征嵌入向量和融合医学知识图谱中知识的第三特征嵌入向量,这样能够获取用户咨询文本中的上下文信息,同时融合了医学知识图谱中的知识。根据第一特征嵌入向量和第三特征嵌入向量能够确定出更准确的导诊科室。提高了医疗导诊的准确性。
18.以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本技术。
附图说明
19.一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:
20.图1是本公开实施例提供的一个用于进行医疗导诊的方法的示意图;
21.图2是本公开实施例提供的一个医学知识实体的实体类型统计的示意图;
22.图3是本公开实施例提供的一个医学知识实体的实体关系统计的示意图;
23.图4是本公开实施例提供的一个用于进行医疗导诊的医疗导诊模型的结构示意图;
24.图5是本公开实施例提供的另一个用于进行医疗导诊的方法的示意图;
25.图6是本公开实施例提供的一个用于进行医疗导诊的装置的示意图。
具体实施方式
26.为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或多个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
27.本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开实施例的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
28.除非另有说明,术语“多个”表示两个或两个以上。
29.本公开实施例中,字符“/”表示前后对象是一种“或”的关系。例如,a/b表示:a或b。
30.术语“和/或”是一种描述对象的关联关系,表示可以存在三种关系。例如,a和/或b,表示:a或b,或,a和b这三种关系。
31.术语“对应”可以指的是一种关联关系或绑定关系,a与b相对应指的是a与b之间是一种关联关系或绑定关系。
32.结合图1所示,本公开实施例提供一种用于进行医疗导诊的方法,该方法包括:
33.步骤s101,电子设备获取用户咨询文本。
34.步骤s102,电子设备利用预设的预训练模型获取用户咨询文本对应的第一特征嵌入向量;预训练模型用于获取融合上下文信息的特征嵌入向量。
35.步骤s103,电子设备利用预设的医学知识图谱获取用户咨询文本对应的医学知识实体;医学知识图谱中存储有多个医学知识实体和各医学知识实体之间的实体关系。
36.步骤s104,电子设备获取医学知识实体对应的第二特征嵌入向量。
37.步骤s105,电子设备利用第一特征嵌入向量和第二特征嵌入向量进行知识融合,获得第三特征嵌入向量。
38.步骤s106,电子设备根据第一特征嵌入向量和第三特征嵌入向量确定用户咨询文本对应的导诊科室。
39.采用本公开实施例提供的用于进行医疗导诊的方法,通过利用融合上下文信息的第一特征嵌入向量和融合医学知识图谱中知识的第三特征嵌入向量,这样能够获取用户咨询文本中的上下文信息,同时融合了医学知识图谱中的知识。根据第一特征嵌入向量和第三特征嵌入向量能够确定出更准确的导诊科室。提高了医疗导诊的准确性。
40.进一步的,电子设备利用预设的预训练模型获取用户咨询文本对应的第一特征嵌入向量,包括:电子设备将用户咨询文本输入预训练模型中,获得用户咨询文本对应的第一备选特征嵌入向量。利用预设的卷积神经网络对第一备选特征嵌入向量进行降维处理,获得用户咨询文本对应的第一特征嵌入向量。其中,预设的预训练模型为bert(bidirectional encoder representation from transformers,基于transformers的双向编码器表示)预训练模型。预设的卷积神经网络为文本卷积神经网络textcnn network。
由于bert预训练模型中是采用深层的双向transformers组件,将用户咨询文本输入到bert预训练模型中,将用户咨询文本对应的向量映射到高维空间获得第一备选特征嵌入向量。然后利用预设的卷积神经网络对第一备选特征嵌入向量进行降维处理,从而能够生成融合了上下文信息的深层双向语言表征,即第一特征嵌入向量。
41.在一些实施例中,利用掩码语言模型masked language model对bert进行训练。然后对bert进行微调fine-tuning获得bert预训练模型。为了让bert预训练模型能够灵活地被应用于自然语言处理中的各类文本分析相关的下游任务,把文档中的单个句子用一些特殊字符拼接成定长且连续的文本流,即把[cls]表示为分类标记作为开始并且用符号[sep]把句子隔开。最后,根据一定比例随机地屏蔽输入中的分词token作为transformer编码器的输入。
[0042]
进一步的,电子设备将用户咨询文本输入预训练模型中,获得用户咨询文本对应的第一备选特征嵌入向量,包括:电子设备利用预训练模型获取用户咨询文本的文本长度,将该用户咨询文本的文本长度与预设文本长度进行对比,获得对比结果。根据对比结果获取第一备选特征嵌入向量。
[0043]
进一步的,电子设备根据对比结果获取第一备选特征嵌入向量,包括:电子设备在对比结果为该用户咨询文本的文本长度大于预设文本长度的情况下,将该用户咨询文本中超过预设文本长度的部分进行删除,获得目标文本。获取目标文本的特征嵌入向量,将该目标文本的特征嵌入向量确定为第一备选特征嵌入向量。其中,预设文本长度为100。
[0044]
在一些实施例中,用户咨询文本有110个字符,则用户咨询文本的文本长度为110。由于该用户咨询文本的文本长度大于100。则将从该用户咨询文本的末端开始,从后往前删除10个字符,使得用户咨询文本的文本长度与预设文本长度相同。
[0045]
进一步的,电子设备根据对比结果获取第一备选特征嵌入向量,包括:电子设备在对比结果为该用户咨询文本的文本长度等于预设文本长度的情况下,将该用户咨询文本确定为目标文本。获取目标文本的特征嵌入向量,将该目标文本的特征嵌入向量确定为第一备选特征嵌入向量。其中,预设文本长度为100。
[0046]
进一步的,电子设备根据对比结果获取第一备选特征嵌入向量,包括:电子设备在对比结果为该用户咨询文本的文本长度小于预设文本长度的情况下,将该用户咨询文本中小于预设文本长度的部分进行补0,获得目标文本。获取目标文本的特征嵌入向量,将该目标文本的特征嵌入向量确定为第一备选特征嵌入向量。其中,预设文本长度为100。
[0047]
在一些实施例中,用户咨询文本有80个字符,则用户咨询文本的文本长度为80。由于该用户咨询文本的文本长度小于100。则将从该用户咨询文本的末端开启进行补0,使得用户咨询文本的文本长度与预设文本长度相同。
[0048]
进一步的,电子设备利用预设的医学知识图谱获取用户咨询文本对应的医学知识实体,包括:电子设备对用户咨询文本进行实体识别获得备选实体集合,备选实体集合中包括若干个第一备选实体。从医学知识图谱中查找出与各第一备选实体存在实体关系的第二备选实体。将各第一备选实体和各第二备选实体确定为用户咨询文本对应的医学知识实体。这样,通过在医学知识图谱中获取用户咨询文本对应的医学知识实体,能够改善用户咨询文本中信息不足的问题。从而提高医疗导诊的准确性。
[0049]
在一些实施例中,用户咨询文本为“请问血脂偏高应该吃什么药”,通过对用户咨
询文本进行实体识别获得备选实体集合,备选实体集合中的第一备选实体包括“血脂”。从医学知识图谱中查找出与第一备选实体“血脂”存在实体关系的第二备选实体为“血脂异常”,实体关系为“疾病症状”。
[0050]
可选地,预设的医学知识图谱通过以下方式获得:对预设的医药信息网站进行数据爬取,获得非结构化网页数据,并将该非结构化网页数据存储到预设数据库中。对该非结构化网页数据进行命名实体识别,获得医学知识实体。按照预设类别对医学知识实体进行类别划分,并结构化的存储为预设数据格式。通过预设的图形数据库利用预设数据格式的数据和预设实体关系构造医学知识图谱。其中,预设数据库为mongodb数据库,预设数据格式为json数据格式,预设的图形数据库为neo4j图形数据库。其中,预设类别包括:疾病名称、症状和体征、就诊科室、检查检验和药品。预设实体关系包括:疾病所属诊室、疾病症状、所需检查、诊室对应科室、疾病并发症和治疗药物。这样,通过构建医学知识图谱能够在用户进行医疗查询时可视化的展示查询语句对应的结果。
[0051]
在一些实施例中,利用python网络爬虫对预设的医药信息网站,例如:“寻医问药”网站(http://www.xywy.com/)进行数据爬取,获得非结构化网页数据,并将该非结构化网页数据存储到mongodb数据库中。利用双向长短期记忆-条件随机场bi-lstm-crf算法对该非结构化网页数据进行命名实体识别,获得医学知识实体。按照预设类别对医学知识实体进行类别划分,并结构化的存储为json数据格式。通过neo4j图形数据库利用该json数据格式的数据和预设实体关系构造医学知识图谱。
[0052]
在一些实施例中,利用neo4j图形数据库所支持的浏览器能够预览医学知识实体和实体关系、执行预设的查询语句。其中,通过执行预设的查询语句能够实现对医学知识图谱的增、删、改、查。例如:通过执行查询语句:match(n:disease)where n.name=“感冒”return n,能够查询疾病名称为“感冒”的医学知识实体,并展示所有与“感冒”存在实体关系的医学知识实体和实体关系。
[0053]
结合图2和图3所示,图2是本公开实施例提供的一个医学知识实体的实体类型统计的示意图。图3是本公开实施例提供的一个医学知识实体的实体关系统计的示意图。图2中,实体类型包括疾病名称diseases、症状和体征symptoms、就诊科室departments、检查检验checks和药品drugs。其中,疾病名称diseases的实体数量共计8807种,例如:脑萎、急性肾炎综合征和小儿阅读障碍等。症状和体征symptoms的实体数量共计5998种,例如:局部头痛、发烧和肺泡出血等。就诊科室departments的实体数量共计54种,例如:普外科、肿瘤科、妇科和五官科等。检查检验checks的实体数量共计3353种,例如:粘稠度、关节检查和血红蛋白浓度等。药品drugs的实体数量共计3828种,例如:藿香正气胶囊、利鲁唑片和氟康唑颗粒等。所有医学知识实体的类型共计22040种。
[0054]
图3中,实体关系类型包括疾病所属诊室disease_department、疾病症状disease_symptom、疾病并发症complication、所需检查required_check、诊室对应科室department_department和治疗药物treat_drug。其中,疾病所属诊室disease_department的实体数量共计8807种,例如:《成人呼吸窘迫综合征,呼吸内科》。疾病症状disease_symptom的实体数量共计12052种,例如:《肺气肿,呼吸衰竭》。疾病并发症complication的实体数量共计54710种,例如:《百日咳,胸闷》。所需检查required_check的实体数量共计39531种,例如:《肺转移瘤,ct(computed tomography,电子计算机断层扫描)检查》。诊室对应科室
department_department的实体数量共计7976种,例如:《消化内科,内科》。治疗药物treat_drug的实体数量共计14656种,例如:《百日咳,穿心莲内酯片》。所有实体关系的类型共计137732种。
[0055]
在一些实施例中,备选实体集合中的第一备选实体包括:冠心病。从医学知识图谱中查找出与冠心病存在实体关系的第二备选实体包括:回心康片、速效救心丸、益安宁丸、益心酮片、通脉颗粒、同溢堂、静息显像、动态心电图、酶学检查、运动显像、心电图、猝死、风湿热、更年期综合征、二尖瓣关闭不全、心率失常、呼吸困难、心悸、心慌、心力衰竭、慢性房颤、心跳过速、乏力和心内科等等。其中,回心康片、速效救心丸、益安宁丸、益心酮片、通脉颗粒和同溢堂分别与冠心病之间的实体关系为治疗药物treat_drug。静息显像、动态心电图、酶学检查、运动显像分别与冠心病之间的实体关系为所需检查required_check。猝死、风湿热、更年期综合征和二尖瓣关闭不全分别与冠心病之间的实体关系为疾病并发症complication。心率失常、呼吸困难、心悸、心慌、心力衰竭、慢性房颤、心跳过速和乏力分别与冠心病之间的实体关系为疾病症状disease_symptom。心内科与冠心病之间的实体关系为疾病所属诊室disease_department。
[0056]
进一步的,电子设备获取医学知识实体对应的第二特征嵌入向量,包括:电子设备将医学知识实体输入预设的图神经网络模型中,获得医学知识实体对应的第二特征嵌入向量。其中,预设的图神经网络模型为compgcn(composition-based multi-relational graph convolutional networks,多关系异质图神经网络)模型。这样,通过compgcn模型能够获取医学知识图谱中各实体的特征嵌入向量,便于将医学知识图谱中的知识进行融合,能够解决用户咨询文本的描述不充分的问题。
[0057]
进一步的,电子设备将医学知识实体输入预设的图神经网络模型中,获得医学知识实体对应的第二特征嵌入向量,包括:通过计算获得第i个医学知识实体对应的第二特征嵌入向量。其中,u为第一备选实体,r为第一备选实体之间的实体关系,用于表征对和进行合成。为compgcn模型中第l层第一备选实体的嵌入,l为compgcn模型的网络层数,为compgcn模型中第l层第二备选实体之间的实体关系的嵌入。ki为第二备选实体,n(ki)为第二备选实体的集合。为设定的实体关系参数,该实体关系参数通过模型学习获得。
[0058]
进一步的,电子设备利用第一特征嵌入向量和第二特征嵌入向量进行知识融合,获得第三特征嵌入向量,包括:电子设备根据第一特征嵌入向量和第二特征嵌入向量获取医学知识实体对应的重要性。根据第一预设算法利用重要性和第二特征嵌入向量进行计算,获得第三特征嵌入向量。这样,通过利用第一特征嵌入向量和第二特征嵌入向量进行知识融合,获得第三特征嵌入向量,这样能够利用双重注意力机制减轻文本和知识实体中的噪声数据的干扰,从而能够提高医疗导诊的准确性。
[0059]
进一步的,电子设备根据第一特征嵌入向量和第二特征嵌入向量获取医学知识实体对应的重要性,包括:电子设备根据第二预设算法利用第一特征嵌入向量和第二特征嵌入向量进行计算,获得医学知识实体对应的第二备选特征嵌入向量。根据第三预设算法利用第二备选特征嵌入向量进行计算,获得医学知识实体对应的重要性。
[0060]
进一步的,电子设备根据第二预设算法利用第一特征嵌入向量和第二特征嵌入向量进行计算,获得医学知识实体对应的第二备选特征嵌入向量,包括:电子设备通过计算gi=tanh(w1[zi⊕rt
])获得医学知识实体对应的第二备选特征嵌入向量。其中,gi为第i个医学知识实体对应的第二备选特征嵌入向量。w1为预设的第一可学习权重矩阵,zi为第i个医学知识实体对应的第二特征嵌入向量,r
t
为用户咨询文本对应的第一特征嵌入向量。

用于表征向量拼接。
[0061]
进一步的,电子设备根据第三预设算法利用第二备选特征嵌入向量进行计算,获得医学知识实体对应的重要性,包括:电子设备通过计算获得医学知识实体对应的重要性。其中,αi为第i个医学知识实体对用户咨询文本的重要性,为预设的第二可学习权重矩阵的转置矩阵,gi为第i个医学知识实体对应的第二备选特征嵌入向量。
[0062]
进一步的,电子设备根据第一预设算法利用重要性和第二特征嵌入向量进行计算,获得第三特征嵌入向量,包括:电子设备通过计算获得第三特征嵌入向量。其中,kr为第三特征嵌入向量,j为医学知识实体的总数量,αi为第i个医学知识实体对用户咨询文本的重要性,zi为第i个医学知识实体对应的第二特征嵌入向量。
[0063]
进一步的,电子设备根据第一特征嵌入向量和第三特征嵌入向量确定用户咨询文本对应的导诊科室,包括:电子设备将第一特征嵌入向量和第三特征嵌入向量进行连接,获得目标向量。根据第四预设算法利用目标向量进行计算,获得导诊科室的概率分布。将概率分布中概率最大的导诊科室确定为用户咨询文本对应的导诊科室。
[0064]
进一步的,电子设备将第一特征嵌入向量和第三特征嵌入向量进行连接,获得目标向量,包括:电子设备通过计算q=[r
t

kr]获得目标向量。其中,q为目标向量,kr为第三特征嵌入向量,r
t
为用户咨询文本对应的第一特征嵌入向量。

用于表征向量拼接。
[0065]
进一步的,根据第四预设算法利用目标向量进行计算,获得导诊科室的概率分布,包括:通过计算p(y|s)=softmax(tanh(wq b))获得导诊科室的概率分布。其中,p(y|s)为导诊科室的概率分布,w为全连接层的权重,b为全连接层的偏置值,q为目标向量。
[0066]
进一步的,通过以下方式获得概率分布中概率最大的导诊科室:通过计算获得概率最大的导诊科室。其中,为概率最大的导诊科室,p(y|s)为导诊科室的概率分布。
[0067]
可选地,结合图4所示,本公开实施例提供一个用于进行医疗导诊的医疗导诊模型的结构示意图。其中,医疗导诊模型为kian(knowledge interactive attention network,知识交互的注意力网络)模型。该医疗导诊模型包括文本特征提取模块、外部知识嵌入模块、注意力机制与知识融合模块和输出模块。其中,文本特征提取模块用于利用预设的预训练模型获取用户咨询文本对应的第一特征嵌入向量。文本特征提取模块利用bert预训练模型将用户咨询文本中的每个字符或单词映射到高维向量空间,然后利用文本卷积神经网络textcnn network对第一备选特征嵌入向量进行降维处理,获得用户咨询文本对应的第一特征嵌入向量。外部知识嵌入模块用于对用户咨询文本进行命名实体识别获得备选实体集合,然后从预设的医学知识图谱中查询出与备选实体集合中各第一备选实体存在实体关系
的第二备选实体,并将第一备选实体和第二备选实体确定为医学知识实体。然后利用预设的图神经网络模型compgcn获取医学知识实体对应的第二特征嵌入向量。注意力机制与知识融合模块用于将第一特征嵌入向量和第二特征嵌入向量进行加权计算,获得第三特征嵌入向量。其中,加权计算符号为这样能够通过注意力机制整合从医学知识图谱中获取的外部知识嵌入,利用双重注意力机制减轻文本和知识实体中的噪声数据的干扰,从而能够提高医疗导诊的准确性。输出模块用于将第一特征嵌入向量和第三特征嵌入向量进行连接,获得目标向量。并通过全连接层和归一化指数函数softmax函数计算获得导诊科室的概率分布。然后将概率最大的导诊科室确定为用户咨询文本对应的导诊科室。这样,由于kian模型结合了医学知识图谱和深度学习,相较于传统的线性文本嵌入模型,本技术通过bert模型获取用户咨询文本的上下文信息,并融合了医学知识图谱中的外部知识。能够解决用户咨询文本中描述不充分的问题,从而能够提高用户在进行医疗导诊时的准确性。
[0068]
kian医疗导诊模型系统以根据门诊病人的主要投诉为他们确定合适的医疗部门。此外,kian医疗导诊模型系统可以促进新兴的在线医院注册和在线医疗诊断服务,这需要门诊病人首先知道正确的部门。因为门诊病人的主诉一般都很简短,而且包含很多噪声信息。为了解决这个问题,通过加入医学知识图谱,一个整合外部医学知识源的深度学习框架。同时还提出了一种双注意机制,以减轻噪声词和知识实体的干扰。
[0069]
可选地,通过预设的损失函数对该医疗导诊模型进行优化。其中预设的损失函数为最大似然估计函数,即其中,l(θ)为损失值,θ为该医疗导诊模型中的所有参数的集合,s为训练样本集合,训练样本集合中包括多个样本用户咨询文本。s为样本用户咨询文本,为样本用户咨询文本s对应的真实标签。
[0070]
结合图5所示,本公开实施例提供一种用于进行医疗导诊的方法,该方法包括:
[0071]
步骤s501,电子设备获取用户咨询文本。
[0072]
步骤s502,电子设备利用预设的预训练模型获取用户咨询文本对应的第一特征嵌入向量;预训练模型用于获取融合上下文信息的特征嵌入向量。
[0073]
步骤s503,电子设备利用预设的医学知识图谱获取用户咨询文本对应的医学知识实体;医学知识图谱中存储有多个医学知识实体和各医学知识实体之间的实体关系。
[0074]
步骤s504,电子设备获取医学知识实体对应的第二特征嵌入向量。
[0075]
步骤s505,电子设备利用第一特征嵌入向量和第二特征嵌入向量进行知识融合,获得第三特征嵌入向量。
[0076]
步骤s506,电子设备将第一特征嵌入向量和第三特征嵌入向量进行连接,获得目标向量。
[0077]
步骤s507,电子设备根据第四预设算法利用目标向量进行计算,获得导诊科室的概率分布。
[0078]
步骤s508,电子设备将概率分布中概率最大的导诊科室确定为用户咨询文本对应的导诊科室。
[0079]
采用本公开实施例提供的用于进行医疗导诊的方法,通过利用融合上下文信息的第一特征嵌入向量和融合医学知识图谱中知识的第三特征嵌入向量,这样能够获取用户咨询文本中的上下文信息,同时融合了医学知识图谱中的知识。通过将第一特征嵌入向量和
第三特征嵌入向量进行连接获得目标向量,然后根据目标向量获取导诊科室的概率分布,这样能够确定出更准确的导诊科室。提高了医疗导诊的准确性。
[0080]
结合图6所示,本公开实施例提供一种用于进行医疗导诊的装置,包括处理器(processor)600和存储器(memory)601。可选地,该装置还可以包括通信接口(communication interface)602和总线603。其中,处理器600、通信接口602、存储器601可以通过总线603完成相互间的通信。通信接口602可以用于信息传输。处理器600可以调用存储器601中的逻辑指令,以执行上述实施例的用于进行医疗导诊的方法。
[0081]
采用本公开实施例提供的用于进行医疗导诊的装置,通过利用融合上下文信息的第一特征嵌入向量和融合医学知识图谱中知识的第三特征嵌入向量,这样能够获取用户咨询文本中的上下文信息,同时融合了医学知识图谱中的知识。根据第一特征嵌入向量和第三特征嵌入向量能够确定出更准确的导诊科室。提高了医疗导诊的准确性。
[0082]
此外,上述的存储器601中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
[0083]
存储器601作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令/模块。处理器600通过运行存储在存储器601中的程序指令/模块,从而执行功能应用以及数据处理,即实现上述实施例中用于进行医疗导诊的方法。
[0084]
存储器601可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器601可以包括高速随机存取存储器,还可以包括非易失性存储器。
[0085]
本公开实施例提供了一种电子设备,包括上述的用于进行医疗导诊的装置。
[0086]
可选地,电子设备包括计算机、平板电脑或服务器等设备。
[0087]
采用本公开实施例提供的电子设备,通过利用融合上下文信息的第一特征嵌入向量和融合医学知识图谱中知识的第三特征嵌入向量,这样能够获取用户咨询文本中的上下文信息,同时融合了医学知识图谱中的知识。根据第一特征嵌入向量和第三特征嵌入向量能够确定出更准确的导诊科室。提高了医疗导诊的准确性。
[0088]
本公开实施例提供了一种存储介质,存储有程序指令,程序指令在运行时,执行上述用于进行医疗导诊的方法。
[0089]
本公开实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述用于进行医疗导诊的方法。
[0090]
上述的计算机可读存储介质可以是暂态计算机可读存储介质,也可以是非暂态计算机可读存储介质。
[0091]
本公开实施例的技术方案可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括一个或多个指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质,包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
[0092]
以上描述和附图充分地示出了本公开的实施例,以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。而且,本技术中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的,除非上下文清楚地表明,否则单数形式的“一个”(a)、“一个”(an)和“所述”(the)旨在同样包括复数形式。类似地,如在本技术中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外,当用于本技术中时,术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素,和/或组件的存在,但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下,由语句“包括一个
…”
限定的要素,并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。本文中,每个实施例重点说明的可以是与其他实施例的不同之处,各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言,如果其与实施例公开的方法部分相对应,那么相关之处可以参见方法部分的描述。
[0093]
本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,可以取决于技术方案的特定应用和设计约束条件。所述技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能,但是这种实现不应认为超出本公开实施例的范围。所述技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0094]
本文所披露的实施例中,所揭露的方法、产品(包括但不限于装置、设备等),可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,可以仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例。另外,在本公开实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0095]
附图中的流程图和框图显示了根据本公开实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。在附图中的流程图和框图所
对应的描述中,不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生,有时不同的操作或步骤之间不存在特定的顺序。例如,两个连续的操作或步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献