一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种体检项目推荐方法、装置、设备及介质与流程

2021-11-05 22:45:00 来源:中国专利 TAG:


1.本发明涉及医疗和人工智能技术领域,特别涉及一种体检项目推荐方法、装置、设备及介质。


背景技术:

2.随着人们生活质量的逐步提高,人民群众对于健康体检的需求也越来越多,健康体检也正在逐渐成为门诊体检之外的体检中心的主流业务。然而,现在大多数的体检机构都是针对年龄和性别制定体检套餐,然后由消费者进行选择。
3.这种方式存在以下问题:(1)市面上买的体检套餐基本都是标准化产品,没有考虑患者自身一些个性化的风险因素,缺少针对性,难以满足用户的个性化需求;(2)用户缺少医疗知识,无法自己判断体检时是否要增加哪些项目; (3)医疗机构推荐的加项没有基于用户自身健康情况。
4.需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现要素:

5.本发明的目的在于提供一种体检项目推荐方法、装置、设备及介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
6.为实现上述目的及其他相关目的,本发明提供一种体检项目推荐方法,包括:
7.响应于当前用户的体检预约指令,获取当前用户的历史体检报告,其中,所述体检预约指令包含当前用户已选择的基础体检套餐;
8.提取所述当前用户的历史体检报告中的疾病关键词,并将所述疾病关键词转换为疾病标签;
9.将所述当前用户的历史体检报告中的疾病标签和当前用户的用户基本属性输入到体检项目推荐模型中,通过所述体检项目推荐模型的输出结果确定体检项目推荐集,所述体检项目推荐模型通过将所述当前用户的历史体检报告中的疾病标签和当前用户的用户基本属性与各体检项目进行匹配,以获取每个体检项目的推荐系数,并根据所述推荐系数的大小确定需推荐的体检项目以构成所述体检项目推荐集,其中,所述体检项目推荐模型采用多分类多标签深度神经网络模型;
10.推荐所述体检项目推荐集至当前用户;
11.接收当前用户从所述体检项目推荐集中选择的体检项目,并将当前用户选择的体检项目添加到所述基础体检套餐中以生成体检套餐。
12.在本发明的一个实施例中,所述历史体检报告包括体检系统中已存在的当前用户的体检报告和当前用户在用户端自行上传的体检报告。
13.在本发明的一个实施例中,所述提取所述当前用户的历史体检报告中的疾病关键词,并将所述疾病关键词转换为疾病标签的步骤包括:
14.对所述历史体检报告进行文本提取,以获取报告文本;
15.提取所述报告文本中的疾病关键词;
16.将所述报告文本中的疾病关键词转换为标准的疾病名称,以获取所述历史体检报告中的疾病标签。
17.在本发明的一个实施例中,所述将所述报告文本中的疾病关键词转换为标准的疾病名称的步骤包括,根据预存的疾病关键词的映射关系,将疾病关键词转换成标准的疾病名称。
18.在本发明的一个实施例中,根据所述推荐系数的大小确定需推荐的体检项目以构成所述体检项目推荐集的步骤包括:
19.选取推荐系数大于或等于预设阈值的体检项目构成初始体检项目推荐集;
20.从所述初始体检项目推荐集中剔除当前用户已选的基础体检套餐中已经存在的体检项目,以获取所述体检项目推荐集。
21.在本发明的一个实施例中,所述多分类多标签深度神经网络模型是以体检系统中所有用户的体检报告中的疾病标签、用户基本属性、及对应的体检项目作为数据集进行训练。
22.在本发明的一个实施例中,所述多分类多标签深度神经网络模型的代价函数如下:
[0023][0024]
其中:
[0025]
j(θ)为代价函数;
[0026]
x
(i)
为疾病标签和用户基本属性集;
[0027]
y
(i)
为对应的体检项目集;
[0028]
m为训练样本数量;
[0029]
h
θ
(x)为预测函数;
[0030]
θ为预测函数的参数向量;
[0031]
n为预测函数的参数向量的个数;
[0032]
λ为梯度下降时的步长;
[0033]
所述多分类多标签深度神经网络模型根据所述代价函数的值判断是否训练成功,其中,通过梯度下降法,不断计算并优化预测函数的参数向量,使所述代价函数的值降到预设范围,以得到训练好的多分类多标签深度神经网络模型。
[0034]
在本发明的一个实施例中,所述体检项目推荐方法还包括:获取当前用户根据所述体检套餐完成体检后生成的新的体检报告中的疾病关键词,并将所述疾病关键词转换为疾病标签;
[0035]
将当前用户的所述新的体检报告中的疾病标签、当前用户的用户基本属性及当前用户的所述体检套餐中的体检项目作为训练样本,来对所述体检项目推荐模型进行训练。
[0036]
为实现上述目的及其他相关目的,本发明还提供一种体检项目推荐装置,所述体检项目推荐装置包括:
[0037]
报告获取模块,用于响应于当前用户的体检预约指令,获取当前用户的历史体检报告;
[0038]
标签提取模块,用于提取所述当前用户的历史体检报告中的疾病关键词,并将所述疾病关键词转换为疾病标签;
[0039]
项目推荐模块,用于将所述当前用户的历史体检报告中的疾病标签和当前用户的用户基本属性输入到体检项目推荐模型中,通过所述体检项目推荐模型的输出结果确定体检项目推荐集,所述体检项目推荐模型通过将所述当前用户的历史体检报告中的疾病标签和当前用户的用户基本属性与各体检项目进行匹配,以获取每个体检项目的推荐系数,并根据所述推荐系数的大小确定需推荐的体检项目以构成所述体检项目推荐集,其中,所述体检项目推荐模型采用多分类多标签深度神经网络模型;
[0040]
项目发送模块,用于推荐所述体检项目推荐集至当前用户;
[0041]
套餐生成模块,接收当前用户从所述体检项目推荐集中选择的体检项目,并将当前用户选择的体检项目添加到所述基础体检套餐中以生成体检套餐。
[0042]
为实现上述目的及其他相关目的,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
[0043]
为实现上述目的及其他相关目的,本发明还提供一种计算机可读存储介质,其上存储于计算机程序,所述计算机程序被处理器执行时实现现上述方法的步骤。
[0044]
本发明的体检项目推荐方法、装置、设备及介质,可以根据用户的历年体检结果自动给用户推荐适合用户身体状况的体检项目,然后用户从推荐的体检项目中选择所需的体检项目加入到基础体检套餐中,形成最终的体检套餐,做到了千人千面,让用户能有针对性的进行健康检查,提高用户对体检产品有效性的信赖。
[0045]
本发明的体检项目推荐方法、装置、设备及介质,可通过分析已有的全量用户的体检报告的用户基本属性、疾病标签及体检项目,自动学习体检项目推荐模型,同时用户的每次加项选择操作对应的用户属性、疾病标签和体检项目信息,又做为推荐模型的样本输入到体检项目推荐模型中来进一步的训练优化推荐模型,做到了无需人工参与的智能自动推荐。
[0046]
本发明的体检项目推荐方法、装置、设备及介质,多分类多标签深度神经网络模型通过感知当前用户的加项选择,不断学习,从而提高推荐准确率。
[0047]
本发明的体检项目推荐方法、装置、设备及介质,体检机构可以通过系统中的体检报告数据,分析出不同人员需求量最大的检测项目,给体检机构合理设置体检套餐项目提供数据参考。
附图说明
[0048]
图1示出了本发明的体检项目推荐方法的较佳实施例的流程图。
[0049]
图2示出了本发明的体检项目推荐方法的较佳实施例的步骤s20的子步骤流程图。
[0050]
图3示出了本发明的体检项目推荐方法的较佳实施例的步骤s30的子步骤流程图。
[0051]
图4示出了本发明的体检项目推荐装置的较佳的实施例的功能模块图。
[0052]
图5示出了本发明的实现体检项目推荐方法的较佳实施例的电子设备的结构示意
图。
具体实施方式
[0053]
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
[0054]
请参阅图1

5。需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
[0055]
图1示出了本发明的体检项目推荐方法的较佳实施例的流程图。
[0056]
所述体检项目推荐方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(application specific integratedcircuit,asic)、可编程门阵列(field-programmable gate array,fpga)、数字处理器(digital signal processor,dsp)、嵌入式设备等。
[0057]
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(personal digital assistant, pda)、游戏机、交互式网络电视(internet protocol television,iptv)、智能式穿戴式设备等。
[0058]
所述电子设备还可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算 (cloud computing)的由大量主机或网络服务器构成的云。
[0059]
所述电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(virtual private network,vpn)等。
[0060]
下面将结合图1来详细阐述本发明的体检项目推荐方法。
[0061]
一种体检项目推荐方法,包括:
[0062]
首先,执行步骤s10,响应于当前用户的体检预约指令,获取当前用户的历史体检报告,其中,所述体检预约指令包含当前用户已选择的基础体检套餐。所述历史体检报告包括体检系统中已存在的当前用户的体检报告和当前用户在用户端自行上传的体检报告。
[0063]
当前用户在平安健康app上预约体检,会进入体检套餐推荐页面,用户可从体检套餐推荐页面选择一种标准的基础体检套餐,该基础体检套餐中包括若干项体检项目,基础体检套餐由于是标准化产品,缺少针对性,难以满足用户的个性化需求。因此,体检系统开始推荐逻辑,体检系统会响应于当前用户的体检预约指令,获取当前用户的历史体检报告。获取当前用户的历史体检报告时,除了直接从系统的体检报告数据库中调用已经存在的当前用户的体检报告外,还可以是用户在平安健康app上自行上传以前的体检报告。
[0064]
接着,执行步骤s20、提取所述当前用户的历史体检报告中的疾病关键词并将所述疾病关键词转换为疾病标签。
[0065]
图2示出了本发明的体检项目推荐方法的较佳实施例的步骤s20的子步骤流程图。
如图2所示,所述提取所述当前用户的历史体检报告中的疾病关键词并将所述疾病关键词转换为疾病标签的步骤可以进一步包括:
[0066]
步骤s21、对所述历史体检报告进行文本提取,以获取报告文本;
[0067]
步骤s22、提取所述报告文本中的疾病关键词;
[0068]
步骤s23、将所述报告文本中的疾病关键词转换为标准的疾病名称,以获取所述历史体检报告中的疾病标签。
[0069]
在步骤s21中,在对体检报告进行文本提取时,需要根据体检报告的文件格式采用相应的文本提取流程进行文本提取,以获取体检报告文本信息,文件格式例如可以采用pdf格式,jpeg、png等图片格式,或word格式。
[0070]
例如:针对pdf格式的体检报告,可使用开源、基于java的、支持pdf 文档生成的apache pdfbox工具库,提取用户体检报告的整份报告或报告中的某页的文本信息;针对jpeg、png等图片格式的体检报告,可使用ocr技术提取用户体检报告的文本信息;针对word格式的体检报告,可使用poi,poi

ooxml 或poi

scratchpad框架提取用户体检报告中的文本信息。
[0071]
在步骤s22中,提取所述报告文本中的疾病关键词时,可以结合医学术语提取规则模型来对报告文本中的疾病关键词进行提取。
[0072]
在步骤s23中,由于不同体检机构对于疾病关键词的名称存在差异,在进行体检项目推荐时,需要根据体检预存的疾病关键词的映射关系(提前维护在系统中),将疾病关键词转换成标准的疾病名称,也即疾病标签。例如:报告文本中有疾病关键字【左叶甲状腺结节】,则体检系统得到的疾病标签为【甲状腺结节】。
[0073]
再接着,执行步骤s30、将所述当前用户的历史体检报告中的疾病标签和当前用户的用户基本属性输入到体检项目推荐模型中,通过所述体检项目推荐模型的输出结果确定体检项目推荐集,其中,所述体检项目推荐模型采用多分类多标签深度神经网络模型。
[0074]
图3示出了本发明的体检项目推荐方法的较佳实施例的步骤s30的子步骤流程图。请参阅图3,将所述当前用户的历史体检报告中的疾病标签和当前用户的用户基本属性输入到体检项目推荐模型中,通过所述体检项目推荐模型的输出结果确定体检项目推荐集的步骤可进一步包括:
[0075]
步骤s31、将所述历史体检报告中的疾病标签和所述当前用户的用户基本属性作为参数,输入到体检项目推荐模型中;
[0076]
步骤s32、所述体检项目推荐模型通过将所述当前用户的历史体检报告中的疾病标签和当前用户的用户基本属性与各体检项目进行匹配,以获取每个体检项目的推荐系数;
[0077]
步骤s33、根据所述推荐系数的大小确定需推荐的体检项目以构成所述体检项目推荐集。
[0078]
其中,步骤s33可进一步包括,选取推荐系数大于或等于预设阈值的体检项目构成初始体检项目推荐集;从所述初始体检项目推荐集中剔除所述基础体检套餐中已经存在的体检项目,以获取体检项目推荐集,预设阈值可以根据实际需要进行调整。
[0079]
其中,当前用户的用户基本属性包括年龄、性别、身高、体重等用户信息。当前用户的用户基本属性可通过当前用户在平安健康app中维护的用户信息,结合当前用户的历史
体检报告中的用户信息,得到用户的用户基本属性,比如年龄、性别、身高、体重等用户信息。其中,当前用户的历史体检报告中的用户信息例如可以通过正则表达式或者其他合适的方式从历史体检报告的报告文本中提取。
[0080]
譬如,在从用户的历史体检报告中提取性别时,性别比较固定,一般直接写男女,也需要考虑尊称,另外也会标注“姓名”定位词,可使用以下的正则表达式进行提取:
[0081]
男|女|先生|男士|女士|(?<=性别[::]).*。
[0082]
在从用户的历史体检报告中提取年龄时,年龄可用“年龄”定位词,也会出现xx岁,可使用以下的正则表达式进行提取:
[0083]
(?<=年龄[::]).*(?=岁)|\d.*(?=岁)。
[0084]
在从用户的历史体检报告中提取身高、体重等时,也可用定位词“身高”、“体重”等定位词,再结合正则表达式进行提取。
[0085]
例如,当用户在平安健康app中维护有用户信息,同时最近的历史体检报告中也存在用户信息时,则可以根据用户在平安健康app中的维护时间和最新的历史体检报告的体检时间来选取两者中时间更晚的一个作为选定的用户信息;当然也可以直接选用最新的历史体检报告中的用户信息作为选定的用户信息。
[0086]
当用户在平安健康app中没有维护有用户信息时,则以最新的历史体检报告中的用户信息作为选定用户信息。
[0087]
在本实施例中,将当前用户的用户基本属性和历史体检报告中的疾病标签做为参数,输入到训练好的多分类多标签深度神经网络模型中,所述多分类多标签深度神经网络模型通过将所述当前用户的历史体检报告中的疾病标签和当前用户的用户基本属性与各体检项目进行匹配,以获取每个体检项目的推荐系数,推荐系数大于或等于0.5(预设阈值)的体检项目作为推荐体检项目,构成初始体检项目推荐集,从所述初始体检项目推荐集中剔除当前用户已选的基础体检套餐中已经存在的体检项目,以获取所述体检项目推荐集。
[0088]
在实际应用时,多分类多标签深度神经网络模型的输出值可为一个十进制数,定义该十进制数为推荐值,将推荐值转换为二进制数后,为1(当然也可以是0)的那一位就是推荐的体检项目。假如多分类多标签深度神经网络模型的输出值为3(也即推荐值),转换为二进制为00011,意思就是第一个体检项目和第二个体检项目作为推荐体检项目。作为示例,假设血粘度表示二进制数中的第1位,尿常规表示二进制数中的第5位,若只推荐出这两项体检项目,即对应的多分类多标签深度神经网络模型的输出值为二进制为10001,也即推荐值为整数17。
[0089]
具体地,在将当前用户的用户基本属性和历史体检报告中的疾病标签做为参数输入到训练好的多分类多标签深度神经网络模型中时,需要先对当前用户的用户基本属性(年龄、性别、身高、体重)及历史体检报告中的疾病标签进行归一化处理(流程详见下文中模型训练部分的描述,在此不做赘述),然后将归一化处理后的用户基本属性和历史体检报告中的疾病标签输入到训练好的多分类多标签深度神经网络模型中获取推荐值,并根据推荐值获取初始体检项目推荐集。
[0090]
需要说明的是,在本发明中,体检项目推荐模型中体检项目采用结构化设计,可以避免出现重复推荐等情况。
[0091]
在实施例中,所述体检项目推荐模型采用多分类多标签深度神经网络模型,多分
类多标签深度神经网络模型的内部神经网络层包括依次设置的输入层、两个或者更多个隐藏层及输出层,层与层之间是全连接的,即第i层的任意一个神经元一定与第i 1层的任意一个神经元相连。
[0092]
所述多分类多标签深度神经网络模型可以以当前用户的历史体检报告中的疾病标签以及当前用户的用户基本属性作为参数,参与到体检项目推荐时体检项目的权重计算中,来获取推荐的体检项目。
[0093]
在本实施例中,多分类多标签深度神经网络模型的训练过程是以体检系统中所有用户的体检报告中的疾病标签、用户基本属性、及对应的体检项目等信息作为数据集,自动学习年龄、性别、身高、体重等用户基本属性以及疾病标签和体检项目之间的关联性。
[0094]
其中,所有用户的体检报告中的用户的体检报告中的疾病标签可采用与上述步骤s20的相似的方法获取,也即首先获取每个用户的体检报告的报告文本,接着提取报告文本中的疾病关键词,最后将体检报告的报告文本中的疾病关键词转换为体检系统中标准的疾病名称,以获取每个用户的体检报告中的疾病标签。而所有用户的体检报告的用户基本属性及对应的体检项目也可从相应客户的体检报告的报告文本中提取。
[0095]
多分类多标签深度神经网络模型的代价函数如下:
[0096][0097]
其中:
[0098]
j(θ)为代价函数;
[0099]
x
(i)
为疾病标签和用户基本属性集;
[0100]
y
(i)
为对应的体检项目集;
[0101]
m为训练样本数量;
[0102]
h
θ
(x)为预测函数;
[0103]
θ为预测函数的参数向量;
[0104]
n为预测函数的参数向量的个数;
[0105]
λ为梯度下降时的步长。
[0106]
以体检系统中所有用户的体检报告中的疾病标签、用户基本属性及对应的体检项目等信息作为数据集对所述多分类多标签深度神经网络模型进行训练之前,需要先对数据集中的数据进行预处理。在体检系统中,定义所有的体检项目对应二进制数中的一位,预处理包括:对从每份体检报告中获取的疾病标签及用户基本属性(身高、性别、年龄、体重)进行归一化处理作为模型的输入;将每份体检报告对应的体检项目按照预设规则表示成二进制数,将该二进制数所对应的十进制数作为模型的输出,其中,二进制数中为1(当然也可以是0) 的位代表每份体检报告对应的体检项目中的一个。
[0107]
作为示例,在进行归一化时,例如可采用如下方式进行:
[0108]
身高:以厘米为单位,(x

130)/70;
[0109]
年龄:(x

16)/80;
[0110]
性别:男性取值为1,女性取值为

1;
[0111]
体重:以公斤为单位,(x

40)/60;
[0112]
疾病标签:将所有k个疾病标签分别赋值1~k,然后每i个疾病标签按照 (k

i)/k计算得到一个介于(0,1]的值。
[0113]
需要说明的是,归一化也可采用其他合适的方式进行,并不限于上述的归一化公式。
[0114]
所述多分类多标签深度神经网络模型根据所述代价函数的值判断是否训练成功,具体是通过梯度下降的方法,不断计算并优化预测函数的参数向量θ,使代价函数的值降到合理的范围(预设范围),以得到训练好的多分类多标签深度神经网络模型,训练好的多分类多标签深度神经网络模型即为体检项目推荐模型。
[0115]
接着,执行步骤s40、推荐所述体检项目推荐集至当前用户。
[0116]
所述体检项目推荐集生成后,需要将所述体检项目推荐集发送操作界面,供当前用户从中选择所需的体检项目。体检系统中提供完善的体检项目说明& 意义及对应检出的疾病,当前用户可以根据各体检项目的体检项目说明&意义及对应检出的疾病来选择从所述体检项目推荐集选择所需的体检项目,客户选择好体检项目并确认后会回传给体检系统。
[0117]
接着,执行步骤s50、接收当前用户从所述体检项目推荐集中选择的体检项目,并将接收到的体检项目添加到所述基础体检套餐中以生成体检套餐。
[0118]
体检系统会接收当前用户从所述体检项目推荐集中选择所需的体检项目 (也即加项数据),并将选取的体检项目添加到当前用户已选择的基础体检套餐中以生成体检套餐,完成体检预约。
[0119]
最后,执行步骤s60、将当前用户从所述体检项目推荐集中选择的体检项目,反馈回体检项目推荐模型,以此优化体检项目推荐模型。
[0120]
当前用户根据生成的所述体检套餐完成体检后,会生成新的体检报告,系统会获取当前用户新的体检报告,并按照上述步骤s20中相同的方式获取新的体检报告中的疾病关键词,并将所述疾病关键词转换为疾病标签,然后将当前用户的最新的体检报告中的疾病标签,当前用户的用户属性及当前用户的所述体检套餐中的体检项目(包含当前用户从所述体检项目推荐集中选取的体检项目及基础体检套餐中的体检项目)等数据信息,又做为体检项目推荐模型的多分类多标签深度神经网络模型的样本,输入到多分类多标签深度神经网络模型中来进一步的训练多分类多标签深度神经网络模型。换句话说,多分类多标签深度神经网络模型可以感知当前用户的加项选择,不断学习,从而提高推荐准确率。
[0121]
需要说明的是,本发明的体检项目推荐方法同样也适合没有历史体检报告的情形和不能从历史体检报告中提取出疾病标签的情形,没有历史体检报告相当于没有疾病标签的一种特殊情形,可以将用户属性,也即用户的身高、体重、年龄、性别等用户信息输入到体检项目推荐模型,推荐一些比较通用的体检项目供用户选择。
[0122]
需要说明的是,在本发明中,为了进一步保证数据的安全性,还可以将涉及到的数据及模型部署于区块链,以防止数据被恶意篡改。
[0123]
需要说明的是,上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包含相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
[0124]
如图4所示,是本发明的体检项目推荐装置的较佳的实施例的功能模块图。所述体检项目推荐装置包括:报告获取模块111,标签提取模块112、项目推荐模块113,项目发送模块114,套餐生成模块115,加项反馈模块116。本发明所称的模块是指一种能够被处理器13所执行,并且能够完成固定功能的一系列计算机程序段,其存储在存储器12中。
[0125]
所述报告获取模块111用于响应于当前用户的体检预约指令,获取当前用户的历史体检报告,其中,所述体检预约指令包含当前用户已选择的基础体检套餐。所述历史体检报告包括体检系统中已存在的当前用户的体检报告和当前用户在用户端自行上传的体检报告。
[0126]
当前用户在平安健康app上预约体检,会进入体检套餐推荐页面,用户可从体检套餐推荐页面选择一种标准的基础体检套餐,该基础体检套餐中包括若干项体检项目,基础体检套餐由于是标准化产品,缺少针对性,难以满足用户的个性化需求。因此,体检系统开始推荐逻辑,所述报告获取模块111会响应于当前用户的体检预约指令,获取当前用户的历史体检报告。所述报告获取模块111获取当前用户的历史体检报告时,除了直接从系统的体检报告数据库中调用已经存在的当前用户的体检报告外,还可以提醒用户在平安健康app上自行上传以前的体检报告。
[0127]
所述标签提取模块112用于提取所述当前用户的历史体检报告中的疾病关键词并将所述疾病关键词转换为疾病标签。具体地,所述标签提取模块112在提取所述当前用户的历史体检报告中的疾病关键词并将所述疾病关键词转换为疾病标签时会首先对所述历史体检报告进行文本提取,以获取报告文本;接着提取所述报告文本中的疾病关键词;最后将所述报告文本中的疾病关键词转换为标准的疾病名称,以获取所述历史体检报告中的疾病标签。
[0128]
所述标签提取模块112在对体检报告进行文本提取时,需要根据体检报告的文件格式采用相应的文本提取流程进行文本提取,以获取体检报告文本信息,文件格式例如可以采用pdf格式,jpeg、png等图片格式,或word格式。
[0129]
例如:针对pdf格式的体检报告,可使用开源、基于java的、支持pdf 文档生成的apache pdfbox工具库,提取用户体检报告的整份报告或报告中的某页的文本信息;针对jpeg、png等图片格式的体检报告,可使用ocr技术提取用户体检报告的文本信息;针对word格式的体检报告,可使用poi,poi

ooxml 或poi

scratchpad框架提取用户体检报告中的文本信息。
[0130]
所述标签提取模块112在提取所述报告文本中的疾病关键词时,可以结合医学术语提取规则模型来对报告文本中的疾病关键词进行提取。
[0131]
由于不同体检机构对于疾病关键词的名称存在差异,在进行体检项目推荐时,所述标签提取模块112需要根据体检预存的疾病关键词的映射关系(提前维护在系统中),将疾病关键词转换成标准的疾病名称,也即疾病标签。例如:报告文本中有疾病关键字【左叶甲状腺结节】,则体检系统得到的疾病标签为【甲状腺结节】。
[0132]
所述项目推荐模块113用于将所述当前用户的历史体检报告中的疾病标签和当前用户的用户基本属性输入到体检项目推荐模型中,通过所述体检项目推荐模型的输出结果确定体检项目推荐集,其中,所述体检项目推荐模型采用多分类多标签深度神经网络模型。
[0133]
具体地,所述项目推荐模块113首先将所述历史体检报告中的疾病标签和所述当
前用户的用户基本属性作为参数,输入到体检项目推荐模型中;接着所述体检项目推荐模型通过将所述当前用户的历史体检报告中的疾病标签和当前用户的用户基本属性与各体检项目进行匹配,以获取每个体检项目的推荐系数;获取所述推荐值对应的所述体检项目构成初始体检项目推荐集;最后从所述初始体检项目推荐集中剔除所述基础体检套餐中已经存在的体检项目,以获取体检项目推荐集。
[0134]
其中,当前用户的用户基本属性包括年龄、性别、身高、体重等用户信息。当前用户的用户基本属性可通过当前用户在平安健康app中维护的用户信息,结合当前用户的历史体检报告中的用户信息,得到用户的用户基本属性,比如年龄、性别、身高、体重等用户信息。其中,当前用户的历史体检报告中的用户信息例如可以通过正则表达式或者其他合适的方式从历史体检报告的报告文本中提取。
[0135]
譬如,在从用户的历史体检报告中提取性别时,性别比较固定,一般直接写男女,也需要考虑尊称,另外也会标注“姓名”定位词,可使用以下的正则表达式进行提取:
[0136]
男|女|先生|男士|女士|(?<=性别[::]).*。
[0137]
在从用户的历史体检报告中提取年龄时,年龄可用“年龄”定位词,也会出现xx岁,可使用以下的正则表达式进行提取:
[0138]
(?<=年龄[::]).*(?=岁)|\d.*(?=岁)。
[0139]
在从用户的历史体检报告中提取身高、体重等时,也可用定位词“身高”、“体重”等定位词,再结合正则表达式进行提取。
[0140]
例如,当用户在平安健康app中维护有用户信息,同时最近的历史体检报告中也存在用户信息时,则可以根据用户在平安健康app中的维护时间和最新的历史体检报告的体检时间来选取两者中时间更晚的一个作为选定的用户信息;当然也可以直接选用最新的历史体检报告中的用户信息作为选定的用户信息。
[0141]
当用户在平安健康app中没有维护有用户信息时,则以最新的历史体检报告中的用户信息作为选定用户信息。
[0142]
在本实施例中,将当前用户的用户基本属性和历史体检报告中的疾病标签做为参数,输入到训练好的多分类多标签深度神经网络模型中,所述多分类多标签深度神经网络模型通过将所述当前用户的历史体检报告中的疾病标签和当前用户的用户基本属性与各体检项目进行匹配,以获取每个体检项目的推荐系数,推荐系数大于或等于0.5(预设阈值)的体检项目作为推荐体检项目,构成初始体检项目推荐集,从所述初始体检项目推荐集中剔除当前用户已选的基础体检套餐中已经存在的体检项目,以获取所述体检项目推荐集。
[0143]
在实际应用时,多分类多标签深度神经网络模型的输出值可为一个十进制数,定义该十进制数为推荐值,将推荐值转换为二进制数后,为1(当然也可以是0)的那一位就是推荐的体检项目。假如多分类多标签深度神经网络模型的输出值为3(也即推荐值),转换为二进制为00011,意思就是第一个体检项目和第二个体检项目作为推荐体检项目。作为示例,假设血粘度表示二进制数中的第1位,尿常规表示二进制数中的第5位,若只推荐出这两项体检项目,即对应的多分类多标签深度神经网络模型的输出值为二进制为10001,也即推荐值为整数17。
[0144]
具体地,在将当前用户的用户基本属性和历史体检报告中的疾病标签做为参数输入到训练好的多分类多标签深度神经网络模型中时,需要先对当前用户的用户基本属性
(年龄、性别、身高、体重)及历史体检报告中的疾病标签进行归一化处理(流程详见下文中模型训练部分的描述,在此不做赘述),然后将归一化处理后的用户基本属性和历史体检报告中的疾病标签输入到训练好的多分类多标签深度神经网络模型中获取推荐值,并根据推荐值获取初始体检项目推荐集。
[0145]
需要说明的是,在本发明中,体检项目推荐模型中体检项目采用结构化设计,可以避免出现重复推荐等情况。
[0146]
在实施例中,所述体检项目推荐模型采用多分类多标签深度神经网络模型,多分类多标签深度神经网络模型的内部神经网络层包括依次设置的输入层、两个或者更多个隐藏层及输出层,层与层之间是全连接的,即第i层的任意一个神经元一定与第i 1层的任意一个神经元相连。
[0147]
所述多分类多标签深度神经网络模型可以以当前用户的历史体检报告中的疾病标签以及当前用户的用户基本属性作为参数,参与到体检项目推荐时体检项目的权重计算中,来获取推荐的体检项目。
[0148]
在本实施例中,多分类多标签深度神经网络模型的训练过程是以体检系统中所有用户的体检报告中的疾病标签、用户基本属性、及对应的体检项目等信息作为数据集,自动学习年龄、性别、身高、体重等用户基本属性以及疾病标签和体检项目之间的关联性。
[0149]
其中,所有用户的体检报告中的用户的体检报告中的疾病标签可采用标签提取模块112获取,也即首先获取每个用户的体检报告的报告文本,接着提取报告文本中的疾病关键词,最后将体检报告的报告文本中的疾病关键词转换为体检系统中标准的疾病名称,以获取每个用户的体检报告中的疾病标签。而所有用户的体检报告的用户基本属性及对应的体检项目也可从相应客户的体检报告的报告文本中提取。
[0150]
多分类多标签深度神经网络模型的代价函数如下:
[0151][0152]
其中:
[0153]
j(θ)为代价函数;
[0154]
x
(i)
为疾病标签和用户基本属性集;
[0155]
y
(i)
为对应的体检项目集;
[0156]
m为训练样本数量;
[0157]
h
θ
(x)为预测函数;
[0158]
θ为预测函数的参数向量。
[0159]
以体检系统中所有用户的体检报告中的疾病标签、用户基本属性及对应的体检项目等信息作为数据集对所述多分类多标签深度神经网络模型进行训练之前,需要先对数据集中的数据进行预处理。在体检系统中,定义所有的体检项目对应二进制数中的一位,预处理包括:对从每份体检报告中获取的疾病标签及用户基本属性(身高、性别、年龄、体重)进行归一化处理作为模型的输入;将每份体检报告对应的体检项目按照预设规则表示成二进制数,将该二进制数所对应的十进制数作为模型的输出,其中,二进制数中为1(当然也可以是0) 的位代表每份体检报告对应的体检项目中的一个。
[0160]
作为示例,在进行归一化时,例如可采用如下方式进行:
[0161]
身高:以厘米为单位,(x

130)/70;
[0162]
年龄:(x

16)/80;
[0163]
性别:男性取值为1,女性取值为

1;
[0164]
体重:以公斤为单位,(x

40)/60;
[0165]
疾病标签:将所有n个疾病标签分别赋值1~n,然后每i个疾病标签按照 (n

i)/n计算得到一个介于(0,1]的值。
[0166]
需要说明的是,归一化也可采用其他合适的方式进行,并不限于上述的归一化公式。
[0167]
通过梯度下降的方法,不断计算并优化θ,使代价函数的值降到合理的范围,得到最终的推荐模型。
[0168]
所述项目发送模块114用于推荐所述体检项目推荐集至当前用户。所述体检项目推荐集生成后,需要将所述体检项目推荐集发送操作界面,供当前用户从中选择所需的体检项目。体检系统中提供完善的体检项目说明&意义及对应检出的疾病,当前用户可以根据各体检项目的体检项目说明&意义及对应检出的疾病来选择从所述体检项目推荐集选择所需的体检项目,客户选择好体检项目并确认后会回传给体检系统。
[0169]
所述套餐生成模块115用于接收当前用户从所述体检项目推荐集中选择的体检项目,并将当前用户选择的体检项目添加到所述基础体检套餐中以生成体检套餐。体检系统会接收当前用户从所述体检项目推荐集中选择所需的体检项目(也即加项数据),并将选取的体检项目添加到当前用户已选择的基础体检套餐中以生成体检套餐,完成体检预约。
[0170]
所述加项反馈模块116用于将当前用户从所述体检项目推荐集中选择的体检项目对加项的选择,反馈回所述体检项目推荐模型,以此优化所述体检项目推荐模型。
[0171]
当前用户根据生成的所述体检套餐完成体检后,会生成新的体检报告,系统会获取当前用户新的体检报告,并按照上述步骤s20中相同的方式获取新的体检报告中的疾病关键词,并将所述疾病关键词转换为疾病标签,然后将当前用户的最新的体检报告中的疾病标签,当前用户的用户属性及当前用户的所述体检套餐中的体检项目(包含当前用户从所述体检项目推荐集中选取的体检项目及基础体检套餐中的体检项目)等数据信息,又做为体检项目推荐模型的多分类多标签深度神经网络模型的样本,输入到多分类多标签深度神经网络模型中来进一步的训练多分类多标签深度神经网络模型。换句话说,多分类多标签深度神经网络模型可以感知当前用户的加项选择,不断学习,从而提高推荐准确率。
[0172]
需要说明的是,本实施例的体检项目推荐装置是与上述体检项目推荐方法相对应的装置,体检项目推荐装置中的功能模块或者分别对应体检项目推荐方法中的相应步骤。本实施例的体检项目推荐装置可与体检项目推荐方法相互相配合实施。相应地,本实施例的体检项目推荐装置中提到的相关技术细节也可应用在上述体检项目推荐方法中。
[0173]
需要说明的是,上述的各功能模块实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的部分
或全部步骤,或以上的各功能模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
[0174]
如图5所示,是本发明实现体检项目推荐方法的较佳实施例的电子设备的结构示意图。
[0175]
所述电子设备1可以包括存储器12、处理器13和总线,还可以包括存储在所述存储器12中并可在所述处理器13上运行的计算机程序,例如基于方向检测的文字识别程序。
[0176]
其中,存储器12至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(smart media card,smc)、安全数字(secure digital,sd)卡、闪存卡(flash card)等。进一步地,存储器12还可以既包括电子设备1的内部存储单元也包括外部存储设备。存储器12不仅可以用于存储安装于电子设备1 的应用软件及各类数据,例如基于方向检测的文字识别程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
[0177]
处理器13在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(central processing unit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是所述电子设备 1的控制核心(control unit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在所述存储器12内的程序或者模块(例如执行体检报告校验程序等),以及调用存储在所述存储器12内的数据,以执行电子设备 1的各种功能和处理数据。
[0178]
所述处理器13执行所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个体检项目推荐方法实施例中的步骤,例如图1所示的步骤。
[0179]
示例性的,所述计算机程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述电子设备1中的执行过程。例如,所述计算机程序可以被分割成报告获取模块111,标签提取模块112、项目推荐模块 113,项目发送模块114、套餐生成模块115及加项反馈模块116。
[0180]
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备,或者网络设备等) 或处理器(processor)执行本发明各个实施例所述体检项目推荐方法的部分功能。
[0181]
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品
服务层以及应用服务层等。
[0182]
总线可以是外设部件互连标准(peripheral component interconnect,简称pci) 总线或扩展工业标准结构(extended industry standard architecture,简称eisa) 总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,在图3中仅用一根箭头表示,但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现所述存储器12以及至少一个处理器13等之间的连接通信。
[0183]
本发明的体检项目推荐方法、装置、设备及介质,可以根据用户的历年体检结果自动给用户推荐适合用户身体状况的体检项目,然后用户从推荐的体检项目中选择所需的体检项目加入到基础体检套餐中,形成最终的体检套餐,做到了千人千面,让用户能有针对性的进行健康检查,提高用户对体检产品有效性的信赖。本发明的体检项目推荐方法、装置、设备及介质,可通过分析已有的全量用户的体检报告的用户基本属性、疾病标签及体检项目,自动学习体检项目推荐模型,同时用户的每次加项选择操作对应的用户属性、疾病标签和体检项目信息,又做为推荐模型的样本输入到体检项目推荐模型中来进一步的训练优化推荐模型,做到了无需人工参与的智能自动推荐。本发明的体检项目推荐方法、装置、设备及介质,多分类多标签深度神经网络模型通过感知当前用户的加项选择,不断学习,从而提高推荐准确率。本发明的体检项目推荐方法、装置、设备及介质,体检机构可以通过系统中的体检报告数据,分析出不同人员需求量最大的检测项目,给体检机构合理设置体检套餐项目提供数据参考。
[0184]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
[0185]
以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献