一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种文章推荐方法、装置、电子设备和计算机存储介质与流程

2021-12-07 21:32:00 来源:中国专利 TAG:


1.本技术涉及互联网技术领域,尤其涉及一种文章推荐方法、装置、电子设备和计算机存储介质。


背景技术:

2.近年来随着计算机科学技术快速发展,信息技术爆炸,越来越多的商业领域由线下扩展到线上;其中,互联网医院的发展在这几年尤为迅速。随着产品的快速迭代,给患者推荐患教文章的内容服务,提升患者端的用户体验也成为了一大新的需求。
3.相关技术中,对于患教文章的推荐方法,大多采用随机推荐,或者只针对患教文章的质量进行择优推荐。然而,采用随机推荐,或者只针对患教文章的质量进行择优推荐的方式,仅考虑文章维度的信息,损失了大量的患者维度信息;进而,导致文章与患者不适配的问题,降低了向患者推荐文章的准确性。


技术实现要素:

4.本技术提供一种文章推荐方法、装置、电子设备和计算机存储介质;可以解决在向患者推荐文章时,文章与患者不适配的问题,能够提高向患者推荐文章的准确性。
5.本技术的技术方案是这样实现的:
6.本技术实施例提供了一种文章推荐方法,所述方法包括:
7.获取目标患者的历史问诊单数据;根据所述目标患者的历史问诊单数据,得到所述目标患者的疾病类别;
8.获取多种文章,确定所述多种文章中每种文章的疾病类型标签;
9.基于所述目标患者的疾病类别和所述每种文章的疾病类型标签,确定向所述目标患者推荐的文章。
10.在一些实施例中,所述根据所述目标患者的历史问诊单数据,得到所述目标患者的疾病类别,包括:
11.根据所述目标患者的历史问诊单数据,对所述目标患者的下单类别频次进行标记,得到所述目标患者的特征向量;所述下单类别频次表示所述目标患者在设定时间段内下载的不同类别的问诊单的频次;
12.将所述目标患者的特征向量输入至预先训练的分类模型中,得到所述目标患者的疾病类别。
13.在一些实施例中,所述根据所述目标患者的历史问诊单数据,对所述目标患者的下单类别频次进行标记,得到所述目标患者的特征向量,包括:
14.根据所述目标患者的历史问诊单数据和预设疾病类别,对所述目标患者的下单类别频次进行标记;
15.在所述目标患者对第一疾病类别下单的情况下,对所述第一疾病类别的特征值进行累加;所述第一疾病类别为所述预设疾病类别中的任意一种疾病类别;
16.在所述目标患者对所述第一疾病类别未下单的情况下,所述第一疾病类别的特征值保持不变;
17.基于所述目标患者对应的每种疾病类别的特征值,得到所述目标患者的特征向量。
18.在一些实施例中,所述分类模型是通过以下步骤训练得到的:
19.获取患者的历史问诊单数据集,将所述历史问诊单数据集划分为训练数据集和测试数据集;所述训练数据集包括:多个患者的历史问诊单数据和所述多个患者的疾病类别标签;
20.根据所述多个患者的历史问诊单数据,对所述多个患者的下单类别频次进行标记,得到所述多个患者的特征向量;
21.通过所述多个患者的特征向量以及疾病类别标签对分类模型进行训练,得到初始分类模型;
22.根据所述测试数据集对所述初始分类模型进行调整,得到训练完成的分类模型。
23.在一些实施例中,所述分类模型为k最近邻算法(k

nearest neighbor,knn)的模型。
24.在一些实施例中,所述确定所述多种文章中每种文章的疾病类型标签,包括:
25.对所述多种文章进行关键词提取,得到所述多种文章中每种文章的关键词;
26.基于所述每种文章的关键词,对所述每种文章进行标签化处理,得到所述每种文章的疾病类型标签。
27.本技术实施例还提出了一种文章推荐装置,所述装置包括第一获取模块、第二获取模块和推荐模块,其中,
28.第一获取模块,用于获取目标患者的历史问诊单数据;根据所述目标患者的历史问诊单数据,得到所述目标患者的疾病类别;
29.第二获取模块,用于获取多种文章,确定所述多种文章中每种文章的疾病类型标签;
30.推荐模块,用于基于所述目标患者的疾病类别和所述每种文章的疾病类型标签,确定向所述目标患者推荐的文章。
31.本技术实施例提供一种电子设备,所述设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述一个或多个技术方案提供的文章推荐方法。
32.本技术实施例提供一种计算机存储介质,所述计算机存储介质存储有计算机程序;所述计算机程序被执行后能够实现前述一个或多个技术方案提供的文章推荐方法。
33.本技术实施例提出了一种文章推荐方法、装置、电子设备和计算机存储介质,该方法包括:获取目标患者的历史问诊单数据;根据所述目标患者的历史问诊单数据,得到所述目标患者的疾病类别;获取多种文章,确定所述多种文章中每种文章的疾病类型标签;基于所述目标患者的疾病类别和所述每种文章的疾病类型标签,确定向所述目标患者推荐的文章;如此,根据目标患者的历史问诊单数据确定对应的疾病类别,再结合多种文章中每种文章的疾病类型标签,实现有针对性地向目标患者推荐文章;即,通过结合目标患者维度和文章维度的信息,可以解决在向患者推荐文章时,文章与患者不适配的问题,进而,提高向患
者推荐文章的准确性。
附图说明
34.图1a是本技术实施例中的一种文章推荐方法的流程示意图;
35.图1b为本技术实施例中进行文章推荐的示意图;
36.图2a为本技术实施例中基于knn算法确定患者疾病类别标签的示意图;
37.图2b为本技术实施例中的另一种文章推荐方法的流程示意图;
38.图3为本技术实施例的文章推荐装置的组成结构示意图;
39.图4为本技术实施例提供的电子设备的结构示意图。
具体实施方式
40.以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处所提供的实施例仅仅用以解释本技术,并不用于限定本技术。另外,以下所提供的实施例是用于实施本技术的部分实施例,而非提供实施本技术的全部实施例,在不冲突的情况下,本技术实施例记载的技术方案可以任意组合的方式实施。
41.需要说明的是,在本技术实施例中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的方法或者装置不仅包括所明确记载的要素,而且还包括没有明确列出的其它要素,或者是还包括为实施方法或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括该要素的方法或者装置中还存在另外的相关要素(例如方法中的步骤或者装置中的单元,例如的单元可以是部分电路、部分处理器、部分程序或软件等等)。
42.本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,i和/或j,可以表示:单独存在i,同时存在i和j,单独存在j这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括i、j、r中的至少一种,可以表示包括从i、j和r构成的集合中选择的任意一个或多个元素。
43.例如,本技术实施例提供的文章推荐方法包含了一系列的步骤,但是本技术实施例提供的文章推荐方法不限于所记载的步骤,同样地,本技术实施例提供的文章推荐装置包括了一系列模块,但是本技术实施例提供的文章推荐装置不限于包括所明确记载的模块,还可以包括为获取相关时序数据、或基于时序数据进行处理时所需要设置的模块。
44.本技术实施例可以应用于终端设备和服务器组成的计算机系统中,并可以与众多其它通用或专用计算系统环境或配置一起操作。这里,终端设备可以是瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统,等等,服务器可以是服务器计算机系统小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
45.终端设备、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络连接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地
或远程计算系统存储介质上。
46.随着数据处理技术时代的到来,如何从海量的数据中挖掘有用信息越来越成为学者们研究的重点。因此,基于数据驱动的机器学习,深度学习算法应运而生。针对该应用场景,提出以下各实施例。
47.在本技术的一些实施例中,文章推荐方法可以利用文章推荐装置中的处理器实现,上述处理器可以为特定用途集成电路(application specific integrated circuit,asic)、数字信号处理器(digital signal processor,dsp)、数字信号处理装置(digital signal processing device,dspd)、可编程逻辑装置(programmable logic device,pld)、现场可编程逻辑门阵列(field programmable gate array,fpga)、中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器中的至少一种。
48.图1a是本技术实施例中的一种文章推荐方法的流程示意图,如图1a所示,该方法包括如下步骤:
49.步骤100:获取目标患者的历史问诊单数据;根据目标患者的历史问诊单数据,得到目标患者的疾病类别。
50.本技术实施例中,目标患者可以是在互联网医院上有过问诊单下载记录的一个或多个患者;其中,互联网医院具有咨询、随访、慢病管理等功能,它有实体医院作强有力的支撑,线上向患者提供医疗服务;也就是说,与患者相关的一些简单问题不需要到实体医院,在线上就可以进行解决。
51.在一种实施方式中,历史问诊单数据表示目标患者在设定时间段内所下载的问诊单中的数据;示例性地,该数据可以包括目标患者的疾病类别、患病时长等。
52.本技术实施例中,对于历史问诊单数据的设定时间段不作限制;例如,可以是目标患者前三年的历史问诊单数据,也可以是目标患者前六个月的历史问诊单数据。
53.在一些实施例中,根据目标患者的历史问诊单数据,得到目标患者的疾病类别,可以包括:根据目标患者的历史问诊单数据,对目标患者的下单类别频次进行标记,得到目标患者的特征向量;下单类别频次表示目标患者在设定时间段内下载的不同类别的问诊单的频次;将目标患者的特征向量输入至预先训练的分类模型中,得到目标患者的疾病类别。
54.本技术实施例中,不同类别的问诊单对应的疾病类别不相同。由于目标患者的历史问诊单数据包括设定时间段内所下载的全部问诊单数据,因而,可以根据目标患者的历史问诊单数据,确定目标患者的下单类别频次。
55.在一种实施方式中,假设患者1在前六个月下载了三次问诊单,如果两次问诊单对应的疾病类别均为疾病类别a,则疾病类别a的下单类别频次为2;如果另外一次问诊单对应的疾病类别为疾病类别b,则疾病类别b的下单类别频次为1。
56.示例性地,对于根据目标患者的历史问诊单数据,对目标患者的下单类别频次进行标记,得到目标患者的特征向量的实现方式,可以包括:根据目标患者的历史问诊单数据和预设疾病类别,对目标患者的下单类别频次进行标记;在目标患者对第一疾病类别下单的情况下,对第一疾病类别的特征值进行累加;第一疾病类别为预设疾病类别中的任意一种疾病类别;在目标患者对第一疾病类别未下单的情况下,第一疾病类别的特征值保持不变;基于目标患者对应的每种疾病类别的特征值,得到目标患者的特征向量。
57.本技术实施例中,在对目标患者的下单类别频次进行标记之前,需要确定预设疾
病类别;预设疾病类别可以包括多种不同类别的疾病;示例性地,可以是心脏病、糖尿病、癌症、抑郁症和抑郁症等。
58.示例性地,本技术实施例虽然对预设疾病类别所包括的疾病类别的数目不作限制,但由于现实生活中存在的疾病类别很多,为了提高后续处理效率,可以将常见的疾病类型均包括在预设疾病类别中,比较罕见的疾病类型则用其它疾病类别进行统一表示。即,预设疾病类别可以由多种常见类别的疾病和其它疾病类别共同组成。
59.在一种实施方式中,预设疾病类别中的每种疾病类别均对应一个特征,即,疾病类别可以是由多个特征组成的特征向量;例如,预设疾病类别包括11种疾病类别,分别为10种常见类别的疾病和其它类型疾病;则预设疾病类别可以表示为一个11维的特征向量。
60.本技术实施例中,在未对目标患者的下单类别频次进行标记时,每个特征的特征值均为0,在根据目标患者的历史问诊单数据,确定目标患者对预设疾病类别中某一疾病类别下单的情况下,对该疾病类别的特征值进行累加;这里,每次累加的累加值是一个固定值,对于累加值的大小不作限定,例如,可以是1、2或3等。在确定目标患者对预设疾病类别中某一疾病类别未下单的情况下,该疾病类别的特征值保持不变;如果确定目标患者从未对预设疾病类别中某一疾病类别进行下单,则该疾病类别的特征值为0。
61.本技术实施例中,在对目标患者的下单类别频次进行标记后,可以确定特征向量中每个特征的特征值,进而,得到目标患者的特征向量;通过将目标患者的特征向量输入至预先训练的分类模型中,便可得到目标患者的疾病类别。
62.在一些实施例中,分类模型是通过以下步骤训练得到的:获取患者的历史问诊单数据集,将历史问诊单数据集划分为训练数据集和测试数据集;训练数据集包括:多个患者的历史问诊单数据和多个患者的疾病类别标签;根据多个患者的历史问诊单数据,对多个患者的下单类别频次进行标记,得到多个患者的特征向量;通过多个患者的特征向量以及疾病类别标签对分类模型进行训练,得到初始分类模型;根据测试数据集对初始分类模型进行调整,得到训练完成的分类模型。
63.示例性地,获取患者的历史问诊单数据集,可以包括:从互联网医院上采集各个患者的历史问诊单数据;对采集到的各个患者的历史问诊单数据进行数据清洗操作;这样,可以过滤掉过期数据、不完整数据和重复数据等非法数据;有利于确保数据的可靠性;将清洗后的各个患者的历史问诊单数据存储到互联网医院的患者端;进而,从互联网医院的患者端获取患者的历史问诊单数据集。
64.本技术实施例中,训练数据集用来对分类模型进行训练,使得分类模型能够满足设定要求;为了确保分类模型的分类效果,在将患者的历史问诊单数据集被划分为训练数据集和测试数据集后,训练数据集的长度通常要大于测试数据集的长度;示例性地,可以将患者的历史问诊单数据集的80%作为训练数据集,20%作为测试数据集。
65.在一些实施例中,对分类模型的训练是有监督的学习,即,对于输入x有着与之对应的实际值y;这里,输入x表示训练数据集中每个患者的特征向量,实际值y表示每个患者的特征向量对应的疾病类别标签。而分类模型的输入x与实际值y之间的损失函数就是网络反向传播,整个神经网络的训练过程就是不断缩小损失函数的值的过程。
66.本技术实施例中,在经过上述训练过程得到初始分类模型后,将测试数据集中每个患者的特征向量输入至初始分类模型中,输出每个患者的预测疾病类别;将预测疾病类
别与患者实际对应的疾病类别标签进行比较,根据比较结果对初始分类模型中的参数进一步调整,将调整后的初始分类模型作为训练完成的分类模型。
67.可见,本技术实施例通过训练数据集对分类模型进行训练,使得分类模型分类结果的可以准确反映不同患者对应的疾病类别;测试数据集用来进一步验证分类模型的性能,确保分类结果的可靠性。
68.示例性地,对于分类模型的类型,本技术实施例不作限制;例如,可以为knn算法的模型,也可以为其它机器学习模型。
69.步骤101:获取多种文章,确定多种文章中每种文章的疾病类型标签。
70.本技术实施例中,文章表示与患者教育相关的患教文章,其包括患者疾病知识的宣传及药物服用的注意事项等相关内容;即,多种文章表示针对各种疾病类型的患教文章;示例性地,可以是心脏病、糖尿病、癌症、抑郁症和抑郁症等疾病类别的患教文章。这里,多种文章中每种文章可以包括一篇或多篇与同一疾病类别相关的文章。
71.在一种实施方式中,可以从内容中台中获取多种文章;其中,内容中台表示管理多种文章以及向不同患者推送文章的平台。
72.示例性地,获取多种文章,可以包括:从互联网医院上采集各种疾病类型的文章;对采集到的各种疾病类型的文章进行数据清洗操作;这样,可以过滤掉过期文章、不完整文章和重复文章等非法文章;有利于确保文章的可靠性;将清洗后的各种疾病类型的文章存储到互联网医院的内容中台;进而,从互联网医院的内容中台获取多种文章。
73.在一些实施例中,确定多种文章中每种文章的疾病类型标签,可以包括:对多种文章进行关键词提取,得到多种文章中每种文章的关键词;基于每种文章的关键词,对每种文章进行标签化处理,得到每种文章的疾病类型标签。
74.示例性地,在从互联网医院的内容中台获取多种文章后,使用关键词提取算法对多种文章的每种文章进行关键词提取,得到每种文章的关键词;这里,关键词表示与每种文章对应疾病类型相关的词语;示例性地,关键词提取算法可以为词频

逆文本频率指数(term frequency

inverse document frequency,tf

idf)算法。
75.示例性地,在确定文章中的词语是否为关键词不仅需要考虑其出现的词频,还需要考虑其是否为常用词;因此,需要对词语进行加权处理,将在某些文章中出现次数较多,但在其它文章中出现次数很少的非常见词语赋予较大权重;将在多种文章中均出现的常见词赋予较小权重;其中,权重可以依据tf

idf算法进行确定。
76.示例性地,在使用tf

idf算法对每种文章提取关键词的过程中,首先,对每种文章进行分词、词性标注和去除停用词等数据预处理操作,得到若干个候选关键词;然后计算每个候选关键词的词频和逆文本频率指数,通过词频和逆文本频率指数的乘积确定每个候选关键词的权重,根据权重对每个候选关键词进行排序,将排名在前的若干个候选关键词作为每种文章的关键词。
77.本技术实施例中,由于根据tf

idf算法提取的关键词能够反映出每种文章的疾病类型;因而,根据关键词对每种文章进行标签化处理,将每种文章归类为对应疾病类型标签的文章;这里,若不能根据关键词对某一文章进行归类,则将该文章归类为其它类型文章。即,多种文章的每种文章都有对应的疾病类型标签。
78.示例性地,步骤100和步骤101这两个步骤相互独立,可以依据实际情况进行执行,
本技术实施例并不限制执行顺序。
79.步骤102:基于目标患者的疾病类别和每种文章的疾病类型标签,确定向目标患者推荐的文章。
80.本技术实施例中,根据步骤100可以确定目标患者的疾病类别;根据步骤101可以确定内容中台中每种文章的疾病类型标签;通过将目标患者的疾病类别与文章的疾病类型标签进行匹配,可以有针对性向目标患者推荐与自身疾病类别相关的文章,提升用户体验。
81.在一种实施方式中,图1b为本技术实施例中进行文章推荐的示意图,如图1b所示,在确定目标患者的疾病类别为心脏病时,内容中台将心脏病相关文章推荐给目标患者;在确定目标患者的疾病类别为抑郁症时,内容中台将抑郁症相关文章推荐给目标患者;在确定目标患者的疾病类别为糖尿病时,内容中台将糖尿病相关文章推荐给目标患者;在确定目标患者的疾病类别为癌症时,内容中台将癌症相关文章推荐给目标患者;内容中台将未进行归类的其它类型文章向不同疾病类别的目标患者均进行推荐。
82.本技术实施例提出了一种文章推荐方法、装置、电子设备和计算机存储介质,该方法包括:获取目标患者的历史问诊单数据;根据目标患者的历史问诊单数据,得到目标患者的疾病类别;获取多种文章,确定多种文章中每种文章的疾病类型标签;基于目标患者的疾病类别和每种文章的疾病类型标签,确定向目标患者推荐的文章;如此,根据目标患者的历史问诊单数据确定对应的疾病类别,再结合多种文章中每种文章的疾病类型标签,实现有针对性地向目标患者推荐文章;即,通过结合目标患者维度和文章维度的信息,可以解决在向患者推荐文章时,文章与患者不适配的问题,进而,提高向患者推荐文章的准确性。
83.为了能够更加体现本技术的目的,在本技术上述实施例的基础上,以knn算法的模型为例,进行进一步的举例说明。
84.knn算法是机器学习中经典算法之一,其通过测量不同特征值之间的距离来进行分类。对于任意n维输入的特征向量,分别对应于特征空间中的一个样本点,输出为该特征向量所对应的类别标签或预测值。
85.图2a为本技术实施例中基于knn算法确定患者疾病类别标签的示意图,如图2a所示,ω1、ω2和ω3分别代表训练数据集中的三种疾病类别;若超参数k值取5,则可以看出,与x最相近的5个点中最多的类别为ω1;这里,x表示患者的特征向量x对应于特征空间中的样本点。可见,knn算法将患者的疾病类别预测为ω1。
86.下面,对knn算法进行简单说明:
87.输入数据包括:训练数据集t={(x1,y1),(x2,y2),...,(x
i
,y
i
),...,(x
n
,y
n
)};其中,x
i
∈x∈r
n
为n维的特征向量;y
i
∈y={c1,c2,...,c
m
}为每个特征向量的类别标签;i=1,2,

n,n表示训练数据集的数据量;输入还包括测试数据集中的各个n维的特征向量,输出数据为测试数据集中每个特征向量的预测类别;若以患者为例进行说明,则n表示训练数据集中患者的个数,输入还包括测试数据集中各个患者的特征向量;输出为测试数据集中各个患者的预测疾病类别。
88.使用knn算法进行分类时,需自定义两个参数,即,超参数k值以及样本点间距离的度量。
89.在进行knn算法过程中,需要设置超参数k,而k值大小的选择对分类的结果产生的影响举足轻重。当k值选择过小时,只有距离较近的样本点才会对分类结果产生影响,其分
类结果会对近邻点非常敏感,倘若临近点是噪声点则会使得分类结果出错,从而导致分类模型产生过拟合的情况。当k值选择过大时,少量的噪声点不会影响分类的结果,分类模型的鲁棒性显著提高,但距离较远的样本点也会对分类的结果产生影响,从而导致分类模型产生欠拟合的情况。因此,需采用交叉验证法选取k值,防止过拟合以及欠拟合的情况发生。
90.特征空间内的两个样本点之间的距离量度表示两个样本点之间的相似程度,距离越短,表示相似程度越高;反之,相似程度越低。对于n维特征空间中的两个样本点:w(w1,w2,

,wn)和v(v1,v2,

,vn);w和v之间的闵可夫斯基距离可以表示为公式(1):
[0091][0092]
其中,p是一个可变参数;当p=1时,被称为曼哈顿距离;当p=2时,被称为欧氏距离;当p

∞时,被称为切比雪夫距离。
[0093]
在一种实施方式中,采用knn算法确定目标患者的疾病类别的执行步骤如下:
[0094]
首先,针对未经疾病类别分类的目标患者样本点,穷尽计算其与训练数据集中其它样本点的欧氏距离;然后,将距离按照递增次序进行排序;接着,选取与目标患者样本点最为相近的k个样本点,并依据多数投票原则从这k个样本点中确定目标患者样本点所属的疾病类别。重复以上流程即可求得每个患者的疾病类别结果。
[0095]
图2b为本技术实施例中的另一种文章推荐方法的流程示意图,如图2b所示,该流程包括以下步骤:
[0096]
步骤a1:数据采集。
[0097]
在一种实施方式中,从互联网医院上采集各个患者的历史问诊单数据和各种疾病类型的文章。
[0098]
步骤a2:数据清洗。
[0099]
在一种实施方式中,对采集到的各个患者的历史问诊单数据和各种疾病类型的文章进行数据清洗操作。
[0100]
步骤a3:数据存储。
[0101]
在一种实施方式中,将清洗后的各个患者的历史问诊单数据和文章进行本地存储;这里,将清洗后的各个患者的历史问诊单数据存储到互联网医院的患者端,将清洗后的各种疾病类型的文章存储到互联网医院的内容中台。
[0102]
步骤a4:确定目标患者的疾病类别。
[0103]
在一种实施方式中,基于knn算法的模型确定目标患者的疾病类别;首先,从互联网医院的患者端获取患者的历史问诊单数据集,将患者分类成多个不同疾病类别的集群;然后,对未经疾病类别分类的目标患者样本点,穷尽计算其与训练数据集中不同疾病类别的集群中每个样本点的欧氏距离;最后,选取与目标患者样本点为相近的k个样本点,并依据多数投票原则从这k个样本点中确定目标患者样本点所属的疾病类别。
[0104]
步骤a5:确定文章的疾病类型标签。
[0105]
在一种实施方式中,从互联网医院的内容中台获取各种疾病类型的文章;可以使用tf

idf算法确定每种文章的疾病类型标签;对不同疾病类型的文章提取关键词;根据关键词对每种文章进行标签化处理,将每种文章归类为对应疾病类型标签的文章。
[0106]
步骤a6:文章推荐。
[0107]
在一种实施方式中,通过将目标患者的疾病类别与文章的疾病类型标签进行匹配,可以实现文章的推荐。
[0108]
可见,本技术实施例基于knn算法的模型对患者端不同患者的历史问诊单数据进行集群划分;在内容中台,基于tf

idf关键词提取对不同疾病类型的文章进行标签化处理,综合双端信息给患者进行文章的推荐。
[0109]
图3为本技术实施例的文章推荐装置的组成结构示意图,如图3所示,该装置包括:第一获取模块300、第二获取模块301和推荐模块302,其中:
[0110]
第一获取模块300,用于获取目标患者的历史问诊单数据;根据目标患者的历史问诊单数据,得到目标患者的疾病类别;
[0111]
第二获取模块301,用于获取多种文章,确定多种文章中每种文章的疾病类型标签;
[0112]
推荐模块302,用于基于目标患者的疾病类别和每种文章的疾病类型标签,确定向目标患者推荐的文章。
[0113]
在一些实施例中,第一获取模块300,用于根据目标患者的历史问诊单数据,得到目标患者的疾病类别,包括:
[0114]
根据目标患者的历史问诊单数据,对目标患者的下单类别频次进行标记,得到目标患者的特征向量;下单类别频次表示目标患者在设定时间段内下载的不同类别的问诊单的频次;
[0115]
将目标患者的特征向量输入至预先训练的分类模型中,得到目标患者的疾病类别。
[0116]
在一些实施例中,第一获取模块300,用于根据目标患者的历史问诊单数据,对目标患者的下单类别频次进行标记,得到目标患者的特征向量,包括:
[0117]
根据目标患者的历史问诊单数据和预设疾病类别,对目标患者的下单类别频次进行标记;
[0118]
在目标患者对第一疾病类别下单的情况下,对第一疾病类别的特征值进行累加;第一疾病类别为预设疾病类别中的任意一种疾病类别;
[0119]
在目标患者对第一疾病类别未下单的情况下,第一疾病类别的特征值保持不变;
[0120]
基于目标患者对应的每种疾病类别的特征值,得到目标患者的特征向量。
[0121]
在一些实施例中,分类模型是通过以下步骤训练得到的:
[0122]
获取患者的历史问诊单数据集,将历史问诊单数据集划分为训练数据集和测试数据集;训练数据集包括:多个患者的历史问诊单数据和多个患者的疾病类别标签;
[0123]
根据多个患者的历史问诊单数据,对多个患者的下单类别频次进行标记,得到多个患者的特征向量;
[0124]
通过多个患者的特征向量以及疾病类别标签对分类模型进行训练,得到初始分类模型;
[0125]
根据测试数据集对初始分类模型进行调整,得到训练完成的分类模型。
[0126]
在一些实施例中,分类模型为k最近邻算法的模型。
[0127]
在一些实施例中,第二获取模块301,用于确定多种文章中每种文章的疾病类型标签,包括:
[0128]
对多种文章进行关键词提取,得到多种文章中每种文章的关键词;
[0129]
基于每种文章的关键词,对每种文章进行标签化处理,得到每种文章的疾病类型标签。
[0130]
在实际应用中,上述第一获取模块300、第二获取模块301和推荐模块302均可以由位于电子设备中的处理器实现,该处理器可以为asic、dsp、dspd、pld、fpga、cpu、控制器、微控制器、微处理器中的至少一种。
[0131]
另外,在本实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
[0132]
集成的单元如果以软件功能模块的形式实现并非作为独立的产品进行销售或使用时,可以存储在一个计算机可读取存储介质中,基于这样的理解,本实施例的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)或processor(处理器)执行本实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0133]
具体来讲,本实施例中的一种文章推荐方法对应的计算机程序指令可以被存储在光盘、硬盘、u盘等存储介质上,当存储介质中的与一种文章推荐方法对应的计算机程序指令被一电子设备读取或被执行时,实现前述实施例的任意一种文章推荐方法。
[0134]
基于前述实施例相同的技术构思,参见图4,其示出了本技术实施例提供的电子设备400,可以包括:存储器401和处理器402;其中,
[0135]
存储器401,用于存储计算机程序和数据;
[0136]
处理器402,用于执行存储器中存储的计算机程序,以实现前述实施例的任意一种文章推荐方法。
[0137]
在实际应用中,上述存储器401可以是易失性存储器(volatile memory),例如ram;或者非易失性存储器(non

volatile memory),例如rom、快闪存储器(flash memory)、硬盘(hard disk drive,hdd)或固态硬盘(solid

state drive,ssd);或者上述种类的存储器的组合,并向处理器402提供指令和数据。
[0138]
上述处理器402可以为asic、dsp、dspd、pld、fpga、cpu、控制器、微控制器、微处理器中的至少一种。可以理解地,对于不同的文章推荐设备,用于实现上述处理器功能的电子器件还可以为其它,本技术实施例不作具体限定。
[0139]
在一些实施例中,本技术实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
[0140]
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
[0141]
本技术所提供的各方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
[0142]
本技术所提供的各产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
[0143]
本技术所提供的各方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
[0144]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0145]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0146]
这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上,使得在计算机或其它可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0147]
以上,仅为本技术的较佳实施例而已,并非用于限定本技术的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献