一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用户识别模型训练方法、电子设备及计算机存储介质与流程

2021-11-03 14:32:00 来源:中国专利 TAG:


1.本发明涉及电子书技术领域,具体涉及一种用户识别模型训练方法、电子设备及计算机存储介质。


背景技术:

2.随着科技及社会的不断发展,电子书逐渐替代了传统的纸制书籍,各类电子产品,例如智能手机、平板电脑、电子阅读器等都支持电子阅读应用的安装,具备电子书阅读功能。
3.目前,各种电子阅读应用产品也层出不穷,如何留住用户是每个电子阅读应用产品的终极目标。在现有技术中,通常基于历史阅读内容或基于用户兴趣向用户推荐用户可能喜欢的产品,来增加用户的留存率。
4.然而,发明人在实施过程中发现,现有技术中至少存在如下缺陷:用户留存率依然较低。


技术实现要素:

5.鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的用户识别模型训练方法、电子设备及计算机存储介质。
6.根据本发明的一个方面,提供了一种用户识别模型训练方法,包括:
7.根据电子书应用第一用户的历史行为记录确定所述第一用户的用户属性,其中,所述用户属性为留存用户或流失用户,且所述留存用户为在使用所述电子书应用时满足特定要求的用户,所述流失用户为在使用所述电子书应用时不满足特定要求的用户;
8.从所述历史行为记录中提取与所述用户属性相符的用户行为特征,并构建表征所述用户行为特征的行为特征词集合;
9.基于所述行为特征词集合对用户识别模型进行训练,其中,用户识别模型用于预测用户属性及输出用户属性及对应的行为特征词。
10.根据本发明的一个方面,提供了一种电子书推荐方法,包括:
11.获取电子书应用第二用户的历史行为轨迹;
12.构建表征所述第二用户的历史行为轨迹的行为特征词集合;
13.根据所述第二用户的行为特征词集合和用户识别模型预测所述第二用户的用户属性,其中,所述用户属性为留存用户或流失用户,且所述留存用户为在所述电子书应用时满足特定要求的用户,所述流失用户为在所述电子书应用时不满足特定要求的用户;
14.根据所述第二用户的行为特征词集合和预测的用户属性进行电子书推荐。
15.根据本发明的另一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
16.所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如下操作:
17.根据电子书应用第一用户的历史行为记录确定所述第一用户的用户属性,其中,所述用户属性为留存用户或流失用户,且所述留存用户为在使用所述电子书应用时满足特定要求的用户,所述流失用户为在使用所述电子书应用时不满足特定要求的用户;
18.从所述历史行为记录中提取与所述用户属性相符的用户行为特征,并构建表征所述用户行为特征的行为特征词集合;
19.基于所述行为特征词集合进行用户识别模型训练,其中,所述用户识别模型用于预测用户属性及输出用户属性及对应的行为特征词。
20.根据本发明的另一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
21.所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如下操作:
22.获取电子书应用第二用户的历史行为轨迹;
23.构建表征所述第二用户的历史行为轨迹的行为特征词集合;
24.根据所述第二用户的行为特征词集合和用户识别模型预测所述第二用户的用户属性,其中,所述用户属性为留存用户或流失用户,且所述留存用户为在使用所述电子书应用时满足特定要求的用户,所述流失用户为在使用所述电子书应用时不满足特定要求的用户;
25.根据所述第二用户的行为特征词集合和预测的用户属性进行电子书推荐。
26.根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述用户识别模型训练方法对应的操作或执行上述电子书推荐方法对应的操作。
27.根据本发明公开的用户识别模型训练方法、电子设备及计算机存储介质,首先根据电子书应用第一用户的历史行为记录确定所述第一用户的用户属性,其中,所述用户属性为留存用户或流失用户,且所述留存用户为在使用所述电子书应用时满足特定要求的用户,所述流失用户为在使用所述电子书应用时不满足特定要求的用户,从所述历史行为记录中提取与所述用户属性相符的用户行为特征,并构建表征所述用户行为特征的行为特征词集合,然后基于所述行为特征词集合对用户识别模型进行训练,其中,用户识别模型用于预测用户属性及输出用户属性及对应的行为特征词。本方案根据表征用户行为特征的行为特征词集合训练得到用户识别模型,且该用户识别模型可以预测用户属性及输出用户属性及对应的行为特征词,输出的用户属性及对应的行为特征词可以作为电子书推荐的参考依据,进而实现精准推荐,从而提高用户留存率。
28.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
29.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
30.图1示出了根据本发明实施例一提供的一种用户识别模型训练方法的流程示意图;
31.图2示出了根据本发明实施例二提供的一种用户识别模型训练方法的流程示意图;
32.图3示出了根据本发明实施例三提供的一种用户识别模型训练方法的流程示意图;
33.图4示出了根据本发明实施例四提供的一种电子书推荐方法的流程示意图;
34.图5示出了根据本发明实施例五提供的一种电子书推荐方法的流程示意图;
35.图6示出了根据本发明实施例三提供的一种电子设备的结构示意图。
具体实施方式
36.下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
37.实施例一
38.图1示出了根据本发明实施例一提供的一种用户识别模型训练方法的流程示意图。其中,本实施例所提供的用户识别模型训练方法在用户端或服务端侧执行,例如可以由手机终端、电脑终端、阅读器、和/或智能可穿戴设备中的电子书应用用户端、或电子书应用服务器执行。
39.如图1所示,该方法包括:
40.步骤s110,根据电子书应用第一用户的历史行为记录确定第一用户的用户属性,其中,用户属性为留存用户或流失用户,且留存用户为在使用电子书应用时满足特定要求的用户,流失用户为在使用电子书应用时不满足特定要求的用户。
41.其中,为了区分本文中不同的用户,将本文中首次出现的电子书应用用户称为第一用户,后续出现的不同电子书应用用户依次称为第二用户。
42.其中,特定要求可以为用户在电子书应用中产生了特定行为(比如阅读行为、阅读时长、点击行为等)。
43.具体的,用户如果想要阅读电子书应用中的电子书,首先需要在电子书应用中注册账户,这样每个电子书应用用户都会拥有一个专属账号,根据该专属账号就可以获取到对应用户即第一用户的历史行为记录,在本步骤中,该第一用户可以为新注册用户,包括留存用户和/或流失用户,并且,对留存用户/流失用户的定义可以根据业务需要而改变。例如,三日留存用户就是新注册用户今天打开了电子书应用或者产生了特定行为(比如阅读行为),在三天后依然打开了电子书应用或者产生了特定行为,三日流失用户就是新注册用户今天打开了电子书应用或者产生了特定行为(比如阅读行为),而在三天后没有打开电子书应用或产生特定行为。
44.其中,该历史行为记录可以为第一用户即新注册用户历史行为记录,包括:打开电子书应用、登录电子书应用、选取电子书、阅读电子书及持续时长、阅读书评、阅读推荐内容、退出登录和注销登录等中的至少一种行为。
45.步骤s120,从历史行为记录中提取与用户属性相符的用户行为特征,并构建表征用户行为特征的行为特征词集合。
46.具体的,如果用户属性为留存用户,则从历史行为记录中提取与留存用户相符的用户行为特征,如果用户属性为流失用户,则从历史行为记录中提取与流失用户相符的用户行为特征。例如,如果一条历史行为记录中包括打开电子书应用、选取电子书、阅读电子书及持续时长、阅读书评和退出登录,如果用户属性为留存用户,则提取的用户行为特征为打开电子书应用、选取电子书、阅读电子书及持续时长,如果用户属性为流失用户,则提取的用户行为特征为阅读电子书及持续时长、阅读书评和退出登录。
47.并且,为了减少模型训练时的数据容量,可以将上述提取的用户行为特征简洁化、数据化,即基于提取的每个用户行为特征构建行为特征词,构成行为特征词集合。该行为特征词集合可以由行为特征词序列组成,例如包含至少一个行为特征词序列,且行为特征词序列由顺序固定的多个行为特征词组成。
48.并且,多个行为特征词中包含表征阅读行为的行为特征词。例如,顺序可由行为特征词对应的历史行为的先后执行顺序决定。同样采用上述例子,对于留存用户,其提取的用户行为特征为打开电子书应用、选取电子书、阅读电子书及持续时长,则对应的行为特征词为打开、选取电子书、阅读电子书,如果形成行为特征词序列,则为打开

选取电子书

阅读电子书,且行为特征词顺序固定。对于流失用户,其提取的用户行为特征为阅读电子书及持续时长、阅读书评和退出登录,则对应的行为特征词为阅读电子书、阅读书评、退出,如果形成行为特征词序列,则为阅读电子书

阅读书评

退出,且行为特征词顺序固定。
49.特别的,由于行为特征词的顺序对于预测结果是有影响的,例如,对于行为特征词序列观看激励视频

阅读电子书

退出和阅读电子书

观看激励视频

退出,通过固定顺序可以保证学习到具有先后关系的行为对于用户是否留存的影响。也就是说,在对用户识别模型进行训练时,发现阅读电子书

观看激励视频

退出这个词序下得到的输出结果对判断流失客户的准确性较高,那么就可以学习到在用户阅读电子书的时候不要给用户推送激励视频,因为这样很可能会导致用户流失,是一个反馈过程。
50.步骤s130,基于行为特征词集合对用户识别模型进行训练,其中,用户识别模型用于预测用户属性及输出用户属性及对应的行为特征词。
51.具体的,将行为特征词集合作为训练数据输入用户识别模型中训练,得到具有预测用户属性功能的用户识别模型,且该用户识别模型还可以输出用户属性及对应的行为特征词,为后续电子书推荐提供参考依据。
52.由此可见,本实施例能够根据表征用户行为特征的行为特征词集合训练得到用户识别模型,且该用户识别模型可以预测用户属性及输出用户属性及对应的行为特征词,输出的用户属性及对应的行为特征词可以作为电子书推荐的参考依据,进而实现精准推荐,从而提高用户留存率。
53.实施例二
54.图2示出了根据本发明实施二提供的一种用户识别模型训练方法的流程示意图。其中,本实施例所提供的用户识别模型训练方法是对实施例一中方法的进一步优化。
55.如图2所示,该方法包括:
56.步骤s210,根据电子书应用第一用户的历史行为记录确定第一用户的用户属性,
其中,用户属性为留存用户或流失用户,且留存用户为在使用电子书应用时满足特定要求的用户,流失用户为在使用电子书应用时不满足特定要求的用户。
57.步骤s220,从历史行为记录中提取与用户属性相符的用户行为特征,并构建表征用户行为特征的行为特征词集合。
58.步骤s230,根据第一用户的行为特征词和用户识别模型预测第一用户的用户属性。
59.具体的,将第一用户的行为特征词直接输入用户识别模型中进行预测,得到第一用户的用户属性。或者,当第一用户的行为特征词为多个时,将多个行为特征词按照固定顺序组成一个行为特征词序列,将行为特征词序列输入用户识别模型中进行预测,得到第一用户的用户属性。或者,基于模型参数将第一用户的行为特征词转换为多组子行为特征词序列,将多组子行为特征词序列输入用户识别模型中,通过用户识别模型预测第一用户的用户属性。该模型参数可以为初始模型参数也可以为在训练过程中为了提高预测准确率调整后的模型参数。例如,以用户识别模型为fasttext模型为例,例如对于word级的n

gram,如果模型参数为2、行为特征词序列为a

b

c

d

e,则将a

b

c

d

e转换成a

b、b

c、c

d、d

e,如果在模型训练过程中将模型参数调整为3,则将a

b

c

d

e转换成a

b

c、b

c

d、c

d

e,其中2、3表示行为特征词序列的窗口。
60.具体的,用户识别模型可以输出一个概率,根据该概率和预设阈值来判断是流失用户还是留存客户。例如:对于用户a,输入用户识别模型的行为特征词序列为(a

b

c

d),用户识别模型的输出为0.3,如果设置预设阈值是0.2,就会判断为流失用户,如果设置预设阈值是0.4,就会判断为留存用户。
61.因此,预设阈值可以根据具体的场景需求设定。例如,如果在某些场景上,更关注召回率(查全率)(为了筛选出更多的流失用户),在设定预设阈值上就考虑设定一个对应的召回率指标高的预设阈值;如果某些场景上,关注精确率(查准率)(为了更期望得到流失用户精确性),就设定一个对应的精确率指标高的预设阈值。
62.步骤s240,根据第一用户的真实用户属性和预测用户属性调整行为特征词集合或模型参数,得到满足预设条件的用户识别模型,其中,用户识别模型用于预测用户属性及输出用户属性及对应的行为特征词。
63.具体的,将第一用户的真实用户属性和预测用户属性进行比较,以确定用户识别模型的准确性,并根据比较结果调整行为特征词集合或模型参数,得到满足预设条件的用户识别模型。
64.对于行为特征词集合,可以调整行为特征词集合中各行为特征词的权重。例如,调高利于区分用户属性的行为特征词的权重,降低无用行为特征词的权重。或者,在行为特征词集合中增加利于区分用户属性的新行为特征词,或者,从行为特征词集合中删除无用的行为特征词。
65.对于模型参数,如果初始模型参数对于的用户识别模型预测的用户属性与真实用户属性不符,则调整模型参数,根据调整后的模型参数再来看用户识别模型预测的用户属性准确性是否满足要求。
66.由此可见,本实施例根据表征第一用户的用户行为特征的行为特征词集合训练得到用户识别模型,可用的训练数据量更多,且根据第一用户的真实用户属性和预测用户属
性调整行为特征词集合或模型参数,得到满足预设条件的用户识别模型,可以进一步提高用户识别模块的准确率,进而实现精准推荐,从而提高用户留存率。
67.实施例三
68.图3示出了根据本发明实施三提供的一种用户识别模型训练方法的流程示意图。其中,本实施例所提供的用户识别模型训练方法是对实施例一中方法的进一步优化。
69.如图3所示,该方法包括:
70.步骤s310,根据电子书应用第一用户的历史行为记录确定第一用户的用户属性,其中,用户属性为留存用户或流失用户,且留存用户为在使用电子书应用时满足特定要求的用户,流失用户为在使用电子书应用时不满足特定要求的用户。
71.步骤s320,统计流失客户和/或留存客户的比例,并形成转移概率矩阵。
72.具体的,可以根据用户属性的具体定义,将一定数量的已注册用户划分为留存用户及流失用户,比如抽取100名已注册用户,根据他们在注册三天后的活跃情况对该用户群体划分为留存用户及流失用户。
73.分析记录在电子书应用对应服务器上的这两个用户群体的历史行为,寻找两个用户群体的行为差异,例如,对于留存用户,该用户群体的阅读行为就比较多,而流失用户的阅读行为就比较少,可以进行统计,形成转移概率矩阵。
74.步骤s330,根据转移概率矩阵从各个历史行为记录中提取与流失客户和/或留存客户相符的用户行为特征,并构建表征用户行为特征的行为特征词集合。
75.具体的,通过转移概率矩阵,分析出的行为先后关系,来提取出行为特征词,例如,对阅读行为超过一定次数或者维持一定时长时就用行为特征词阅读电子书来表征,或者对于留存用户,该用户群体的点击动作就会比较多,而流失用户的点击动作就比较少,那么也可以设定一个标准,例如对点击动作超过一定数量时就用特征词点击来表征,采用类似的思路,获得一个能够反映用户行为差异的行为特征词集合。
76.进一步的,对于行为特征词的筛选可以包括:通过行为特征词的词频逆文本频率指数(term frequency

inverse document frequency,tf

idf)对用户行为进行初筛。例如,书籍曝光、登录行为等属于用户的通用行为,对于区分用户意义不大,再例如,有些行为比如参加端午节活动行为,对于用户来讲是特定时间发生的,在用户的生命周期内行为出现频率较低,这些行为也是需要过滤掉。
77.例如下表为转移概率矩阵示例,列表中列表示第一步行为、行表示第二步行为、对应的数值为统计出的流失客户的比例或者概率:
[0078] 阅读电子书做任务退出阅读推荐新书阅读弹窗广告0.10.10.50.2阅读书评0.10.30.10.05阅读电子书 0.10.120.1签到0.30.020.10.2
[0079]
从转移概率矩阵中可以看到,用户第一步阅读弹窗广告、第二步退出电子书应用的这个行为轨迹对应的流失客户比例在0.5,那么就把这个行为对应的行为特征词挑选出来即阅读广告和退出;对于转移概率矩阵中的0.05比例及以下对应的行为就筛掉,不考虑。
[0080]
步骤s340,基于行为特征词集合对用户识别模型进行训练,其中,用户识别模型用
于预测用户属性及输出用户属性及对应的行为特征词。
[0081]
由此可知,本实施例通过统计流失客户和/或留存客户的比例,并形成转移概率矩阵,根据转移概率矩阵从各个历史行为记录中提取与流失客户和/或留存客户相符的用户行为特征,并构建表征用户行为特征的行为特征词集合,可以获取准确度较高的训练数据,进而训练出预测准确率比较高的用户识别模型,进而实现精准推荐,从而提高用户留存率。
[0082]
实施例四
[0083]
图4示出了根据本发明实施四提供的一种电子书推荐方法的流程示意图。
[0084]
其中,本实施例所提供的用户识别模型训练方法是对实施例一中方法的进一步优化。
[0085]
如图4所示,该方法包括:
[0086]
步骤s410,获取电子书应用第二用户的历史行为轨迹。
[0087]
步骤s420,构建表征第二用户的历史行为轨迹的行为特征词集合。
[0088]
具体的,根据上述实施例中第二用户的历史行为记录,对第一用户的历史行为轨迹进行分析,使用建立起的行为特征词集合对其历史行为轨迹文本化,即确定该第二用户的历史行为轨迹与行为特征词集合中的哪些行为特征词符合,既而构建表征第二用户的历史行为轨迹的行为特征词集合。
[0089]
步骤s430,根据第二用户的行为特征词集合和用户识别模型预测第二用户的用户属性,其中,用户属性为留存用户或流失用户,且留存用户为在使用电子书应用时满足特定要求的用户,流失用户为在使用电子书应用时不满足特定要求的用户。
[0090]
步骤s440,根据第二用户的行为特征词集合和预测的用户属性进行电子书推荐。
[0091]
具体的,如果用户属性为留存用户,则根据行为特征词确定表征用户留存下来的行为特征,进而根据该留存下来的行为特征进行电子书推荐,例如,留存用户的行为特征词为选取电子书、阅读电子书,则可以确定留存用户的行为特征为阅读电子书,则可以给该留存用户推荐新书或阅读电子书的书评等。反之,如果用户属性为流失用户,则根据行为特征词确定导致用户流失的行为特征,进而根据该行为特征进行电子书推荐,例如,留存用户的行为特征词为选阅读电子书

阅读广告

退出,则可以确定流失用户的行为特征为阅读广告,则在该用户阅读电子书的时候不建议推荐广告。
[0092]
由此可见,本实施例通过构建表征第二用户的历史行为轨迹的行为特征词,根据第二用户的行为特征词和用户识别模型预测第二用户的用户属性,进一步根据用户属性及对应的行为特征词进行电子书推荐,可以实现精准推荐,提高用户留存率。
[0093]
实施例五
[0094]
图5示出了根据本发明实施五提供的一种电子书推荐方法的流程示意图。
[0095]
其中,本实施例所提供的用户识别模型训练方法是对实施例一中方法的进一步优化。
[0096]
如图5所示,该方法包括:
[0097]
步骤s510,获取电子书应用第二用户的历史行为轨迹。
[0098]
步骤s520,构建表征第二用户的历史行为轨迹的行为特征词集合。
[0099]
步骤s530,当第二用户的行为特征词为多个时,将多个行为特征词按照固定顺序组成一个行为特征词序列。
[0100]
具体的,由于行为特征词的顺序对于预测结果是有影响的,例如,对于行为特征词序列观看激励视频

阅读电子书

退出和阅读电子书

观看激励视频

退出,通过固定顺序可以保证学习到具有先后关系的行为对于用户是否留存的影响。也就是说,在对用户识别模型进行训练时,发现阅读电子书

观看激励视频

退出这个词序下得到的输出结果对判断流失客户的准确性较高,那么就可以学习到在用户阅读电子书的时候不要给用户推送激励视频,因为这样很可能会导致用户流失,是一个反馈过程。因此,将多个行为特征词按照固定顺序组成一个行为特征词序列,可以提高推荐精准度。
[0101]
在一个可选实施例中,本步骤具体包括:根据模型参数将第二用户的行为特征词序列转换为多个子行为特征词序列;将多个子行为特征词序列输入用户识别模型中,通过用户识别模型预测第二用户的用户属性。
[0102]
例如,以用户识别模型为fasttext模型为例,例如对于word级的n

gram,如果模型参数为2、行为特征词序列为a

b

c

d

e,则将a

b

c

d

e转换成a

b、b

c、c

d、d

e。如果。模型参数为3,则将a

b

c

d

e转换成a

b

c、b

c

d、c

d

e。
[0103]
步骤s540,根据第二用户的行为特征词序列集合和用户识别模型预测第二用户的用户属性,其中,用户属性为留存用户或流失用户,且留存用户为在使用电子书应用时满足特定要求的用户,流失用户为在使用电子书应用时不满足特定要求的用户。
[0104]
步骤s550,根据第二用户的行为特征词集合和预测的用户属性进行电子书推荐。
[0105]
由此可见,本实施例通过固定行为特征词的顺序,可以实现精准推荐,提高用户留存率。
[0106]
实施例六
[0107]
本发明实施例六提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的用户识别模型训练方法。
[0108]
可执行指令具体可以用于使得处理器执行以下操作:
[0109]
根据电子书应用第一用户的历史行为记录确定所述第一用户的用户属性,其中,所述用户属性为留存用户或流失用户,且所述留存用户为在使用所述电子书应用时满足特定要求的用户,所述流失用户为在使用所述电子书应用时不满足特定要求的用户;
[0110]
从所述历史行为记录中提取与所述用户属性相符的用户行为特征,并构建表征所述用户行为特征的行为特征词集合;
[0111]
基于所述行为特征词集合对用户识别模型进行训练,其中,用户识别模型用于预测用户属性及输出用户属性及对应的行为特征词。
[0112]
在一个可选实施例中,所述可执行指令使所述处理器执行如下操作:
[0113]
基于所述行为特征词集合构建表征所述第一用户的历史行为轨迹的行为特征词;
[0114]
根据所述第一用户的行为特征词和用户识别模型预测所述第一用户的用户属性;
[0115]
根据所述第一用户的真实用户属性和预测用户属性调整所述行为特征词集合或模型参数,得到满足预设条件的用户识别模型。
[0116]
在一个可选实施例中,所述可执行指令使所述处理器执行如下操作:
[0117]
根据所述第一用户的真实用户属性和预测用户属性调整所述行为特征词集合中各行为特征词的权重。
[0118]
在一个可选实施例中,所述可执行指令使所述处理器执行如下操作:
[0119]
根据所述第一用户的真实用户属性和预测用户属性在所述行为特征词集合中增加利于区分用户属性的新行为特征词或从所述行为特征词集合中删除无用的行为特征词。
[0120]
在一个可选实施例中,所述可执行指令使所述处理器执行如下操作:
[0121]
基于模型参数将所述第一用户的行为特征词转换为多组子行为特征词序列;
[0122]
将所述多组子行为特征词序列输入用户识别模型中,通过所述用户识别模型预测所述第一用户的用户属性。
[0123]
在一个可选实施例中,所述可执行指令使所述处理器执行如下操作:
[0124]
统计流失客户和/或留存客户的比例,并形成转移概率矩阵;
[0125]
根据所述转移概率矩阵从各个历史行为记录中提取与所述流失客户和/或留存客户相符的用户行为特征。
[0126]
在一个可选实施例中,所述可执行指令使所述处理器执行如下操作。
[0127]
在一个可选实施例中,所述多个行为特征词中包含表征阅读行为的行为特征词。
[0128]
由此可见,本实施例根据表征用户行为特征的行为特征词集合训练得到用户识别模型,且该用户识别模型可以预测用户属性及输出用户属性及对应的行为特征词,输出的用户属性及对应的行为特征词可以作为电子书推荐的参考依据,进而实现精准推荐,从而提高用户留存率。
[0129]
实施例七
[0130]
本发明实施例七提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的电子书推荐方法。
[0131]
可执行指令具体可以用于使得处理器执行以下操作:
[0132]
获取电子书应用第二用户的历史行为轨迹;
[0133]
构建表征所述第二用户的历史行为轨迹的行为特征词集合;
[0134]
根据所述第二用户的行为特征词集合和用户识别模型预测所述第二用户的用户属性,其中,所述用户属性为留存用户或流失用户,且所述留存用户为在使用所述电子书应用时满足特定要求的用户,所述流失用户为在使用所述电子书应用时不满足特定要求的用户;
[0135]
根据所述第二用户的行为特征词集合和预测的用户属性进行电子书推荐。
[0136]
在一个可选实施例中,所述可执行指令使所述处理器执行如下操作:
[0137]
当所述第二用户的行为特征词为多个时,将多个行为特征词按照固定顺序组成一个行为特征词序列;
[0138]
根据所述第二用户的行为特征词序列和用户识别模型预测所述第二用户的用户属性。
[0139]
在一个可选实施例中,所述可执行指令使所述处理器执行如下操作:
[0140]
根据模型参数将所述第二用户的行为特征词序列转换为多个子行为特征词序列;
[0141]
将所述多个子行为特征词序列输入用户识别模型中,通过所述用户识别模型预测所述第二用户的用户属性。
[0142]
在一个可选实施例中,所述多个行为特征词中包含表征阅读行为的行为特征词。
[0143]
由此可见,本实施例通过构建表征所述第二用户的历史行为轨迹的行为特征词,根据所述第二用户的行为特征词和用户识别模型预测所述第二用户的用户属性,进一步根据用户属性及对应的行为特征词进行电子书推荐,可以实现精准推荐,提高用户留存率。
[0144]
实施例八
[0145]
图6示出了根据本发明实施例八提供的一种电子设备的结构示意图。本发明具体实施例并不对电子设备的具体实现做限定。
[0146]
如图6所示,该电子设备可以包括:处理器(processor)602、通信接口(communications interface)604、存储器(memory)606、以及通信总线608。
[0147]
其中:处理器602、通信接口604、以及存储器606通过通信总线608完成相互间的通信。通信接口604,用于与其它设备比如客户端或其它服务器等的网元通信。处理器602,用于执行程序610,具体可以执行上述方法实施例中的相关步骤。
[0148]
具体地,程序610可以包括程序代码,该程序代码包括计算机操作指令。
[0149]
处理器602可能是中央处理器cpu,或者是特定集成电路asic(application specific integrated circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。
[0150]
存储器606,用于存放程序610。存储器606可能包含高速ram存储器,也可能还包括非易失性存储器(non

volatile memory),例如至少一个磁盘存储器。
[0151]
程序610具体可以用于使得处理器602执行以下操作:
[0152]
根据电子书应用第一用户的历史行为记录确定所述第一用户的用户属性,其中,所述用户属性为留存用户或流失用户,且所述留存用户为在使用所述电子书应用时满足特定要求的用户,所述流失用户为在使用所述电子书应用时不满足特定要求的用户;
[0153]
从所述历史行为记录中提取与所述用户属性相符的用户行为特征,并构建表征所述用户行为特征的行为特征词集合;
[0154]
基于所述行为特征词集合对用户识别模型进行训练,其中,用户识别模型用于预测用户属性及输出用户属性及对应的行为特征词。
[0155]
在一个可选实施例中,所述可执行指令使所述处理器执行如下操作:
[0156]
基于所述行为特征词集合构建表征所述第一用户的历史行为轨迹的行为特征词;
[0157]
根据所述第一用户的行为特征词和用户识别模型预测所述第一用户的用户属性;
[0158]
根据所述第一用户的真实用户属性和预测用户属性调整所述行为特征词集合或模型参数,得到满足预设条件的用户识别模型。
[0159]
在一个可选实施例中,所述可执行指令使所述处理器执行如下操作:
[0160]
根据所述第一用户的真实用户属性和预测用户属性调整所述行为特征词集合中各行为特征词的权重。
[0161]
在一个可选实施例中,所述可执行指令使所述处理器执行如下操作:
[0162]
根据所述第一用户的真实用户属性和预测用户属性在所述行为特征词集合中增加利于区分用户属性的新行为特征词或从所述行为特征词集合中删除无用的行为特征词。
[0163]
在一个可选实施例中,所述可执行指令使所述处理器执行如下操作:
[0164]
基于模型参数将所述第一用户的行为特征词转换为多组子行为特征词序列;
[0165]
将所述多组子行为特征词序列输入用户识别模型中,通过所述用户识别模型预测所述第一用户的用户属性。
[0166]
在一个可选实施例中,所述可执行指令使所述处理器执行如下操作:
[0167]
统计流失客户和/或留存客户的比例,并形成转移概率矩阵;
[0168]
根据所述转移概率矩阵从各个历史行为记录中提取与所述流失客户和/或留存客户相符的用户行为特征。
[0169]
在一个可选实施例中,所述可执行指令使所述处理器执行如下操作。
[0170]
在一个可选实施例中,所述多个行为特征词中包含表征阅读行为的行为特征词。
[0171]
由此可见,本实施例根据表征用户行为特征的行为特征词集合训练得到用户识别模型,且该用户识别模型可以预测用户属性及输出用户属性及对应的行为特征词,输出的用户属性及对应的行为特征词可以作为电子书推荐的参考依据,进而实现精准推荐,从而提高用户留存率。
[0172]
实施例九
[0173]
图6示出了根据本发明实施例九提供的一种电子设备的结构示意图。本发明具体实施例并不对电子设备的具体实现做限定。
[0174]
如图6所示,该电子设备可以包括:处理器(processor)602、通信接口(communications interface)604、存储器(memory)606、以及通信总线608。
[0175]
其中:处理器602、通信接口604、以及存储器606通过通信总线608完成相互间的通信。通信接口604,用于与其它设备比如客户端或其它服务器等的网元通信。处理器602,用于执行程序610,具体可以执行上述方法实施例中的相关步骤。
[0176]
具体地,程序610可以包括程序代码,该程序代码包括计算机操作指令。
[0177]
处理器602可能是中央处理器cpu,或者是特定集成电路asic(application specific integrated circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。
[0178]
存储器606,用于存放程序610。存储器606可能包含高速ram存储器,也可能还包括非易失性存储器(non

volatile memory),例如至少一个磁盘存储器。
[0179]
程序610具体可以用于使得处理器602执行以下操作:
[0180]
获取电子书应用第二用户的历史行为轨迹;
[0181]
构建表征所述第二用户的历史行为轨迹的行为特征词集合;
[0182]
根据所述第二用户的行为特征词和用户识别模型预测所述第二用户的用户属性,其中,所述用户属性为留存用户或流失用户,且所述留存用户为在使用所述电子书应用时满足特定要求的用户,所述流失用户为在使用所述电子书应用时不满足特定要求的用户;
[0183]
根据所述第二用户的行为特征词集合和预测的用户属性进行电子书推荐。
[0184]
在一个可选实施例中,程序610具体可以用于使得处理器602执行以下操作:
[0185]
当所述第二用户的行为特征词为多个时,将多个行为特征词按照固定顺序组成一个行为特征词序列;
[0186]
根据所述第二用户的行为特征词序列和用户识别模型预测所述第二用户的用户属性。
[0187]
在一个可选实施例中,程序610具体可以用于使得处理器602执行以下操作:
[0188]
根据模型参数将所述第二用户的行为特征词序列转换为多个子行为特征词序列;
[0189]
将所述多个子行为特征词序列输入用户识别模型中,通过所述用户识别模型预测所述第二用户的用户属性。
[0190]
在一个可选实施例中,所述多个行为特征词中包含表征阅读行为的行为特征词。
[0191]
由此可见,本实施例通过构建表征所述第二用户的历史行为轨迹的行为特征词,根据所述第二用户的行为特征词和用户识别模型预测所述第二用户的用户属性,进一步根据用户属性及对应的行为特征词进行电子书推荐,可以实现精准推荐,提高用户留存率。
[0192]
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0193]
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0194]
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
[0195]
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0196]
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0197]
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备
或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0198]
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
[0199]
本发明公开了:a1.一种用户识别模型训练方法,包括:
[0200]
根据电子书应用第一用户的历史行为记录确定所述第一用户的用户属性,其中,所述用户属性为留存用户或流失用户,且所述留存用户为在使用所述电子书应用时满足特定要求的用户,所述流失用户为在使用所述电子书应用时不满足特定要求的用户;
[0201]
从所述历史行为记录中提取与所述用户属性相符的用户行为特征,并构建表征所述用户行为特征的行为特征词集合;
[0202]
基于所述行为特征词集合对用户识别模型进行训练,其中,用户识别模型用于预测用户属性及输出用户属性及对应的行为特征词。
[0203]
a2.根据权利要求a1所述的方法,其中,所述基于所述行为特征词集合对用户识别模型进行训练,包括:
[0204]
根据所述第一用户的行为特征词和用户识别模型预测所述第一用户的用户属性;
[0205]
根据所述第一用户的真实用户属性和预测用户属性调整所述行为特征词集合或模型参数,得到满足预设条件的用户识别模型。
[0206]
a3.根据权利要求a2所述的方法,其中,所述根据所述第一用户的真实用户属性和预测用户属性调整所述行为特征词集合,包括:
[0207]
根据所述第一用户的真实用户属性和预测用户属性调整所述行为特征词集合中各行为特征词的权重。
[0208]
a4.根据权利要求a2所述的方法,其中,所述根据所述第一用户的真实用户属性和预测用户属性调整所述行为特征词集合,包括:
[0209]
根据所述第一用户的真实用户属性和预测用户属性在所述行为特征词集合中增加利于区分用户属性的新行为特征词或从所述行为特征词集合中删除无用的行为特征词。
[0210]
a5.根据权利要求a2所述的方法,其中,所述根据所述第一用户的行为特征词和用户识别模型预测所述第一用户的用户属性,包括:
[0211]
基于模型参数将所述第一用户的行为特征词转换为多组子行为特征词序列;
[0212]
将所述多组子行为特征词序列输入用户识别模型中,通过所述用户识别模型预测所述第一用户的用户属性。
[0213]
a6.根据权利要求a1所述的方法,其中,所述从所述历史行为记录中提取与所述用户属性相符的用户行为特征,包括:
[0214]
统计流失客户和/或留存客户的比例,并形成转移概率矩阵;
[0215]
根据所述转移概率矩阵从各个历史行为记录中提取与所述流失客户和/或留存客户相符的用户行为特征。
[0216]
a7.根据权利要求a1

a6任一项所述的方法,其中,所述行为特征词集合包含至少一个行为特征词序列,且所述行为特征词序列由顺序固定的多个行为特征词组成。
[0217]
a8.根据权利要求a7所述的方法,其中,所述多个行为特征词中包含表征阅读行为的行为特征词。
[0218]
本发明还公开了:b9.一种电子书推荐方法,包括:
[0219]
获取电子书应用第二用户的历史行为轨迹;
[0220]
构建表征所述第二用户的历史行为轨迹的行为特征词集合;
[0221]
根据所述第二用户的行为特征词集合和用户识别模型预测所述第二用户的用户属性,其中,所述用户属性为留存用户或流失用户,且所述留存用户为在使用所述电子书应用时满足特定要求的用户,所述流失用户为在使用所述电子书应用时不满足特定要求的用户;
[0222]
根据所述第二用户的行为特征词集合和预测的用户属性进行电子书推荐。
[0223]
b10.根据权利要求b9所述的方法,其中,所述根据所述第二用户的行为特征词集合和用户识别模型预测所述第二用户的用户属性,包括:
[0224]
当所述第二用户的行为特征词为多个时,将多个行为特征词按照固定顺序组成一个行为特征词序列;
[0225]
根据所述第二用户的行为特征词序列和用户识别模型预测所述第二用户的用户属性。
[0226]
b11.根据权利要求b10所述的方法,其中,所述根据所述第二用户的行为特征词序列和用户识别模型预测所述第二用户的用户属性,包括:
[0227]
根据模型参数将所述第二用户的行为特征词序列转换为多个子行为特征词序列;
[0228]
将所述多个子行为特征词序列输入用户识别模型中,通过所述用户识别模型预测所述第二用户的用户属性。
[0229]
b12.根据权利要求b10或b11所述的方法,其中,所述多个行为特征词中包含表征阅读行为的行为特征词。
[0230]
b13.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
[0231]
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如下操作:
[0232]
根据电子书应用第一用户的历史行为记录确定所述第一用户的用户属性,其中,所述用户属性为留存用户或流失用户,且所述留存用户为在使用所述电子书应用时满足特定要求的用户,所述流失用户为在使用所述电子书应用时不满足特定要求的用户;
[0233]
从所述历史行为记录中提取与所述用户属性相符的用户行为特征,并构建表征所述用户行为特征的行为特征词集合;
[0234]
基于所述行为特征词集合进行用户识别模型训练,其中,所述用户识别模型用于预测用户属性及输出用户属性及对应的行为特征词。
[0235]
b14.根据权利要求b13所述的电子设备,其中,当所述电子书封面文件为多个时,所述可执行指令使所述处理器执行如下操作:
[0236]
基于所述行为特征词集合构建表征所述第一用户的历史行为轨迹的行为特征词;
[0237]
根据所述第一用户的行为特征词和用户识别模型预测所述第一用户的用户属性;
[0238]
根据所述第一用户的真实用户属性和预测用户属性调整所述行为特征词集合或模型参数,得到满足预设条件的用户识别模型。
[0239]
b15.根据权利要求b14所述的电子设备,其中,当所述电子书封面文件为多个时,所述可执行指令使所述处理器执行如下操作:
[0240]
根据所述第一用户的真实用户属性和预测用户属性调整所述行为特征词集合中各行为特征词的权重。
[0241]
b16.根据权利要求b14所述的电子设备,其中,当所述电子书封面文件为多个时,所述可执行指令使所述处理器执行如下操作:
[0242]
根据所述第一用户的真实用户属性和预测用户属性在所述行为特征词集合中增加利于区分用户属性的新行为特征词或从所述行为特征词集合中删除无用的行为特征词。
[0243]
b17.根据权利要求b14所述的电子设备,其中,当所述电子书封面文件为多个时,所述可执行指令使所述处理器执行如下操作:
[0244]
基于模型参数将所述第一用户的行为特征词转换为多组子行为特征词序列;
[0245]
将所述多组子行为特征词序列输入用户识别模型中,通过所述用户识别模型预测所述第一用户的用户属性。
[0246]
b18.根据权利要求b13所述的电子设备,其中,当所述电子书封面文件为多个时,所述可执行指令使所述处理器执行如下操作:
[0247]
统计流失客户和/或留存客户的比例,并形成转移概率矩阵;
[0248]
根据所述转移概率矩阵从各个历史行为记录中提取与所述流失客户和/或留存客户相符的用户行为特征。
[0249]
b19.根据权利要求b13

b18任一项所述的电子设备,其中,所述行为特征词集合包含至少一个行为特征词序列,且所述行为特征词序列由顺序固定的多个行为特征词组成。
[0250]
b20.根据权利要求b19所述的电子设备,其中,所述多个行为特征词中包含表征阅读行为的行为特征词。
[0251]
本发明还公开了:c21.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
[0252]
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如下操作:
[0253]
获取电子书应用第二用户的历史行为轨迹;
[0254]
构建表征所述第二用户的历史行为轨迹的行为特征词集合;
[0255]
根据所述第二用户的行为特征词集合和用户识别模型预测所述第二用户的用户属性,其中,所述用户属性为留存用户或流失用户,且所述留存用户为在所述电子书应用时满足特定要求的用户,所述流失用户为在所述电子书应用时不满足特定要求的用户;
[0256]
根据所述第二用户的行为特征词集合和预测的用户属性进行电子书推荐。
[0257]
c22.根据权利要求c21所述的电子设备,其中,当所述电子书封面文件为多个时,
所述可执行指令使所述处理器执行如下操作:
[0258]
当所述第二用户的行为特征词为多个时,将多个行为特征词按照固定顺序组成一个行为特征词序列;
[0259]
根据所述第二用户的行为特征词序列和用户识别模型预测所述第二用户的用户属性。
[0260]
c23.根据权利要求c22所述的电子设备,其中,当所述电子书封面文件为多个时,所述可执行指令使所述处理器执行如下操作:
[0261]
根据模型参数将所述第二用户的行为特征词序列转换为多个子行为特征词序列;
[0262]
将所述多个子行为特征词序列输入用户识别模型中,通过所述用户识别模型预测所述第二用户的用户属性。
[0263]
c24.根据权利要求c22或c23所述的电子设备,其中,所述多个行为特征词中包含表征阅读行为的行为特征词。
[0264]
本发明还公开了:d25.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求a1

a8中任一项所述的用户识别模型训练方法对应的操作或执行如权利要求b9

b12中任一项所述的电子书推荐方法对应的操作。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献