一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于人工智能的信息推荐方法、装置、设备及存储介质与流程

2022-02-21 04:13:13 来源:中国专利 TAG:


1.本技术属于人工智能技术领域,尤其涉及一种基于人工智能的信息推荐方法、装置、设 备及存储介质。


背景技术:

2.目前个人门户网站和第三方门户网站不是互通的,且很多门户网站不统计用户行为, 或者隐藏用户行为,对于第三方平台来说,无法直接通过分析用户行为数据的方式来推荐门 户网站信息;基于新闻热度推送新闻的方式存在新闻热度评估不够准确,无法结合用户个人 偏好进行准确推送的问题。


技术实现要素:

3.鉴于以上内容,本发明提供一种基于人工智能的信息推荐方法、装置、设备及存储介质, 其目的在于解决现有技术中推荐信息不准确的技术问题。
4.为实现上述目的,本发明提供一种基于人工智能的信息推荐方法,所述方法,包括:
5.当接收到个人门户网站的登录请求时,解析所述登录请求,得到用户的标识信息;
6.根据所述标识信息,在数据库中查找与所述标识信息对应的个人信息及用户行为数据;
7.根据所述个人信息及所述用户行为数据,查找对应的互联网热点信息,通过关键词匹配 的方式从所述互联网热点信息中抽取出话题信息;
8.通过预先训练的信息推荐模型对所述话题信息与所述个人门户网站中的资源数据进行 分析,得到所述话题信息与各资源数据之间的关联度;
9.根据所述话题信息与各资源数据之间的关联度,确定推荐信息,并将所述推荐信息推荐 给所述用户。
10.优选的,所述当接收到个人门户网站的登录请求时,解析所述登录请求,得到用户的标 识信息,包括:
11.根据所述标识信息,获取所述标识信息对应的标识属性;
12.根据预设的转换规则对所述标识属性进行转换,得到所述标识属性对应的地址标识码;
13.根据所述地址标识码,确定所述用户的用户来源。
14.优选的,所述根据所述个人信息及所述用户行为数据,查找对应的互联网热点信息,通 过关键词匹配的方式从所述互联网热点信息中抽取出话题信息,包括:
15.根据网站权重在搜索引擎中获取排名靠前的网络信息,将所述网络信息确定为所述互联 网热点信息;
16.通过预先训练的文章分类模型对所述互联网热点信息进行分类,得到各所述互联网热点 信息所属的热点类别;
17.通过关键词匹配的方式从所述互联网热点信息中抽取出话题信息,并生成所述热点类别 与所述话题信息的对应关系。
18.优选的,所述通过预先训练的信息推荐模型对所述话题信息与所述个人门户网站中的资 源数据进行分析,得到所述话题信息与各资源数据之间的关联度,包括:
19.通过所述预先训练的信息推荐模型,提取各所述资源数据对应的关键词;
20.对各所述关键字进行向量化处理,得到每个所述资源数据对应的表征向量。
21.优选的,所述通过预先训练的信息推荐模型对所述话题信息与所述个人门户网站中的资 源数据进行分析,得到所述话题信息与各资源数据之间的关联度,还包括:
22.计算所述话题信息与各所述表征向量之间的欧式距离;
23.根据所述话题信息与各所述表征向量之间的欧式距离,确定所述话题信息与各所述表征 向量之间的关联度。
24.优选的,所述用户行为数据包括:所述用户对应的关注信息、输入记录信息、收藏信息、 浏览信息;所述个人信息包括所述用户的姓名、年龄、账号信息以及爱好信息。
25.优选的,通过预先训练的信息推荐模型对所述话题信息与所述个人门户网站中的资源数 据进行分析,得到所述话题信息与各资源数据之间的关联度之前,包括:
26.基于机器学习对样本数据进行学习,并根据机器学习的学习结果实时调整训练中的信息 推荐模型的参数;
27.当检测到训练中的信息推荐模型对应的损失函数收敛时,得到预先训练的信息推荐模型。
28.为实现上述目的,本发明还提供一种基于人工智能的信息推荐装置,所述装置包括:
29.获取模块,用于当接收到个人门户网站的登录请求时,解析所述登录请求,得到用户的 标识信息;
30.查找模块,用于根据所述标识信息,在数据库中查找与所述标识信息对应的个人信息及 用户行为数据;
31.抽取模块,用于根据所述个人信息及所述用户行为数据,查找对应的互联网热点信息, 通过关键词匹配的方式从所述互联网热点信息中抽取出话题信息;
32.分析模块,用于通过预先训练的信息推荐模型对所述话题信息与所述个人门户网站中的 资源数据进行分析,得到所述话题信息与各资源数据之间的关联度;
33.推荐模块,用于根据所述话题信息与各资源数据之间的关联度,确定推荐信息,并将所 述推荐信息推荐给所述用户。
34.为实现上述目的,本发明还提供一种电子设备,所述电子设备包括:
35.至少一个处理器;以及,
36.与所述至少一个处理器通信连接的存储器;其中,
37.所述存储器存储有可被所述至少一个处理器执行的程序,所述程序被所述至少一个处理 器执行,以使所述至少一个处理器能够执行所述基于人工智能的信息推荐方法。
38.为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存 储有基于人工智能的信息推荐程序,所述基于人工智能的信息推荐程序被处理器执行时,实 现所述基于人工智能的信息推荐方法的步骤。
39.本发明结合个人信息及用户行为数据对互联网热点信息中的话题信息进行抽取,并结合 话题信息通过预先训练的信息推荐模型对话题信息与个人门户网站中的资源数据进行分析, 从而确定推荐信息,使得推荐信息可以结合互联网热点信息,同时又与用户个人信息及用户 行为数据相关联,做到即结合时事热点咨询,又没有偏离用户个人偏好和行为习惯,确定出 准确的推荐信息并推荐给用户,提升了推荐信息的准确性。
附图说明
40.为了更清楚地说明本技术的实施例中的技术方案,下面将对实施例或现有技术描述中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例, 对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其 他的附图。
41.图1为本发明电子设备较佳实施例的示意图;
42.图2为图1中基于人工智能的信息推荐装置较佳实施例的模块示意图;
43.图3为本发明基于人工智能的信息推荐方法较佳实施例的流程图;
44.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
45.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发 明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于 限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所 获得的所有其他实施例,都属于本发明保护的范围。
46.参照图1所示,为本发明电子设备1较佳实施例的示意图。
47.该电子设备1包括但不限于:存储器11、处理器12、显示器13及网络接口14。所述电 子设备1通过网络接口14连接网络,获取原始数据。其中,所述网络可以是企业内部网 (intranet)、互联网(internet)、全球移动通讯系统(global system of mobilecommunication,gsm)、 宽带码分多址(wideband code division multiple access,wcdma)、4g网络、5g网络、蓝 牙(bluetooth)、wi-fi通话网络等无线或有线网络。
48.其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬 盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机 访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只 读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所 述电子设备1的内部存储单元,例如该电子设备1的硬盘或内存。在另一些实施例中,所述 存储器11也可以是所述电子设备1的外部存储设备,例如该电子设备1配备的插接式硬盘, 智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。
49.当然,所述存储器11还可以既包括所述电子设备1的内部存储单元也包括其外部存储 设备。本实施例中,存储器11通常用于存储安装于所述电子设备1的操作系统和各类应用 软件,例如基于人工智能的信息推荐程序10的程序代码等。此外,存储器11还可以用于暂 时地存储已经输出或者将要输出的各类数据。
50.处理器12在一些实施例中可以是中央处理器(central processing unit,cpu)、控制器、 微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子设备1的 总体操作,例如执行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12 用于运行所述存储器11中存储的程序代码或者处理数据,例如运行基于人工智能的信息推 荐程序10的程序代码等。
51.显示器13可以称为显示屏或显示单元。在一些实施例中显示器13可以是led显示器、 液晶显示器、触控式液晶显示器以及有机发光二极管(organic light-emittingdiode,oled) 触摸器等。显示器13用于显示在电子设备1中处理的信息以及用于显示可视化的工作界面, 例如显示数据统计的结果。
52.网络接口14可选地可以包括标准的有线接口、无线接口(如wi-fi接口),该网络接口 14通常用于在所述电子设备1与其它电子设备之间建立通信连接。
53.图1仅示出了具有组件11-14以及基于人工智能的信息推荐程序10的电子设备1,但是 应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
54.可选地,所述电子设备1还可以包括目标用户接口,目标用户接口可以包括显示器 (display)、输入单元比如键盘(keyboard),可选的目标用户接口还可以包括标准的有线接口、 无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液 晶显示器以及有机发光二极管(organic light-emitting diode,oled)触摸器等。其中,显示 器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示 可视化的目标用户界面。
55.该电子设备1还可以包括射频(radio frequency,rf)电路、传感器和音频电路等等,在 此不再赘述。
56.在上述实施例中,处理器12执行存储器11中存储的基于人工智能的信息推荐程序10 时可以实现如下步骤:
57.当接收到个人门户网站的登录请求时,解析所述登录请求,得到用户的标识信息;
58.根据所述标识信息,在数据库中查找与所述标识信息对应的个人信息及用户行为数据;
59.根据所述个人信息及所述用户行为数据,查找对应的互联网热点信息,通过关键词匹配 的方式从所述互联网热点信息中抽取出话题信息;
60.通过预先训练的信息推荐模型对所述话题信息与所述个人门户网站中的资源数据进行 分析,得到所述话题信息与各资源数据之间的关联度;
61.根据所述话题信息与各资源数据之间的关联度,确定推荐信息,并将所述推荐信息推荐 给所述用户。
62.关于上述步骤的详细介绍,请参照下述图2关于基于人工智能的信息推荐装置100实施 例的功能模块图以及图3关于基于人工智能的信息推荐方法实施例的流程图的说明。
63.参照图2所示,为本发明基于人工智能的信息推荐装置100的功能模块图。
64.本发明所述基于人工智能的信息推荐装置100可以安装于电子设备中。根据实现的功能, 所述基于人工智能的信息推荐装置100可以包括:获取模块110、查找模块120、抽取模块 130、分析模块140及推荐模块150。本发明所述模块也可以称之为单元,是指一种能够被电 子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电
子设备的 存储器中。
65.在本实施例中,关于各模块/单元的功能如下:
66.获取模块110,用于当接收到个人门户网站的登录请求时,解析所述登录请求,得到用 户的标识信息。
67.在示例性的实施例中,个人门户网站可以是任意类型的个人门户网站。例如,可以是购 物类的个人门户网站、金融类的个人门户网站、学校的个人门户网站、新闻类的个人门户网 站、旅游类的个人门户网站、娱乐类的个人门户网站、搜索引擎类的个人门户网站、地区性 的个人门户网站等。
68.示例性地,获取个人门户网站上登录的用户的标识信息,该标识信息用于区别不同用户 之间的身份,每个用户的标识信息指代唯一一个用户。
69.例如,标识信息可以是用户身份标识号(identity document,id),每个用户id指代唯 一一个用户,不同的登录用户的用户id也不同,通过获取个人门户网站上登录的用户的用 户id,便于后续提取该用户id对应的数据,从而实现针对该用户的信息推荐。其中,用户 id可以包括身份证标识号、注册的账号、预先为每个用户设定的唯一编码、手机号等。此 处仅为示例性说明,对此不做限定。
70.示例性地,当检测到用户登录个人门户网站时,获取当前登录的该用户的标识信息。
71.可选地,在一种可能的实现过程中,所述当接收到个人门户网站的登录请求时,解析所 述登录请求,得到用户的标识信息,包括:
72.根据所述标识信息,获取所述标识信息对应的标识属性;
73.根据预设的转换规则对所述标识属性进行转换,得到所述标识属性对应的地址标识码;
74.根据所述地址标识码,确定所述用户的用户来源。
75.本实施例中,获取标识信息对应的标识属性,标识属性用于对用户来源的终端信息进行 标识,用户来源的终端信息包括:pc端网页访问来源、移动端应用程序访问来源、移动端 小程序访问来源。对不同用户来源进行识别,针对不同的用户来源配置的配置信息不同,增 强推荐信息匹配性。
76.查找模块120,用于根据所述标识信息,在数据库中查找与所述标识信息对应的个人信 息及用户行为数据;
77.在示例性的实施例中,个人信息可包括该用户对应的姓名、年龄、性别、身高、联系方 式、住址、身份证号、学历、工作、该用户在个人门户网站注册的账号信息、爱好等信息。 用户行为数据包括该用户在目标个人门户网站对应的关注信息、输入记录信息、收藏信息、 浏览信息、评论信息、浏览时长、屏蔽记录、搜索记录、分享记录等。
78.在个人门户网站的数据库中,存储有每个用户的标识信息,以及每个标识信息对应的个 人信息和用户行为数据。当获取到用户的标识信息后,基于该用户的标识信息,在数据库中 查找与该标识信息对应的个人信息和用户行为数据。
79.示例性地,用户根据某个个人门户网站的注册流程,填写登录账号(可作为该用户的用 户id)和密码,在个人门户网站进行注册,个人门户网站根据用户填写的登录账号和密码 为该用户生成账号信息。还可提示该用户完善信息,以此收集到该用户的姓名、年龄、
性别、 身高、联系方式、住址、爱好等信息。将用户对应的账号信息以及其完善的这些信息归类为 该用户对应的个人信息,将个人信息与该用户的用户id关联,并将关联后的信息存储于个 人门户网站对应的数据库中。
80.当用户登录个人门户网站,并在该个人门户网站中进行关注、收藏、搜索、浏览、屏蔽、 删除、评论等操作时,记录该用户的这些操作行为,以及记录基于这些操作行为所产生的数 据。将该用户的这些操作行为以及基于这些操作行为所产生的数据归类为该用户对应的用户 行为数据,将用户行为数据与该用户的标识信息关联,并将关联后的信息存储于个人门户网 站对应的数据库中。此处仅为示例性说明,对此不做限定。
81.当获取到用户的用户id后,基于该用户的用户id,在数据库中查找与该用户id对应 的个人信息和用户行为数据。
82.上述实施例中,通过获取个人门户网站的用户的用户id,便于后续提取该用户的个人 信息以及用户行为数据,从而有针对性地为该用户推荐准确的信息。
83.可选地,在一种可能的实现过程中,根据标识信息提取用户的初始数据;剔除初始数据 中用户的随机行为数据,得到目标数据,该目标数据为与标识信息对应的个人信息及用户行 为数据。
84.示例性地,初始数据中也包括用户行为数据以及该用户的个人信息。其中,初始数据中 的用户行为数据与个人信息,与上述目标数据中包括的用户行为数据以及个人信息相同。确 定初始数据中的用户行为数据中的随机行为数据,并剔除这些随机行为数据,得到目标数据。
85.随机行为数据是指,在一定条件下,突然出现的行为所产生的数据。例如,用户总是浏览时事新闻信息,突然某次浏览了明星信息,之后也再没有浏览过明星信息,可能是用户手滑不小心浏览到明星信息。由于浏览明星信息产生的数据,就是该用户的随机行为数据。
86.示例性地,可检测一定时间内,用户浏览不同类型信息的次数,若检测到浏览某种信息 的次数小于预设次数,则将浏览该类型信息产生的行为数据标记为随机行为数据。
87.可选地,也可检测一定时间内,用户浏览不同类型信息的时长,若检测到浏览某种信息 的时长小于预设时长,则将浏览该类型信息产生的行为数据标记为随机行为数据。此处仅为 示例性说明,对此不做限定。
88.确定出用户行为数据中所有的随机行为数据,并剔除这些随机行为数据,得到目标数据。
89.上述实施方式中,剔除了用户行为数据中的随机行为数据,避免后续随机行为数据带来 干扰,能够准确查找对应的互联网热点信息,进而便于后续准确地计算话题信息与各资源数 据之间的关联度,从而基于关联度为用户推荐准确的信息。且提取剔除了随机行为数据,减 少了模型的工作量,进而提升了处理速度。
90.抽取模块130,用于根据所述个人信息及所述用户行为数据,查找对应的互联网热点信 息,通过关键词匹配的方式从所述互联网热点信息中抽取出话题信息;
91.可选地,在一种可能的实现过程中,所述根据所述个人信息及所述用户行为数据,查找 对应的互联网热点信息,通过关键词匹配的方式从所述互联网热点信息中抽取出话题信息, 包括:
92.根据网站权重在搜索引擎中获取排名靠前的网络信息,将所述网络信息确定为所述互联 网热点信息;
93.通过预先训练的文章分类模型对所述互联网热点信息进行分类,得到各所述互联网热点 信息所属的热点类别;
94.通过关键词匹配的方式从所述互联网热点信息中抽取出话题信息,并生成所述热点类别 与所述话题信息的对应关系。
95.本实施例通过从互联网热点信息中抽取话题信息,使得推荐信息可以结合互联网热点信 息,同时又与用户个人信息及用户行为数据相关联,做到即结合时事热点咨询,又没有偏离 用户个人偏好和行为习惯,确定出准确的推荐信息并推荐给用户,提升了推荐信息的准确性。
96.分析模块140,用于通过预先训练的信息推荐模型对所述话题信息与所述个人门户网站 中的资源数据进行分析,得到所述话题信息与各资源数据之间的关联度。
97.在本实施例中,推荐信息的设备中预先训练的信息推荐模型,该预先训练的信息推荐模 型可以是lstm模型,使用机器学习算法,基于目标数据对初始lstm模型训练得到。
98.具体地,通过预先训练的信息推荐模型对所述话题信息与所述个人门户网站中的资源数 据进行分析,得到所述话题信息与各资源数据之间的关联度之前,包括:
99.基于机器学习对样本数据进行学习,并根据机器学习的学习结果实时调整训练中的信息 推荐模型的参数;
100.当检测到训练中的信息推荐模型对应的损失函数收敛时,得到预先训练的信息推荐模型。
101.可以理解的是,个人门户网站的资源数据是指个人门户网站中所展示的各种不同类型的 信息。例如,资源数据可以包括娱乐类信息、综艺类信息、购物类信息、游戏类信息、军事 类信息、体育类信息、汽车类信息、财经类信息、旅游类信息、房产类信息等。
102.可选地,个人门户网站的各资源数据可用卡片形式(版块)展现,一个资源数据对应一 个卡片(版块)。例如,娱乐类信息对应一个卡片,综艺类信息对应一个卡片等。此处仅为 示例性说明,对此不做限定。
103.进一步地,所述通过预先训练的信息推荐模型对所述话题信息与所述个人门户网站中的 资源数据进行分析,得到所述话题信息与各资源数据之间的关联度,包括:
104.通过所述预先训练的信息推荐模型,提取各所述资源数据对应的关键词;
105.对各所述关键字进行向量化处理,得到每个所述资源数据对应的表征向量。
106.在本实施例中,通过预先训练的信息推荐模型对各资源数据依次进行分句处理、分词处 理、预测处理。分句处理是指将资源数据划分为短句,分词处理是指将短句中连续的字序列 划分为多个词序列。示例性地,针对每个资源数据,对该资源数据的每个短句进行分词处理, 得到多个词序列。
107.可选地,也可先对个人门户网站的各资源数据进行预处理,在预处理的结果上进行分句 处理以及分词处理。其中,对资源数据进行预处理的方式与对目标数据进行预处理的方式相 同,此处不再赘述。
108.将多个词序列分别映射到向量空间,即将多个词序列分别转换为向量。示例性地,将每 个词序列输入到预先训练的信息推荐模型中进行处理,得到多个词向量。词向量为对
多个词 序列进行处理后,预测出的词对应的向量。将多个词向量进行组合得到句向量,确定句向量 对应的表征向量。其中,表征向量用于表示该资源数据对应的句子的语意特征。
109.示例性地,话题信息也是以向量的形式表现的,计算话题信息与每个表征向量之间的余 弦相似度,该余弦相似度用于表示话题信息与表征向量之间的关联度。其中,余弦相似度越 大,表示话题信息与表征向量之间的关联度越高;余弦相似度越小,表示话题信息与表征向 量之间的关联度越低。
110.进一步地,所述通过预先训练的信息推荐模型对所述话题信息与所述个人门户网站中的 资源数据进行分析,得到所述话题信息与各资源数据之间的关联度,还包括:
111.计算所述话题信息与各所述表征向量之间的欧式距离;
112.根据所述话题信息与各所述表征向量之间的欧式距离,确定所述话题信息与各所述表征 向量之间的关联度。
113.示例性地,计算话题信息与每个表征向量之间的欧式距离。欧式距离用于表示话题信息 与每个表征向量之间的关联度,欧式距离越大,表示话题信息与表征向量之间的关联度越高; 欧式距离越小,表示话题信息与表征向量之间的关联度越低。
114.推荐模块150,用于根据所述话题信息与各资源数据之间的关联度,确定推荐信息,并 将所述推荐信息推荐给所述用户。
115.在本实施例中,根据该话题信息与每个资源数据之间的关联度,对所有资源数据进行排 序,根据排序结果确定推荐信息,并将该推荐信息推荐给用户。示例性地,按照关联度从高 到低的顺序对所有资源数据进行排序,将排序在前的一个或多个资源数据作为推荐信息,并 将该推荐信息推荐给用户。也可以是,按照关联度从低到高的顺序对所有资源数据进行排序, 将排序在后的一个或多个资源数据作为推荐信息,并将该推荐信息推荐给用户。此处仅为示 例性说明,对此不做限定。
116.可选地,可通过卡片的形式将推荐信息推荐给用户,即待推荐信息,以卡片的形式在个 人门户网站醒目的位置进行显示。例如,将推荐信息,以卡片的形式在个人门户网站当前页 面的中心位置进行显示。此处仅为示例性说明,对此不做限定。
117.此外,本发明还提供一种基于人工智能的信息推荐方法。参照图3所示,为本发明基于 人工智能的信息推荐方法的实施例的方法流程示意图。电子设备1的处理器12执行存储器 11中存储的基于人工智能的信息推荐程序10时,实现基于人工智能的信息推荐方法,包括 步骤s101-s105。
118.步骤s101,当接收到个人门户网站的登录请求时,解析所述登录请求,得到用户的标 识信息。
119.在示例性的实施例中,个人门户网站可以是任意类型的个人门户网站。例如,可以是购 物类的个人门户网站、金融类的个人门户网站、学校的个人门户网站、新闻类的个人门户网 站、旅游类的个人门户网站、娱乐类的个人门户网站、搜索引擎类的个人门户网站、地区性 的个人门户网站等。
120.示例性地,获取个人门户网站上登录的用户的标识信息,该标识信息用于区别不同用户 之间的身份,每个用户的标识信息指代唯一一个用户。
121.例如,标识信息可以是用户身份标识号(identity document,id),每个用户id指代唯 一一个用户,不同的登录用户的用户id也不同,通过获取个人门户网站上登录的用户
的用 户id,便于后续提取该用户id对应的数据,从而实现针对该用户的信息推荐。其中,用户 id可以包括身份证标识号、注册的账号、预先为每个用户设定的唯一编码、手机号等。此 处仅为示例性说明,对此不做限定。
122.示例性地,当检测到用户登录个人门户网站时,获取当前登录的该用户的标识信息。
123.可选地,在一种可能的实现过程中,所述当接收到个人门户网站的登录请求时,解析所 述登录请求,得到用户的标识信息,包括:
124.根据所述标识信息,获取所述标识信息对应的标识属性;
125.根据预设的转换规则对所述标识属性进行转换,得到所述标识属性对应的地址标识码;
126.根据所述地址标识码,确定所述用户的用户来源。
127.本实施例中,获取标识信息对应的标识属性,标识属性用于对用户来源的终端信息进行 标识,用户来源的终端信息包括:pc端网页访问来源、移动端应用程序访问来源、移动端 小程序访问来源。对不同用户来源进行识别,针对不同的用户来源配置的配置信息不同,增 强推荐信息匹配性。
128.步骤s102,根据所述标识信息,在数据库中查找与所述标识信息对应的个人信息及用 户行为数据;
129.在示例性的实施例中,个人信息可包括该用户对应的姓名、年龄、性别、身高、联系方 式、住址、身份证号、学历、工作、该用户在个人门户网站注册的账号信息、爱好等信息。 用户行为数据包括该用户在目标个人门户网站对应的关注信息、输入记录信息、收藏信息、 浏览信息、评论信息、浏览时长、屏蔽记录、搜索记录、分享记录等。
130.在个人门户网站的数据库中,存储有每个用户的标识信息,以及每个标识信息对应的个 人信息和用户行为数据。当获取到用户的标识信息后,基于该用户的标识信息,在数据库中 查找与该标识信息对应的个人信息和用户行为数据。
131.示例性地,用户根据某个个人门户网站的注册流程,填写登录账号(可作为该用户的用 户id)和密码,在个人门户网站进行注册,个人门户网站根据用户填写的登录账号和密码 为该用户生成账号信息。还可提示该用户完善信息,以此收集到该用户的姓名、年龄、性别、 身高、联系方式、住址、爱好等信息。将用户对应的账号信息以及其完善的这些信息归类为 该用户对应的个人信息,将个人信息与该用户的用户id关联,并将关联后的信息存储于个 人门户网站对应的数据库中。
132.当用户登录个人门户网站,并在该个人门户网站中进行关注、收藏、搜索、浏览、屏蔽、 删除、评论等操作时,记录该用户的这些操作行为,以及记录基于这些操作行为所产生的数 据。将该用户的这些操作行为以及基于这些操作行为所产生的数据归类为该用户对应的用户 行为数据,将用户行为数据与该用户的标识信息关联,并将关联后的信息存储于个人门户网 站对应的数据库中。此处仅为示例性说明,对此不做限定。
133.当获取到用户的用户id后,基于该用户的用户id,在数据库中查找与该用户id对应 的个人信息和用户行为数据。
134.上述实施例中,通过获取个人门户网站的用户的用户id,便于后续提取该用户的个人 信息以及用户行为数据,从而有针对性地为该用户推荐准确的信息。
135.可选地,在一种可能的实现过程中,根据标识信息提取用户的初始数据;剔除初始数据 中用户的随机行为数据,得到目标数据,该目标数据为与标识信息对应的个人信息及用户行 为数据。
136.示例性地,初始数据中也包括用户行为数据以及该用户的个人信息。其中,初始数据中 的用户行为数据与个人信息,与上述目标数据中包括的用户行为数据以及个人信息相同。确 定初始数据中的用户行为数据中的随机行为数据,并剔除这些随机行为数据,得到目标数据。
137.随机行为数据是指,在一定条件下,突然出现的行为所产生的数据。例如,用户总是浏览时事新闻信息,突然某次浏览了明星信息,之后也再没有浏览过明星信息,可能是用户手滑不小心浏览到明星信息。由于浏览明星信息产生的数据,就是该用户的随机行为数据。
138.示例性地,可检测一定时间内,用户浏览不同类型信息的次数,若检测到浏览某种信息 的次数小于预设次数,则将浏览该类型信息产生的行为数据标记为随机行为数据。
139.可选地,也可检测一定时间内,用户浏览不同类型信息的时长,若检测到浏览某种信息 的时长小于预设时长,则将浏览该类型信息产生的行为数据标记为随机行为数据。此处仅为 示例性说明,对此不做限定。
140.确定出用户行为数据中所有的随机行为数据,并剔除这些随机行为数据,得到目标数据。
141.上述实施方式中,剔除了用户行为数据中的随机行为数据,避免后续随机行为数据带来 干扰,能够准确查找对应的互联网热点信息,进而便于后续准确地计算话题信息与各资源数 据之间的关联度,从而基于关联度为用户推荐准确的信息。且提取剔除了随机行为数据,减 少了模型的工作量,进而提升了处理速度。
142.步骤s103,根据所述个人信息及所述用户行为数据,查找对应的互联网热点信息,通 过关键词匹配的方式从所述互联网热点信息中抽取出话题信息;
143.可选地,在一种可能的实现过程中,所述根据所述个人信息及所述用户行为数据,查找 对应的互联网热点信息,通过关键词匹配的方式从所述互联网热点信息中抽取出话题信息, 包括:
144.根据网站权重在搜索引擎中获取排名靠前的网络信息,将所述网络信息确定为所述互联 网热点信息;
145.通过预先训练的文章分类模型对所述互联网热点信息进行分类,得到各所述互联网热点 信息所属的热点类别;
146.通过关键词匹配的方式从所述互联网热点信息中抽取出话题信息,并生成所述热点类别 与所述话题信息的对应关系。
147.本实施例通过从互联网热点信息中抽取话题信息,使得推荐信息可以结合互联网热点信 息,同时又与用户个人信息及用户行为数据相关联,做到即结合时事热点咨询,又没有偏离 用户个人偏好和行为习惯,确定出准确的推荐信息并推荐给用户,提升了推荐信息的准确性。
148.步骤s104,通过预先训练的信息推荐模型对所述话题信息与所述个人门户网站中的资 源数据进行分析,得到所述话题信息与各资源数据之间的关联度。
149.在本实施例中,推荐信息的设备中预先训练的信息推荐模型,该预先训练的信息推荐模 型可以是lstm模型,使用机器学习算法,基于目标数据对初始lstm模型训练得到。
150.具体地,通过预先训练的信息推荐模型对所述话题信息与所述个人门户网站中的资源数 据进行分析,得到所述话题信息与各资源数据之间的关联度之前,包括:
151.基于机器学习对样本数据进行学习,并根据机器学习的学习结果实时调整训练中的信息 推荐模型的参数;
152.当检测到训练中的信息推荐模型对应的损失函数收敛时,得到预先训练的信息推荐模型。
153.可以理解的是,个人门户网站的资源数据是指个人门户网站中所展示的各种不同类型的 信息。例如,资源数据可以包括娱乐类信息、综艺类信息、购物类信息、游戏类信息、军事 类信息、体育类信息、汽车类信息、财经类信息、旅游类信息、房产类信息等。
154.可选地,个人门户网站的各资源数据可用卡片形式(版块)展现,一个资源数据对应一 个卡片(版块)。例如,娱乐类信息对应一个卡片,综艺类信息对应一个卡片等。此处仅为 示例性说明,对此不做限定。
155.进一步地,所述通过预先训练的信息推荐模型对所述话题信息与所述个人门户网站中的 资源数据进行分析,得到所述话题信息与各资源数据之间的关联度,包括:
156.通过所述预先训练的信息推荐模型,提取各所述资源数据对应的关键词;
157.对各所述关键字进行向量化处理,得到每个所述资源数据对应的表征向量。
158.在本实施例中,通过预先训练的信息推荐模型对各资源数据依次进行分句处理、分词处 理、预测处理。分句处理是指将资源数据划分为短句,分词处理是指将短句中连续的字序列 划分为多个词序列。示例性地,针对每个资源数据,对该资源数据的每个短句进行分词处理, 得到多个词序列。
159.可选地,也可先对个人门户网站的各资源数据进行预处理,在预处理的结果上进行分句 处理以及分词处理。其中,对资源数据进行预处理的方式与对目标数据进行预处理的方式相 同,此处不再赘述。
160.将多个词序列分别映射到向量空间,即将多个词序列分别转换为向量。示例性地,将每 个词序列输入到预先训练的信息推荐模型中进行处理,得到多个词向量。词向量为对多个词 序列进行处理后,预测出的词对应的向量。将多个词向量进行组合得到句向量,确定句向量 对应的表征向量。其中,表征向量用于表示该资源数据对应的句子的语意特征。
161.示例性地,话题信息也是以向量的形式表现的,计算话题信息与每个表征向量之间的余 弦相似度,该余弦相似度用于表示话题信息与表征向量之间的关联度。其中,余弦相似度越 大,表示话题信息与表征向量之间的关联度越高;余弦相似度越小,表示话题信息与表征向 量之间的关联度越低。
162.进一步地,所述通过预先训练的信息推荐模型对所述话题信息与所述个人门户网站中的 资源数据进行分析,得到所述话题信息与各资源数据之间的关联度,还包括:
163.计算所述话题信息与各所述表征向量之间的欧式距离;
164.根据所述话题信息与各所述表征向量之间的欧式距离,确定所述话题信息与各所述表征 向量之间的关联度。
165.示例性地,计算话题信息与每个表征向量之间的欧式距离。欧式距离用于表示话
题信息 与每个表征向量之间的关联度,欧式距离越大,表示话题信息与表征向量之间的关联度越高; 欧式距离越小,表示话题信息与表征向量之间的关联度越低。
166.步骤s105,根据所述话题信息与各资源数据之间的关联度,确定推荐信息,并将所述 推荐信息推荐给所述用户。
167.在本实施例中,根据该话题信息与每个资源数据之间的关联度,对所有资源数据进行排 序,根据排序结果确定推荐信息,并将该推荐信息推荐给用户。示例性地,按照关联度从高 到低的顺序对所有资源数据进行排序,将排序在前的一个或多个资源数据作为推荐信息,并 将该推荐信息推荐给用户。也可以是,按照关联度从低到高的顺序对所有资源数据进行排序, 将排序在后的一个或多个资源数据作为推荐信息,并将该推荐信息推荐给用户。此处仅为示 例性说明,对此不做限定。
168.可选地,可通过卡片的形式将推荐信息推荐给用户,即待推荐信息,以卡片的形式在个 人门户网站醒目的位置进行显示。例如,将推荐信息,以卡片的形式在个人门户网站当前页 面的中心位置进行显示。此处仅为示例性说明,对此不做限定。
169.在本实施例中,结合个人信息及用户行为数据对互联网热点信息中的话题信息进行抽取, 并结合话题信息通过预先训练的信息推荐模型对话题信息与个人门户网站中的资源数据进 行分析,从而确定推荐信息,使得推荐信息可以结合互联网热点信息,同时又与用户个人信 息及用户行为数据相关联,做到即结合时事热点咨询,又没有偏离用户个人偏好和行为习惯, 确定出准确的推荐信息并推荐给用户,提升了推荐信息的准确性。
170.此外,本发明实施例还提出一种计算机可读存储介质,该计算机可读存储介质可以是硬 盘、多媒体卡、sd卡、闪存卡、smc、只读存储器(rom)、可擦除可编程只读存储器(eprom)、 便携式紧致盘只读存储器(cd-rom)、usb存储器等等中的任意一种或者几种的任意组合。 所述计算机可读存储介质中包括存储数据区和存储程序区,存储数据区存储根据区块链节点 的使用所创建的数据,存储程序区存储有基于人工智能的信息推荐程序10,所述基于人工智 能的信息推荐程序10被处理器执行时,实现上述基于人工智能的信息推荐方法操作。
171.在另一个实施例中,本发明所提供的基于人工智能的信息推荐方法,为进一步保证上述 所有出现的数据的私密和安全性,上述所有数据还可以存储于一区块链的节点中。
172.需要说明的是,本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算 法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是 一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息, 用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台 产品服务层以及应用服务层等。
173.本发明之计算机可读存储介质的具体实施方式与上述基于人工智能的信息推荐方法的 具体实施方式大致相同,在此不再赘述。
174.需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文 中的术语"包括"、"包含"或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系 列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要 素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况 下,由语句"包括一个
……
"限定的要素,并不排除在包括该要素的过程、装置、物
品或者方 法中还存在另外的相同要素。
175.需要说明的是,上述本发明实施例可以基于人工智能技术对相关的数据进行获取和处理。 其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模 拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技 术及应用系统。
176.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数 据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉 技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度 学习等几大方向。
177.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借 助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更 佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部 分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如 rom/ram、磁碟、光盘)中,包括若干指令用于使得一台电子设备(可以是手机,计算机, 电子装置,或者网络设备等)执行本发明各个实施例所述的方法。
178.以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明 书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域, 均同理包括在本发明的专利保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献