一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于项目计划内容和用户行为的知识推荐方法与流程

2021-10-29 23:20:00 来源:中国专利 TAG:推荐 智能 计划 方法 项目


1.本发明涉及一种基于项目计划内容和用户行为的知识推荐方法,属于智能推荐技术领域。


背景技术:

2.当今时代信息数据爆炸,用户面临大量信息,工程项目计划数据庞杂,难以快速又准确地找到需要的信息,而搜索结果中常常包含大量的与目标信息相似的信息,无法进行有效排序,影响了用户看到信息的先后顺序和质量,为了使用户搜索过程中快速且准确地搜索到目标信息和目标项目计划对应的知识,需要一种能够根据目标项目计划内容和用户行为综合排序的知识推荐方法。


技术实现要素:

3.为了解决上述技术问题,本发明提供一种基于项目计划内容和用户行为的知识推荐方法,其具体技术方案如下:包括以下步骤:步骤1:抽取项目计划内容中的项目名称和计划名称,分别计算项目名称和计划名称与知识库中的知识名称的匹配度;步骤2:对项目名称和计划名称进行赋权,得到项目名称和计划名称与知识名称的匹配度的比重值;步骤3:抽取项目计划内容中的项目分类和计划类型形成项目分类标签和计划类型标签,并记录知识库中的各条知识标签,分别计算项目分类标签和计划类型标签与知识标签的匹配度;步骤4:对项目分类标签和计划类型标签进行赋权,得到项目分类标签和计划类型标签与知识标签的匹配度的比重值;步骤5:计算项目计划内容中的项目名称、计划名称、项目分类标签、计划类型标签与知识的名称和标签的加权平均匹配度,并根据加权平均匹配度对项目和计划对应的知识进行排序;步骤6:当项目计划内容中的项目名称、计划名称、项目分类标签、计划类型标签与多个知识的名称和标签的加权平均匹配度相等时,获取针对知识的用户行为并分配权重,计算知识热度,并根据知识热度进行二次排序;步骤7:根据得到的加权平均匹配度及知识热度,综合得出基于项目计划内容和用户行为的知识推荐。
4.进一步的,所述步骤1中项目名称、计划名称和知识名称视为字符串,则匹配度定义为两个字符串的最长公共子序列,所述最长公共子序列是指由原字符串在不改变相对顺序的情况下删除某些字符,或不删除任何字符后组成的新字符串,计算匹配度的具体步骤为:步骤1.1:比较字符串a和字符串b的字符串长度,当a<b时,创建一个空数组a、匹配
成功字符数记为f,将字符串a中的第一个字符放入数组a,遍历字符串b中的每一个字符,当数组a与字符串b中的第m个字符匹配成功后,f记为1;步骤1.2:数组a中存入的字符改为字符串a中的第二个字符,从字符串b中的第m 1个字符开始遍历,若数组a与字符串b中的第h(h>m)个字符匹配成功,f记为2,若匹配不成功,则f仍为1;步骤1.3:数组a中存入的字符改为字符串a中的第三个字符,从字符串b中的第h 1个字符开始遍历,以此类推,直至数组a中的字符串a中的第t个字符遍历至字符串b的最后一个字符,第一次遍历匹配数记为f1;步骤1.4:当字符串b遍历完成后,字符串a仍未完成匹配,则开始第二次遍历,将字符串a中的第t 1个字符放入数组a,遍历字符串b中的每一个字符,当数组a与字符串b中的第m个字符匹配成功后,f记为1;步骤1.5:数组a中存入的字符改为字符串a中的第t 2个字符,从字符串b中的第m 1个字符开始遍历,若数组a与字符串b中的第h(h>m)个字符匹配成功,f记为2,若匹配不成功,则f仍为1;步骤1.6:数组a中存入的字符改为字符串a中的第t 3个字符,以此类推,直至遍历至字符串b的最后一个字符,第二次遍历匹配数记为f2;步骤1.7:当字符串b遍历j次后,字符串a完成匹配,则字符串a和字符串b的匹配数f的计算公式为:f=max(f1,f2,

,f
j
),匹配度f的计算公式为:f=(f/a f/b)/2;进一步的,所述步骤3中分别计算项目分类标签和计划类型标签与知识标签的匹配度,匹配度计算按照步骤1中的方法进行;各知识的标签数量为i,知识的每个标签与项目分类、计划类型计算出的标签匹配度为(f/a f/b)/2,则目标项目分类、计划类型与知识库中每条知识的标签匹配度为:f=max[(f
k
/a
k
f
k
/b
k
)/2] (1≤k≤i)。
[0005]
进一步的,所述步骤2和步骤4中进行赋权,设定项目名称、计划名称、项目分类标签和计划类型标签的权重分别为λ1、λ2、λ3和λ4,对知识库中的n条知识的知识名称按照ascii码进行排序,则项目名称与知识库中的各知识的匹配度分别为,计划名称与知识库中的各知识的匹配度分别为,项目分类标签与知识库中的各知识标签的匹配度分别为,计划类型标签与知识库中的各知识标签的匹配度分别为,则加权平均匹配度。
[0006]
进一步的,所述步骤5中选取的用户行为包括:下载、提问、收藏、分享和评论,将知识的下载、提问、收藏、分享和评论次数分别记为w1、w2、w3、w4和w5,给标准行为分配权重,并分别记为μ1、μ2、μ3、μ4和μ5,则与目标计划加权平均匹配度相等的知识的知识热度为。
[0007]
本发明的有益效果是:本发明基于项目计划内容和用户行为的权重计算计划与知
识的匹配度,通过各项匹配度与权重计算加权平均值,根据加权平均匹配度进行知识排序,并相应地返回适配的知识,该方法的知识推荐准确度高,各权重可以根据实际情况进行动态调整,实用便捷。
附图说明
[0008]
图1是本发明的流程图,图2是本发明的匹配度计算流程图,图3项目信息页面,图4项目计划名称页面,图5 为推荐结果页面。
具体实施方式
[0009]
现在结合附图对本发明作进一步详细的说明。
[0010]
如图1所示,本发明的基于项目计划内容和用户行为的知识推荐方法,包括以下步骤:步骤1:抽取项目计划内容中的项目名称和计划名称,分别计算项目名称和计划名称与知识库中的知识名称的匹配度;将项目名称、计划名称和知识名称视为字符串,则匹配度定义为两个字符串的最长公共子序列,所述最长公共子序列是指由原字符串在不改变相对顺序的情况下删除某些字符,或不删除任何字符后组成的新字符串,如图2所示,计算匹配度的具体步骤为:步骤1.1:比较a和b的字符串长度,当a<b时,创建一个空数组a,匹配成功字符数记为f,将字符串a中的第一个字符放入数组a,遍历字符串b中的每一个字符,当数组a与字符串b中的第m个字符匹配成功后,f记为1;步骤1.2:数组a中存入的字符改为字符串a中的第二个字符,从字符串b中的第m 1个字符开始遍历,若数组a与字符串b中的第h(h>m)个字符匹配成功,f记为2,若匹配不成功,则f仍为1;步骤1.3:数组a中存入的字符改为字符串a中的第三个字符,从字符串b中的第h 1个字符开始遍历,以此类推,直至数组a中的字符串a中的第t个字符遍历至字符串b的最后一个字符,第一次遍历匹配数记为f1;步骤1.4:当字符串b遍历完成后,字符串a仍未完成匹配,则开始第二次遍历,将字符串a中的第t 1个字符放入数组a,遍历字符串b中的每一个字符,当数组a与字符串b中的第m个字符匹配成功后,f记为1;步骤1.5:数组a中存入的字符改为字符串a中的第t 2个字符,从字符串b中的第m 1个字符开始遍历,若数组a与字符串b中的第h(h>m)个字符匹配成功,f记为2,若匹配不成功,则f仍为1;步骤1.6:数组a中存入的字符改为字符串a中的第t 3个字符,以此类推,直至遍历至字符串b的最后一个字符,第二次遍历匹配数记为f2;步骤1.7:当字符串b遍历j次后,字符串a完成匹配,则字符串a和字符串b的匹配数f的计算公式为:f=max(f1,f2,

,f
j
),匹配度f的计算公式为:f=(f/a f/b)/2;
匹配度计算实施例:字符串a为cqigjegns共8个字符,字符串b1为escikgaingeskewj共16个字符,其中字符串a代表项目计划内容,字符串b1和字符串b2均代表知识库中的知识,创建空数组a,匹配成功字符数记为f,将字符串a中的第一个字符c放入数组a中,对字符串b1进行第一次遍历,匹配成功字符数记为f1,在第三个字符处匹配成功,f1=1;将字符串a中的第二个字符q放入数组a中,从字符串b1的第四个字符i开始进行遍历,遍历完成,字符q匹配失败,f1=1;将字符串a中的第三个字符i放入数组a中,从字符串b1的第四个字符i开始进行遍历,在第四个字符处匹配成功,f1=2;将字符串a中的第四个字符g放入数组a中,从字符串b1的第五个字符k开始进行遍历,在第六个字符处匹配成功,f1=3;将字符串a中的第五个字符j放入数组a中,从字符串b1的第七个字符a开始进行遍历,在最后一个字符处匹配成功,f1=4;此时,字符串a仍未完成匹配,开始第二次遍历:将字符串a中的第六个字符e放入数组a中,从字符串b1的第一个字符e开始进行遍历,在第一个字符处匹配成功,f2=1;将字符串a中的第七个字符g放入数组a中,从字符串b1的第二个字符s开始进行遍历,在第六个字符处匹配成功,f2=2;将字符串a中的第八个字符n放入数组a中,从字符串b1的第七个字符a开始进行遍历,在第十个字符处匹配成功,f2=3;将字符串a中的第九个字符s放入数组a中,从字符串b1的第十一个字符e开始进行遍历,在第十二个字符处匹配成功,f2=4;此时字符串a完成匹配,匹配数f的计算公式为:f=max(f1,f2)=4,匹配度f=(f/a f/b)/2=0.375;步骤2:对项目名称和计划名称进行赋权,确定项目名称和计划名称在与知识名称匹配度计算中的比重值,设定项目名称、计划名称的权重分别为λ1和λ2;步骤3:抽取项目计划内容中的项目分类和计划类型形成项目分类标签和计划类型标签,并记录知识库中的各条知识标签,分别计算项目分类标签和计划类型标签与知识标签的匹配度,匹配度计算按照步骤1中的方法进行;各知识的标签数量为i,知识的每个标签与项目分类、计划类型计算出的标签匹配度为(f/a f/b)/2,则目标项目分类、计划类型与知识库中每条知识的标签匹配度为:f=max[(f
k
/a
k
f
k
/b
k
)/2] (1≤k≤i);步骤4:对项目分类标签和计划类型标签进行赋权,确定项目分类标签和计划类型标签在与知识标签匹配度计算中的比重值,设定项目分类标签和计划类型标签的权重分别为λ3和λ4,对知识库中的n条知识的知识名称按照ascii码进行排序,则项目名称与知识库中的各知识的匹配度分别为,计划名称与知识库中的各知识的匹配度
分别为,项目分类标签与知识库中的各知识标签的匹配度分别为,计划类型标签与知识库中的各知识标签的匹配度分别为;步骤5:计算项目计划内容的名称和标签与知识的名称和标签的加权平均匹配度,加权平均匹配度,并根据结果对其对应的知识进行排序;步骤6:当项目计划内容与多个知识的加权平均匹配度相等时,获取针对知识的用户行为并分配权重,选取的用户行为包括:下载、提问、收藏、分享和评论,将知识的下载、提问、收藏、分享和评论次数分别记为w1、w2、w3、w4和w5,给标准行为分配权重,并分别记为μ1、μ2、μ3、μ4和μ5,则与目标计划加权平均匹配度相等的知识的知识热度为,计算知识热度,并进行二次排序;步骤7:根据得到的加权平均匹配度及知识热度,得出基于项目计划内容和用户行为的知识推荐。
[0011]
实施例:项目名称为“基于知识工程的船体涂层研发管理”,该项目分类为“船舶类”,项目中包含计划名称“钢制高速船船底防锈涂层工艺研发”,计划类型属于“研发类”,项目信息和计划名称如图3和图4,在项目计划属性中,项目分类的权重为 10%,计划类型的权重为10%,项目名称的权重为30%,计划名称的权重为50%;用户行为中,下载的权重为20%,提问的权重为20%,收藏的权重为25%,分享的权重为30%,评论的权重为5%;在知识库中有以下几条数据:序号为1的知识与项目名称的匹配数f=1,匹配度为;与计划名称的匹配数f=3,匹配度为;各知识标签与项目分类的匹配数f=1和0,匹配度,,因为,所以;各知识标签与计划类型的匹配数f=0和1, 匹配度,,因为,所以,
计算出序号为1的知识标题与标签的加权平均匹配度;序号为2的知识与项目名称的匹配数f=4,匹配度为;与计划名称的匹配数f=4,匹配度为;各知识标签与项目分类的匹配数f=0和1,匹配度为,,因为,所以;各知识标签与计划类型的匹配数f=0和3,匹配度为,, 因为,所以,计算出序号为2的知识标题与标签的加权平均匹配度;序号为3的知识与项目名称的匹配数f=1,匹配度为;与计划名称的匹配数f=3,匹配度为;各知识标签与项目分类的匹配数f=1和0,匹配度,,因为,所以;各知识标签与计划类型的匹配数f=0和1, 匹配度,,因为,所以。
[0012]
计算出序号为3的知识标题与标签的加权平均匹配度;序号1与序号3的加权平均匹配度相等,继续计算这两个知识的热度;序号1的知识热度为w=1
×
20% 2
×
25%=0.75;序号3的知识热度为w=3
×
25% 4
×
30%=1.95;根据知识关联性及知识热度,知识推荐顺序依次为《船体外板单道涂层体系施工应用及推广》、《钢制双体客船的强度直接计算分析》和《铝合金高速船焊接及止火特点分析》,推荐结果如图5所示。
[0013]
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜