一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于知识图谱和主成分分析的群租房多维识别方法与流程

2022-02-20 05:38:23 来源:中国专利 TAG:

技术特征:
1.一种基于知识图谱和主成分分析的群租房多维识别方法,其特征在于,包括以下步骤:步骤一:构建人房知识图谱;步骤二:基于主成分分析计算各判定指标的权重;步骤三:计算群租房判定阈值;步骤四:识别群租房。2.根据权利要求1所述的一种基于知识图谱和主成分分析的群租房多维识别方法,其特征在于,所述步骤一中,构建人房知识图谱包括:获取房屋和人物的多源异构数据,作为构建人房知识图谱的基础数据,包括房屋基本信息、房屋的用水数据、房屋的用电数据、房屋的用气数据、快递数据、人物基本信息、人物关系数据、人房关系数据等;设计人房知识图谱的本体,基于本体定义从基础数据抽取实体和关系,特别地,需要对房屋实体设置一个类别标签,用以区分已经被确认是群租房的房屋和未被确认的房屋,可用于判定阈值的计算,已被确认的房屋数据标签值可设为“群租房”;将实体和关系数据导入图数据库,构建人房知识图谱。3.根据权利要求1所述的一种基于知识图谱和主成分分析的群租房多维识别方法,其特征在于,所述基于主成分分析计算各判定指标的权重包括:设计判定指标:由于群租房与非群租房在很多特征上的数值表现是有显著差异的,所以可以基于业务专家的经验将这些特征提炼出来作为识别群租房的判定指标(f
i
,i=1,2,

n),例如房屋水电比(群租房的用水与用电量的比值一般会高于非群租房)、快递数量(群租房的快递数量一般会高于非群租房屋)、人员关系亲疏度(群租房的租客一般与房主的关系较为疏远或没有关系,而非群租房的住客与房主的关系较为丰富且紧密)等;数据提取与归一化:按照设定好的判定指标,从人房知识图谱中提取所有房屋实体的相关数据,提取的数据格式为:{"id":"房屋实体主键","f1":"房屋对应指标f1的值",

,"f
n
":"房屋对应指标f
n
的值"},每一个房屋实体对应一条上述格式的数据,之后,将所有房屋实体数据汇总,然后基于每个指标列数据的实际特征情况和业务需求,设计或选择合适的归一化函数对f
i
列数据进行归一化处理,最终输出结果,每个指标列只使用一个归一化函数处理,不同指标列数据可以使用不同的归一化函数;采用主成分分析计算指标的权重:主成分分析(pca,principalcomponentanalysis)是一种统计方法,它通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分,将上面归一化后的房屋数据作为输入,使用pca计算各个主成分(即各指标)的方差贡献率作为指标的权重值,方差贡献率越大则该主成分的重要性越强;生成判定函数:y=v1f1(x) v2f2(x)

v
n
f
n
(x),其中,x为从知识图谱中提取的某个房屋数据,v
i
(=1,2

,n)是指标的权重值,f
i
(x)表示房屋x的指标f
i
归一化后的数值。4.根据权利要求1所述的一种基于知识图谱和主成分分析的群租房多维识别方法,其特征在于,所述计算群租房判定阈值包括:从归一化处理中提取已知群租房的各指标维度的数据;将上一步骤中提取的已知群租房数据代入群租房判定函数,计算每个历史群租房的判
定得分,取所有历史群租房的判定得分的平均数作为判断待识别房屋是否是群租房的判定阈值;为了保证判定结果的时效性以适应实时多变的数据情况,结合实际数据增量更新的频率,灵活地将计算判定阈值的操作设置为周期性的,选择日更或周更。5.根据权利要求1所述的一种基于知识图谱和主成分分析的群租房多维识别方法,其特征在于,所述识别群租房包括:从人房知识图谱中提取待识别房屋在各指标维度上的数据;将待识别房屋的各指标维度的数据代入群租房判定函数,输出待识别房屋的判定得分;将待识别房屋的判定得分与群租房判定阈值比较,如果大于等于判定阈值则认为待识别房屋是疑似群租房,并从人房知识图谱中捞取待识别房屋实体的关联数据,可限定遍历层数,由业务决定,作为判定结果的可解释性说明,一般以关系图的形式可视化展示。

技术总结
本发明公开了一种基于知识图谱和主成分分析的群租房多维识别方法,包括以下步骤:步骤一:构建人房知识图谱;步骤二:基于主成分分析计算各判定指标的权重;步骤三:计算群租房判定阈值;步骤四:识别群租房。基于判定公式和判定阈值对待查房屋进行判定,若判定为群租房,则查询人房知识图谱挖掘出待查房屋的多维数据,作为判定的依据,保证了判定结果的可解释性。释性。释性。


技术研发人员:王峥 朱丹 梁春 陶辉 阮祥超
受保护的技术使用者:南京烽火天地通信科技有限公司
技术研发日:2021.09.08
技术公布日:2022/1/10
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献