一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

商业场所实体链接方法、系统、电子设备及存储介质与流程

2021-10-24 10:19:00 来源:中国专利 TAG:电子设备 实体 场所 特别 链接

技术特征:
1.一种商业场所实体链接方法,其特征在于,所述商业场所实体链接方法包括:获取文本中待链接的商业场所名称和对应于所述商业场所名称的待链接商业场所的地理信息;从所述商业场所名称中解析出核心名,所述核心名为从商业场所名称中去除表征所述商业场所所在地区的前缀名和表征所述商业场所商业属性的后缀名后得到的商业场所的核心名称;根据预先建立的商业场所与核心名的映射关系,确定与所述商业场所名称的核心名相匹配的初始候选商业场所;利用所述地理信息对所述初始候选商业场所进行筛选,以保留所述待链接商业场所所在城市的候选商业场所;根据所述商业场所名称和所述地理信息对所述候选商业场所进行相似度预测,将相似度符合预设要求的候选商业场确定为目标商业场所;将所述目标商业场所在知识库中的实体与所述文本中待链接的商业场所名称所进行链接。2.如权利要求1所述商业场所实体链接方法,其特征在于,还包括:以商业场所的核心名的n

gram序列为检索关键词建立倒排索引;所述倒排索引用于表征所述商业场所与所述核心名的映射关系。3.如权利要求2所述商业场所实体链接方法,其特征在于,所述根据预先建立的商业场所与核心名的映射关系,确定与所述商业场所名称的核心名相匹配的初始候选商业场所的步骤包括:利用所述待链接商业场所核心名的n

gram序列在所述倒排索引进行检索;召回倒排索引中n

gram命中率大于第二阈值的商业场所作为候选商业场所;所述n

gram命中率为所述候选商业场所命中所述待链接商业场所核心名的n

gram序列的次数与所述待链接商业场所核心名的n

gram序列的个数的比值。4.如权利要求1所述商业场所实体链接方法,其特征在于,所述根据所述商业场所名称和所述地理信息对所述候选商业场所进行相似度预测的步骤包括:将所述待链接商业场所的城市编码的编码长度与所述待链接商业场所和所述候选商业场所的编码长度总和的比值作为前缀名相似度;将商业场所名称的后缀名经统计得到的转移概率作为后缀名相似度;将商业场所核心名的字符串编辑距离作为商业场所核心名相似度;根据所述前缀名相似度、所述后缀名相似度和所述商业场所核心名相似度确定所述候选商业场所的相似度。5.如权利要求1所述商业场所实体链接方法,其特征在于,在所述获取文本中待链接的商业场所名称之后,所述商业场所实体链接方法还包括:对所述待链接商业场所名称进行大小写统一;和/或,将所述待链接商业场所名称的方言用语转换为标准用语;和/或,删除所述待链接商业场所名称的特殊字符。6.一种商业场所实体链接系统,其特征在于,所述商业场所实体链接系统包括:文本处理模块,用于获取文本中待链接的商业场所名称和对应于所述商业场所名称的
待链接商业场所的地理信息;核心名解析模块,用于从所述商业场所名称中解析出核心名,所述核心名为从商业场所名称中去除表征所述商业场所所在地区的前缀名和表征所述商业场所商业属性的后缀名后得到的商业场所的核心名称;初始候选确定模块,用于根据预先建立的商业场所与核心名的映射关系,确定与所述商业场所名称的核心名相匹配的初始候选商业场所;初始候选筛选模块,用于利用所述地理信息对所述初始候选商业场所进行筛选,以保留所述待链接商业场所所在城市的候选商业场所;相似度预测模块,用于根据所述商业场所名称和所述地理信息对所述候选商业场所进行相似度预测,将相似度符合预设要求的候选商业场确定为目标商业场所;实体链接模块,用于将所述目标商业场所在知识库中的实体与所述文本中待链接的商业场所名称进行链接。7.如权利要求6所述商业场所实体链接系统,其特征在于,还包括:倒排索引建立模块,用于以商业场所的核心名的n

gram序列为检索关键词建立倒排索引;所述倒排索引用于表征所述商业场所与所述核心名的映射关系。8.如权利要求7所述商业场所实体链接系统,其特征在于,初始候选确定模块还用于利用所述待链接商业场所核心名的n

gram序列在所述倒排索引进行检索;初始候选确定模块还用于召回倒排索引中n

gram命中率大于第二阈值的商业场所作为候选商业场所;所述n

gram命中率为所述候选商业场所命中所述待链接商业场所核心名的n

gram序列的次数与所述待链接商业场所核心名的n

gram序列的个数的比值。9.如权利要求6所述商业场所实体链接系统,其特征在于,所述相似度预测模块还用于将所述待链接商业场所的城市编码的编码长度与所述待链接商业场所和所述候选商业场所的编码长度总和的比值作为前缀名相似度;所述相似度预测模块还用于将商业场所名称的后缀名经统计得到的转移概率作为后缀名相似度;所述相似度预测模块还用于将商业场所核心名的字符串编辑距离作为商业场所核心名相似度;所述相似度预测模块还用于根据所述前缀名相似度、所述后缀名相似度和所述商业场所核心名相似度确定所述候选商业场所的相似度。10.如权利要求6所述商业场所实体链接系统,其特征在于,所述商业场所实体链接系统还包括规范处理模块;所述规范处理模块用于对所述待链接商业场所名称进行大小写统一;和/或,所述规范处理模块还用于将所述待链接商业场所名称的方言用语转换为标准用语;和/或,所述规范处理模块还用于删除所述待链接商业场所名称的特殊字符。11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述
的商业场所实体链接方法。12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的商业场所实体链接方法。

技术总结
本发明公开了一种商业场所实体链接方法、系统、电子设备及存储介质。所述商业场所实体链接方法包括:获取文本中待链接的商业场所名称和对应的地理信息;从所述商业场所名称中解析出核心名;根据预先建立的商业场所与核心名的映射关系,确定与所述商业场所名称的核心名相匹配的初始候选商业场所;利用所述地理信息对所述初始候选商业场所进行筛选,以保留所述待链接商业场所所在城市的候选商业场所;根据所述商业场所名称和所述地理信息对所述候选商业场所进行相似度预测,将相似度符合预设要求的候选商业场确定为目标商业场所;将所述目标商业场与所述文本中待链接的商业场所名称进行链接。该方法实现了对文本中商业场所名称的实体链接的自动化。的实体链接的自动化。的实体链接的自动化。


技术研发人员:刘茜 孙玉霞 余迁 孙知非 何蜀波 邹宇
受保护的技术使用者:携程旅游信息技术(上海)有限公司
技术研发日:2021.07.16
技术公布日:2021/10/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜