一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于索引的可扩展交易对手识别方法、系统及介质与流程

2022-04-27 12:00:31 来源:中国专利 TAG:

技术特征:
1.一种基于索引的可扩展交易对手识别方法,其特征在于,包括:获取待识别文本,对所述待识别文本进行特征提取,得到所述待识别文本中的实体要素;基于预设的结构化规则索引,根据所述实体要素对所述待识别文本进行结构化处理,得到结构化订单信息;根据预先构建并训练完成的第一决策树模型和逻辑索引,对所述结构化订单信息中的交易机构进行对手识别,确认所述待识别文本中的交易对手。2.根据权利要求1所述的基于索引的可扩展交易对手识别方法,其特征在于,所述获取待识别文本,对所述待识别文本进行特征提取,得到所述待识别文本中的实体要素,包括:通过预训练模型对所述待识别文本进行逐个字符切分,得到相应的字符向量编码;对所述字符向量编码进行特征提取后输出每个字符的语义特征向量;对所述语义特征向量中的实体要素进行标签预测,标注得到所述待识别文本中的实体要素。3.根据权利要求1所述的基于索引的可扩展交易对手识别方法,其特征在于,所述基于预设的结构化规则索引,根据所述实体要素对所述待识别文本进行结构化处理,得到结构化订单信息,包括:对所述待识别文本进行换行分割,得到若干行子文本以及每行子文本包括的实体要素;根据各行子文本中的实体要素对每行子文本进行类别判断,得到每行子文本的信息类别;根据预设的结构化规则索引以及每行子文本的信息类别,对各行子文本进行要素聚合补齐,得到至少一个结构化订单信息。4.根据权利要求3所述的基于索引的可扩展交易对手识别方法,其特征在于,所述根据各行子文本中的实体要素对每行子文本进行类别判断,得到每行子文本的信息类别,包括:预先构建第二决策树模型以及用于训练所述第二决策树模型的实体特征训练样本;采用基尼指数最小作为特征选择准则,通过所述实体特征训练样本对所述第二决策树模型进行学习训练;根据各行子文本中的实体要素,通过训练完成的所述第二决策树模型对每行子文本进行类别判断,得到每行子文本的信息类别。5.根据权利要求3或4所述的基于索引的可扩展交易对手识别方法,其特征在于,所述信息类别包括订单信息、共享信息、补充信息和其他信息。6.根据权利要求1所述的基于索引的可扩展交易对手识别方法,其特征在于,所述根据预先构建并训练完成的第一决策树模型和逻辑索引,对所述结构化订单信息中的交易机构进行对手识别,确认所述待识别文本中的交易对手之前,所述方法还包括:预先构建第一决策树模型以及用于训练所述第一决策树模型的机构特征训练样本,所述机构特征训练样本包括交易机构的位置与方向;采用id3算法的信息增益策略,通过所述机构特征训练样本对所述第一决策树模型进行训练,直到所述第一决策树模型的信息增益达到最大时完成训练。7.根据权利要求6所述的基于索引的可扩展交易对手识别方法,其特征在于,所述根据
预先构建并训练完成的第一决策树模型和逻辑索引,对所述结构化订单信息中的交易机构进行对手识别,确认所述待识别文本中的交易对手,包括:获取所述结构化订单信息中各个交易机构的位置与交易方向;根据各个交易机构的位置与交易方向,通过训练完成的所述第一决策树模型对每个交易机构的机构类别进行判断,所述机构类别包括买方机构、卖方机构和过桥机构;基于当前的视觉机构,根据所述逻辑索引和每个交易机构的机构类别确认所述待识别文本中相对于所述视觉机构的交易对手。8.根据权利要求7所述的基于索引的可扩展交易对手识别方法,其特征在于,所述基于当前的视觉机构,根据所述逻辑索引和每个交易机构的机构类别确认所述待识别文本中相对于所述视觉机构的交易对手,具体包括:若当前的视觉机构为买方机构,则所述交易对手为所述待识别文本中的卖方机构;若当前的视觉机构为卖方机构,则所述交易对手为所述待识别文本中的买方机构;若当前的视觉机构为过桥机构,则所述交易对手为所述待识别文本中的买方机构和卖方机构。9.一种基于索引的可扩展交易对手识别系统,其特征在于,所述系统包括至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8任一项所述的基于索引的可扩展交易对手识别方法。10.一种非易失性计算机可读存储介质,其特征在于,所述非易失性计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行时,可使得所述一个或多个处理器执行权利要求1-8任一项所述的基于索引的可扩展交易对手识别方法。

技术总结
本发明公开了基于索引的可扩展交易对手识别方法、系统及介质,通过获取待识别文本,对所述待识别文本进行特征提取,得到所述待识别文本中的实体要素;基于预设的结构化规则索引,根据所述实体要素对所述待识别文本进行结构化处理,得到结构化订单信息;根据预先构建并训练完成的第一决策树模型和逻辑索引,对所述结构化订单信息中的交易机构进行对手识别,确认所述待识别文本中的交易对手。通过准确提取待识别文本中的实体要素特征,并基于结构化规则索引进行订单切割实现高效的订单文本结构化处理,进一步采用软编码形式的决策树模型来实现泛化能力强的交易对手识别,有效提高交易对手识别的可扩展性且降低了训练维护成本。易对手识别的可扩展性且降低了训练维护成本。易对手识别的可扩展性且降低了训练维护成本。


技术研发人员:林远平 甘伟超 喻广博 邹鸿岳 周靖宇
受保护的技术使用者:北京快确信息科技有限公司
技术研发日:2022.01.13
技术公布日:2022/4/26
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献