一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于深度学习的智能物流地址实体识别系统的制作方法

2022-04-13 19:59:41 来源:中国专利 TAG:

技术特征:
1.一种基于深度学习的智能物流地址实体识别系统,其特征在于,该系统组成包括有地址实体数据标注模块、bert编码器模块和结果解析模块,其中,所述地址实体数据标注模块接收地址结构化数据,并对接收的地址结构化数据进行数据清洗,获得高质量的已标注地址实体数据;所述的bert编码器模块基于已标注地址实体数据,进行深度学习算法学习物流业务实际应用场景的特定句子的编码表示,训练完成获得地址实体识别模型;所述的结构解析模块基于训练完成的地址实体识别模块,在输入物流地址时,对输入地址信息数据进行解析,解析完成后输出由所输入地址提取的实体内容。2.根据权利要求1所述的一种基于深度学习的智能物流实体识别系统,其特征在于,在所述的bert编码器模块中设有bert编码器、全连接层、softmax分类器和分类优化器,所述bert编码器处理输入的地址实体数据得到数据的向量表示,全连接层对数据向量表示增加权重,softmax分类器得到预测结果,分类优化器逐层调整模型权重实现模型迭代优化。3.一种基于深度学习的智能物流地址实体的识别提取方法,其特征在于,该识别提取方法包括如下步骤:第一步,数据预处理,将历史运单数据筛选,删除重复数据,获得干净的地址实体集;第二步,地址实体集清洗,并对清洗后数据进行标注提取,经筛选过滤后提取有意义的实体数据,获得模型训练所用的数据;第三步,bert编码及模型训练,由bert编码得到地址数据的向量表示,经模型训练和优化得到物流地址实体识别模型;第四步,输入地址及结果解析,将物流地址输入至训练得到的物流地址实体识别模型,经过解析输出获得物流地址中的实体内容。4.根据权利要求3所述的一种基于深度学习的智能物流地址实体的识别提取方法,其特征在于,在所述第一步中,将历史运单数据进行筛选过滤,对省市区 详细地址拼接的数据进行省市区递归删除,删除省市区部分重复的数据,对进行了递归删除的地址进行md5值计算,删除md5值一致的数据,该md5值一致表示为全部重复的数据。5.根据权利要求3所述的一种基于深度学习的智能物流地址实体的识别提取方法,其特征在于,在所述的第二步中,使用词频/逆文本频率策略对地址提取出的实体进行筛选过滤,只提取具有具体意义的主要实体的数据,得到模型训练所用的标注地址数据。6.根据权利要求3所述的一种基于深度学习的智能物流地址实体的识别提取方法,其特征在于,在所述第三步中,使用bert模型对处理好的地址进行命名实体识别任务,得到地址数据的向量表示,在命名实体识别任务中,对训练结果迭代优化,数据表示向量分别经过全连接层和softmax分类层输出预测结果;预测结果与数据标签计算分类损失;模型优化器通过将损失逐层回传并通过优化算法来迭代优化bert模型的权重。7.根据权利要求6所述的一种基于深度学习的智能物流地址实体的识别提取方法,其特征在于,bert编码和分类优化器的实现过程为:s1.输入地址实体数据通过bert编码器得到数据的向量表示c:c=encodertransformer(x1,x2,x3,...,x
m
)
ꢀꢀꢀꢀꢀꢀ
(1)s2.c经过全连接层加一层权重后,进到softmax分类器得到预测结果:pred=soft max(cw
t
)
ꢀꢀꢀꢀꢀꢀꢀ
(2)
s3.根据预测值pred和真实标签label计算分类损失:s4.通过优化器来逐层调整模型权重实现模型迭代优化,最终得到收敛的地址实体识别模型。8.根据权利要求3所述的一种基于深度学习的智能物流地址实体的识别提取方法,其特征在于,还包括有第五步,将训练完成的实体识别模型部署为triton inference服务,进行物流地址实体识别模型计算解析加速,承担大批量地址实体数据处理。

技术总结
本发明公开一种基于深度学习的智能物流地址实体识别系统,其特征在于,该系统组成包括有地址实体数据标注模块、BERT编码器模块和结果解析模块,地址实体数据标注模块接收地址结构化数据,获得高质量的已标注地址实体数据;BERT编码器模块进行深度学习算法学习物流业务实际应用场景的特定句子的编码表示,训练完成获得地址实体识别模型;结构解析模块基于训练完成的地址实体识别模块,在输入物流地址后输出由所输入地址提取的实体内容;还涉及到地址实体的识别提取方法。本发明解决了人工标注数据缓慢的问题,可以准确识别出的实体为一个网点下的主要实体,从而保证地址实体提取的准确性。准确性。准确性。


技术研发人员:林嘉华 倪嘉辉 姜东晓
受保护的技术使用者:上海捷晓信息技术有限公司
技术研发日:2021.12.14
技术公布日:2022/4/12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献