一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于NLP的场景特征标注方法与流程

2023-02-04 12:58:01 来源:中国专利 TAG:

技术特征:
1.一种基于nlp的场景特征标注方法,其特征在于:包括以下步骤:s1.采集现场勘察结果信息;s2.建立对场景进行特征标注的场景特征字典;s3.建立可匹配出对应步骤s2中场景特征字典值的标注关键词库;s4.对步骤s1中采集的现场勘察结果信息进行nlp特征分析;s5.进行场景特征标注;s6.对场景特征标注结果进行nlp机器学习,更新步骤s3中的标注关键词库。2.根据权利要求1所述的一种基于nlp的场景特征标注方法,其特征在于:所述步骤s1中的现场勘察结果信息是有关部门对特定场景进行现场勘察后,记录的现场勘察分析意见结果。3.根据权利要求1所述的一种基于nlp的场景特征标注方法,其特征在于:所述步骤s3包括以下步骤:s31.提取关键词;s32.定义分词词性组合表达式;s33.标注对应场景特征:在某一个词性组合表达式组合下,给目标场景标注上对应特征,而这些特征在步骤s2中场景特征字典中定义。4.根据权利要求3所述的一种基于nlp的场景特征标注方法,其特征在于:所述步骤s4中nlp特征分析过程,包括以下步骤:s41.分词处理;s42.词性分析处理;s43.分词和词性组合集合;s44.自动场景特征标注:将步骤s43得到的分词和词性组合集合,与步骤s3标注关键词库中定义的分词词性组合表达式进行匹配,将匹配结果中含有的对应场景特征,标注到目标场景上。5.根据权利要求4所述的一种基于nlp的场景特征标注方法,其特征在于:所述步骤s5为包括步骤s4对目标场景做自动化场景特征标注得到的结果集合以及以人工方式在对目标场景做场景特征标注得到的结果集合的总集合。6.根据权利要求5所述的一种基于nlp的场景特征标注方法,其特征在于:所述步骤s6中nlp机器学习包括以下步骤:s61.反向分词处理:对经过人工场景特征方式标注过的目标场景中的现场勘查结果信息,以及目标场景已标注的场景特征集合进行词语提取得到词语集合;s62.词性分析处理:分析经过人工场景特征方式标注过的目标场景中的现场勘查结果信息提取出的每一个词语在目标句子语境中的词性,以及分析目标场景中的场景特征集合进行词语提取得到每一个词语在目标句子语境中的词性;s63.关键词、词性组合表达式以及对应场景特征结果集:将步骤s62得到的词语以及词性组合的集合,与目标已标注的场景特征进行匹配,匹配结果中含有关键词、词性组合表达式集合。

技术总结
本发明公开了一种基于NLP的场景特征标注方法,包括以下步骤:S1.采集现场勘察结果信息;S2.建立对场景进行特征标注的场景特征字典;S3.建立可匹配出对应步骤S2中场景特征字典值的标注关键词库;S4.对步骤S1中采集的现场勘察结果信息进行NLP特征分析;S5.进行场景特征标注;S6.对场景特征标注结果进行NLP机器学习,更新步骤S3中的标注关键词库。本发明本发明采用基于NLP的场景特征标注方法,对大批量的特定场景先进行人工智能自动化特征标注,在自动化特征标注结果的基础上可进一步可选择性做人工特征标注,进而在人工特征标注结果的基础上进行机器学习,并将学习结果应用到下一次自动化场景特征标注,实现人工智能自动场景特征标注闭环。景特征标注闭环。景特征标注闭环。


技术研发人员:刘怀春 吴海平 龚波 苏学武 水军 李建华 颜颖滨
受保护的技术使用者:珠海市新德汇信息技术有限公司
技术研发日:2022.08.12
技术公布日:2023/2/3
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献