一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

面向基层治理的事件自动分拨方法与流程

2021-10-24 11:41:00 来源:中国专利 TAG:分拨 基层 治理 面向 事件

技术特征:
1.一种面向基层治理的事件自动分拨方法,其特征在于,包括:步骤1、构建地名地址基因库;步骤2、抽取事件地理要素;步骤3、提取事件描述关键词;步骤4、构建历史事件案例库;步骤5、计算事件相似度;步骤6、事件自动分拨。2.根据权利要求1所述的面向基层治理的事件自动分拨方法,其特征在于,在步骤1中,基于统一的标准地址库构建地名地址基因库,使用自定义三元组表示地址基因,并构建树集合以表征地址基因之间的层次关系。3.根据权利要求1所述的面向基层治理的事件自动分拨方法,其特征在于,步骤1包括:步骤1a、利用统计学特征确定标准地址库中地址的落差点,通过递增切分的方法对递增的短语在整个地址库中的数量进行统计;地址元素的使用频次会随地址描述逐渐精确而逐渐降低,当待判断短语后缀超过落差点后,对应的短语在整个地址库中出现的数量将发生明显下降,据此划分出落差点集合m;步骤1b、按照地址构成方式的规则设计决策树,然后根据决策树对每一个落差点m
i
∈m是否构成后缀词或后缀点做出判断,依据判定成功的后缀点进行分词,并对两个后缀点之间的地址要素加以记录;步骤1c、经过分词后,标准化的地址描述所包含的地址要素被划分为专有地址部分与通配地址部分,同时获得一个包含专有地址名词基因的词表wordlist;针对专有地址部分,基于标准地址自身的前后文关系,结合地址信息本身所包含的层次,为提取后的专有地名元素赋予先后序关系标记,构成形式如(id,ele
i
,seqmark
i
)的三元组,其中,id表示对地址元素的唯一标识,ele
i
表示专有地名元素,seqmark
i
是以地址元素所属行政区划层级表示的先后序标记;针对每一条地址,将对应的三元组元素按前后序关系构建成一颗子树tree
i
,将每一棵子树完全相同三元组的节点进行合并,合并后的若干棵树构成的集合treeset构成了一个基本的地名地址基因库addressdb,其中包含以地理要素为基础构建的地名地址基因及其对应的层次关系;步骤1d、利用构建好的地名地址基因库对事件描述全文进行要素抽取,使用获得的词表wordlist与全文进行匹配,提取其中的专有地址基因集d1;针对“号”、“号楼”、“栋”、“幢”等地址通配名进行逆向增字匹配,匹配到通配名后向前判断通配名之前的字符是否为阿拉伯数字、以汉字表达的数字或英文字母,符合的话则将其加入匹配结果并继续判断,直到判断为否为止,构建通配地址基因集d2;对集合d1中的两个相邻元素d1、d2,两个元素在事件描述文本中的对应起始位置loc若满足则判定两元素为相邻,反之判定为不相邻;对相邻的基因元素,利用地名地址基因库中专有地址基因三元组之中包含的先后续标记关系seqmark对相邻元素的完整程度进行判断,若两个相邻元素的标记之间存在缺失值,则证明两个地理元素之间存在要素缺失,根据构建出的地址基因库中的三元组树从上到下
搜索,对不符合条件的相邻地址基因进行补充,组装成新的完整地名地址基因,作为事件中提取得到的地名地址信息。4.根据权利要求1所述的面向基层治理的事件自动分拨方法,其特征在于,在步骤2中,将社基层治理实践中包含的元素划分为时间元素、地理元素、事件元素与其他元素四类,使用地名地址基因对内容中包含的地址信息进行提取,而后对相邻的地理元素进行完整性判断,并将不完整的地址基因扩充为完整基因集,进一步合并后将每一个地址基因扩充成标准化地址,基于该地址匹配结果将该事件拟分拨给对应网格下的社区管理人员处置。5.根据权利要求1所述的面向基层治理的事件自动分拨方法,其特征在于,步骤3包括:步骤3a、对事件描述进行句子分割并使用jieba分词进行分词处理得到documenttokens和sentencetokens,并将分词后的token进行词性标注得到带有词性标签的labeltoken序列;步骤3b、使用np

chunker根据词性标签从labeltoken序列中提取名词token(np),得到的np作为候选关键词;步骤3c、将所有document tokens使用xlnet生成词向量,再使用sif权重将词向量组成word level的文本向量;步骤3d、首先,将所有sentence tokens使用xlnet生成词向量,使用sif权重将词向量组成多个句向量;其次,根据文本的内容层次分布,使用加权平均的方法将多个句向量组合成sentencelevel的文本向量;最后,将wordlevel和sentencelevel的文本向量加权组成documentvector;步骤3e、将每个label token使用xlnet生成wordvector,计算与documentvector之间的距离,将此距离视为候选关键字与文档主题之间的相似度,选择最相似的候选关键词的前n个作为最终关键词。6.根据权利要求1所述的面向基层治理的事件自动分拨方法,其特征在于,在步骤4中,使用步骤3中的技术对文本型的事件描述进行关键词提取,将关键词作为事件案例的标签,并对标签进行编码处理,从而事件案例可以表示成:<标签编码集合,事件描述,事件解决方案描述,效果描述>,实现对事件案例的快速检索。7.根据权利要求5所述的面向基层治理的事件自动分拨方法,其特征在于,步骤5包括:步骤5a、选取原文中与标准摘要计算rouge得分最高的一句话加入候选集合,接着继续从原文中进行选择,保证选出的摘要集合rouge得分增加,直至无法满足该条件;得到的候选摘要集合对应的句子设为1标签,其余为0标签;采用上述数据训练一个二分类模型作为句子重要性判别模型,或者使用强化学习、图神经网络对句子进行打分的方法判别句子重要性;步骤5b、使用上述模型对事件描述文本进行文本分类,或者使用强化学习、图神经网络对句子进行打分,将重要性高的句子作为文本摘要的输入文本,采用预训练语言模型对输入文本进行wordlevel的embedding和sentencelevel的embedding;步骤5c、以有监督的训练方式,使用融合word level和sentence level的多层次embedding数据训练一个融合注意力机制和指针生成网络的seq2seq结构的文本摘要模型,最终利用该模型计算事件描述的文本摘要;步骤5d、对两个事件描述的文本摘要进行相似度计算,采用预训练语言模型提取文本
摘要的词向量,结合sif权重计算文本摘要的句向量;计算两个事件描述文本摘要句向量的距离,将此距离视为两个事件描述的全文相似度。8.根据权利要求7所述的面向基层治理的事件自动分拨方法,其特征在于,步骤6包括:步骤6a、对待处理的新事件经过步骤3对文本型的事件描述进行关键词提取,将关键词作为事件的标签,并对标签进行编码处理,得到待处理事件表示:<标签编码集合,事件描述>;用标签编码集合中的每个标签编码在历史事件案例库中进行查询,查找包含待处理事件标签的所有历史事件案例作为候选集;步骤6b、经过步骤5对候选集中的所有事件描述与待处理的事件描述进行全文的相似度计算,得到根据相似度排序的top n事件案例自动推送给社区管理人员;步骤6c、社区管理人员根据提供的案例处理当前事件,形成当前事件的解决方案,当前的事件可以表示成:<标签编码集合,事件描述,事件解决方案描述>;步骤6d、将当前事件存入基层治理历史事件案例库。

技术总结
本发明公开了一种面向基层治理的事件自动分拨方法,包括:步骤1、构建地名地址基因库;步骤2、抽取事件地理要素;步骤3、提取事件描述关键词;步骤4、构建历史事件案例库;步骤5、计算事件相似度;步骤6、事件自动分拨。该方法提高了事件派发效率,降低了事件派单的错误率,提升了基层对事件的处理质量。提升了基层对事件的处理质量。提升了基层对事件的处理质量。


技术研发人员:陈钢 佘祥荣 丁梦婷
受保护的技术使用者:长三角信息智能创新研究院
技术研发日:2021.07.29
技术公布日:2021/10/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜