一种警方报案信息分析方法及系统与流程

2023-01-14 13:47:37 来源：中国专利 TAG：

1.本发明涉及一种警方报案信息分析方法及系统，属于数据情报分析技术领域。

背景技术：

2.在警方接警时，对报案人员所提供报案信息进行快速的分析审核后形成立案决议，是案件顺利启动的前提，相应地，提升警方数据情报分析能力和立案效率，是合理配置警方资源的重要措施。但目前在警方情报分析领域对于报案信息以及相关证据的处理与判断主要依据人工处理，尚无一种能够实现针对报案信息进行有效分析，并完成案件分流和立案的相关方法及系统。

技术实现要素：

3.发明要解决的技术问题
4.本发明针对警方缺乏有效的报案信息分析方法，立案效率不高的问题，提出一种警方报案信息分析方法及系统。
5.技术方案
6.为达到上述目的，本发明提供的技术方案为：
7.一种警方报案信息分析方法，包括以下步骤：
8.步骤1，获取报案信息，包括案件描述与辅助证据；
9.步骤2，将案件描述语句进行分割，使用nlp技术对分割后的语句成分使用主语、谓语、宾语、定语、状语、补语进行标注并保存为六元组，将宾语使用nlp技术进行标签学习后将宾语转换为标签；
10.步骤3，将法律条款按照步骤2步骤进行处理生成六元组，将案件描述语句六元组中宾语标签信息与法律条款六元组中宾语标签信息进行比对，若两者交集为空则报案信息主体不复合受理条件，将结果输出，若两者交集非空则报案信息主体复合受理条件进行下一步骤；
11.步骤4，计算案件描述信息与步骤3中所得复合受理条件的法律条款的匹配度，匹配度为案件描述信息六元组与法律条款六元组各个成分词向量相似度的加权和，某个成分的相似度为两者所含词项向量的最大相似度，将案件描述信息与法律条款罪名的匹配度计算结果从大到小排序，排名第一且匹配度＞0的法律条款罪名为最有可能的罪名；
12.步骤5，对步骤1所获取辅助证据依据其上传通道进行分类，定义立案充足度为各类证据满足度的加权和，当立案充足度大于等于某一阈值认为证据充足予以立案，小于该阈值则表示证据不足不予立案。
13.步骤6，将步骤2所得案件描述六元组，步骤4所得罪名分析结果，步骤5证据判断结果按照模板生成案件分析报告。
14.进一步地，步骤4中案件描述信息六元组与法律条款六元组的相似度计算方法为：计算案件描述信息六元组与法律条款六元组谓语、状语、补语词向量相似度的加权和。
15.一种实现上述警方报案信息分析方法的警方报案信息分析系统，系统由数据导入模块、系统管理模块、案件信息分析模块、罪名分析匹配模块、证据分析模块、报告生成模块组成，其中数据导入模块主要实现报案信息的导入；系统管理模块实现语料库、罪名模型的管理以及nlp标签的学习；案件信息分析模块对报案信息文本进行预处理以及语句结构分析等，判断案件是否满足立案条件；罪名分析匹配模块计算案件描述信息语义结构与法律条款语义结构的相似度，并输出案件可能的匹配罪名；证据分析模块对报案证据进行识别并计算证据满足度；报告生成模块实现案件分析信息的汇总及报告生成。
16.有益效果
17.本发明实现了警方报案信息解析与海量罪名匹配，降低了接处警的专业技能要求，解决了前期接处警人员缺乏警情处置工作技能的困境，提升了相关领域警情处置能力；
18.本发明方法实现了立案阶段证据的及时收集和固化，提升了侦查取证的质量，保障了后续的侦查取证和刑事诉讼的顺利进行；
19.本发明实现了相对准确的案件罪名确定，协助办案人员在立案阶段对案件性质、罪名、案情等形成正确的认识，减少了首因效应的影响，避免在后期侦查阶段改变立案罪名，有效维护司法公信力以及确立司法权威力。
附图说明
20.图1为本发明警方报案信息分析方法流程图；
21.图2为本发明警方报案信息分析系统组成框图。
具体实施方式
22.为进一步了解本发明的内容，结合附图和具体实施方式对本发明作详细描述。
23.警方报案信息分析方法
24.如图1所示，本发明方法主要包括如下步骤：
25.一、报案信息获取
26.目前警方接收的报案信息内容除了基本的报案人个人信息采集之外，主要还包括对案件描述以及辅助证据两大部分，其中案件描述是警方接待人员针对报案人员所报案件的起因、现状、结果等方面问询的文本记录材料；辅助证据是报案人员针对报案信息的描述，提供的验证报案信息的真实性的视频、图像、文件等相关材料。
27.二、案件描述分析
28.1.文本预处理
29.利用文本分割技术，将案件描述分解成一个个以句号分割的句子，从句也列为单独的句子。利用nlp技术对分割句子进行识别和学习，依据标注体系库对分割成分进行标注(标注类型为：主语、谓语、宾语、定语、状语、补语)，得到字词集合s＝{(α1,β1),(α2,β2),
…
}。
30.如：句子“路过的于某偷偷把摩托车骑着走了”，识别学习后为：s＝{(路过的，定语)， (于某，主语)，(偷偷，状语)，(把，)，(摩托车，宾语)，(骑走，谓语)，(了，)}
31.将在句子中不与其它成分(主、谓、宾、定、状、补)产生结构关系，但意义上又是全句所必须的具有独立性质的，用来表示称呼呼叫、对事实进行推测、估计、注释、补充、感叹、
临摹语气等的独立词语进行组合，形成独立词组f＝{“了”，“啊”，“么”，“吗
”…
}，并将字词集合s中的属于词组f的元素予以删除。
32.2.语句结构分析
33.分析报案信息语句中的结构，将每一个句子的主语、谓语、宾语、定语、状语、补语用一个六元组的数据结构保存起来。其中，对于没有宾语的不及物动词结构，宾语置空；有双宾语的动词结构，将构成两个宾语的词项放在一起。将上一步得到的字词组合s进行结构分析，构建六元向量集合st＝{z,w,b,d,zz,bb}，其中z，w，b，d，zz，bb分别表示主语、谓语、宾语、定语、状语、补语。
34.如：上一句中的例子经语句结构分析后得到六元组st＝{于某，骑走，摩托车，路过的，偷偷，}
35.3.宾语转化
36.针对上一步所得六元组中宾语，利用nlp技术进行标签学习，将st中的b转换为bq， bq＝{国家所有物，集体所有物，混合所有物，个人所有物，生命，健康，名誉，安宁}，并将六元组中的宾语转换为标签，得到六元组sst＝{z,w,bq,d,zz,bb}。
37.例如对六元组中的宾语“摩托车”利用nlp技术进行标签学习，学习匹配的标签为“个人所有物”，标签转化后，原六元组转换为sst1＝{于某，骑走，个人所有物，路过的，偷偷，}
38.三、犯罪定性分析
39.我国刑法规定的法规条例目前共有452条，其中刑法第二百六十四条对于【盗窃罪】定义的关键词为：盗窃公私财物，数额较大的，或者多次盗窃、入户盗窃、携带凶器盗窃、扒窃的。
40.按照报案信息分析同样的分析步骤，进行文本预处理、语句结构分析、宾语转化，将构建出上述刑法条款语句的六元组sst2＝(，盗窃，(国家所有物，集体所有物，混合所有物，个人所有物)，，(多次，入户，扒，携带凶器)，数额较大)。
41.提取上一步所得六元组宾语标签信息，构建犯罪对象主体集合zt，zt＝{bq}。
42.将报案信息犯罪对象主体集合zt与依据刑法条款所构建的犯罪对象主体集合zt进行比对，若zt与zt交集为空，则报案信息主体不符合受理条件，直接进行报案信息结果输出；若zt与zt交集非空，则报案信息主体符合受理条件，进行下一步案件罪名分析。
43.前述案件描述信息中所构建犯罪主体集合zt＝{个人所有物}，sst2构建犯罪主体集合 zt＝{国家所有物、集体所有物、混合所有物、个人所有物}，两者交集非空，则案件复合盗窃罪的受理条件。
44.四、罪名分析匹配
45.应用词向量的表示方法进行词项的相似度计算，指定词项的相似度越高，即表示案件描述细节与罪名类型越符合。
46.词向量基本思想是：通过大量语料库训练，将某种语言中的每个词语映射成一个固定长度的向量，所有这些向量构成了词向量空间，而每一个向量就可以视为该空间中的一个点。在每个空间上引入“距离”的度量，就可以根据词向量的距离来判断对应词语之间在句法、语义上的相似性。通过成熟的word2vec词向量学习模型在语料库(包括维基百科、词网)中进行指定词向量学习，得到词项的词向量v。
47.两个词项w1，w2的相似性sim(w1,w2)定义为其对应词向量的余弦相似度：
[0048][0049]
其中分子为两个词向量的内积，分母为两向量模的乘积。若匹配度sim(w1,w2)＞0，表示匹配度高，为潜在匹配词项；若匹配度sim(w1,w2)≤0，表示匹配度低，为非潜在匹配词项，每个语义结构只取一个最大语义相似度结果，作为该语义结构的相似度值。
[0050]
刑法条款语义结构中基本无主语与定语描述，默认主语为犯罪嫌疑人，无定语描述，同时，由于在犯罪定性分析步骤中宾语已经被归类到明确的标签中，故无需进行计算。同时，由于补语是动词或形容词后面的连带成分，述补结构中补充说明述语的结果、程度、趋向、可能、状态、数量等的成分，补语与述语之间是补充与被补充、说明与被说明的关系，所以当存在补语的时，补语与述语的具有同等重要的权重。所以本发明方法关于罪名的匹配只计算谓语、状语、补语三种语义结构词项匹配度。
[0051]
计算案件描述信息语义结构与刑法条款语义结构的相似度，即犯罪行为与某条罪名的匹配程度：
[0052]
sim(sst1,sst2)＝m1·
sim(w1,w2) m2·
sim(zz1,zz2) m3·
sim(bb1,bb2)
[0053]
其中m1，m2，m3分别表示谓语、状语、补语的权重，在本实施例中，考虑到案件描述信息中补语作为对前面描述的语句的补充关系，没有补语就说明不了事实关系，同时，补语还涉及到衡量是否量刑的涉案资金额，故提高补语的相似性权重，取m3＝m1 m2。
[0054]
计算案件描述信息语义结构与前述犯罪定性分析步骤中所筛选出的所有符合受理条件的罪名匹配度进行计算，得到案件与不同罪名的匹配程度。
[0055]
如：前述案件描述六元组sst1＝{于某，骑走，个人所有物，路过的，偷偷，}和盗窃罪名描述六元组sst2＝{，盗窃，(国家所有物，集体所有物，混合所有物，个人所有物)，， (多次，入户，扒，携带凶器)，数额较大}进行罪名匹配度计算，以状语结构词项为例，sst1中状语结构词项集zz1＝{偷偷}，sst2中状语结构词项集zz2＝{多次，入户，扒，携带凶器}，分别将zz1和zz2中的词项带入语料库中进行学习，得到词项“偷偷”的词向量w1，词项“多次”的词向量w2，词项“入户”的词向量w3，词项“扒”的词向量w4，词项“携带凶器”的词向量w5，
[0056]
分别计算词向量w1与w
2-w5的余弦相似性并将词向量结果进行排序，取最大的余弦相似性为当前状语结构相似度sim(zz1，zz2)。
[0057]
分别进行六元组中的其他语句结构的词项计算，得到sim(w1，w2)，sim(zz1，zz2)， sim(bb1，bb2)。
[0058]
进一步根据sim(sst1,sst2)＝m1·
sim(w1,w2) m2·
sim(zz1,zz2) m3·
sim(bb1,bb2)进行匹配度计算，从而最终得到案件描述与盗窃罪名的匹配值，本实施例中，m1，m2，m3分别取0.3， 0.2，0.5。
[0059]
最终依据计算结果对案件与罪名匹配度进行从大到小排序，排名第一且匹配度＞0的罪名为最有可能的罪名。
[0060]
五辅助证据识别
[0061]
案件进行立案需要必要的辅助证据进行支撑，依据我国诉讼法律条文解释与划分，辅助证据可以分为主体证据、行为证据、结果证据、主观证据、情节证据等五种证据，不同的辅助证据在不同的罪名中，呈现出不同的重要性，分为必须要提供的证据和有价值的
证据。定义立案充足度content：
[0062]
content＝mm1*pp1 mm2*pp2 mm3*pp3 mm4*pp4 mm5*pp5[0063]
其中mm1，mm2，mm3，mm4，mm5为归一化的证据权重，pp1，pp2，pp3，pp4，pp5分别为主体证据、行为证据、结果证据、主观证据、情节证据满足度。
[0064]
其中各类证据权重依据不同的犯罪类型进行定量设置，如在【拐卖罪】中，只需要提供主体证据即可；则content＝1*pp1；在【抢劫罪】中，需要提供主体证据之外的其他证据其中之一即可。则content＝0.9*pp1 0.1*pp2 0.1*pp3 0.1*pp4 0.1*pp5。
[0065]
证据满足度从材料的上传通道解析而来，若存在相应数据通道的上传文件，则对应证据类型取值1，如：当检测到主体证据通道中存在上传文件时，则主体证据满足度pp1为1。对于某案件，若content≥1，则表示证据充足可以立案；若content＜1，则表示证据不足不可立案。
[0066]
六案件分析报告生成
[0067]
汇总案件信息六元组，罪名分析结果、证据判断结果等信息，按照预存储报告模板，生成分析报告。
[0068]
警方报案信息分析系统
[0069]
如图2所示，实现上述警方报案信息分析方法的系统包括数据导入模块、语料库模块、案件信息分析模块、罪名分析模块、证据分析模块、报告生成模块。
[0070]
其中数据导入模块主要实现案件信息的导入；系统管理模块实现语料库、罪名模型的管理以及nlp标签的学习；案件信息分析模块对报案信息文本进行预处理以及语句结构分析等，判断案件是否满足立案条件；罪名分析匹配模块计算案件描述信息语义结构与刑法条款语义结构的相似度，并输出案件可能的匹配罪名；证据分析模块对报案证据进行识别并计算证据满足度；报告生成模块实现案件分析信息的汇总及报告生成。
[0071]
以上示意性的对本发明及其实施方式进行了描述，该描述没有限制性，附图中所示的也只是本发明的实施方式之一，实际的结构并不局限于此。所以，如果本领域的普通技术人员受其启示，在不脱离本发明创造宗旨的情况下，不经创造性的设计出与该技术方案相似的结构方式及实施例，均应属于本发明的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：故障检测方法、装置、电子设备和可读存储介质与流程

一种警方报案信息分析方法及系统与流程

相关文献

最热文献