一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种政策发布对比评估系统及方法与流程

2022-02-20 20:58:47 来源:中国专利 TAG:


1.本发明属于内容分析处理领域,尤其涉及一种政策发布对比评估的方法。


背景技术:

2.政策性项目是符合国家特定产业或社会政策目标、意图的生产项目。如高技术产业开发项目、基础设施开发项目、农业技术进步与发展项目等等,这些项目,一般都具有周期长、贷款风险大、成本高及收益低等特点。因此,政策性项目是政府政策性金融机构贷款和投资的主要对象,对一国经济的发展有举足轻重的作用。
3.目前,每年的管理办法存在一定的差异化,需要人工去比对来区别新政策与就政策的差异,耗时耗力。因此我们对此做出改进,提出一种政策发布对比评估的方法。


技术实现要素:

4.本发明的目的在于克服现有技术存在的以上问题,提供一种政策发布对比评估的方法,有利于政府相关单位对政策出台前(背景快速调研)、出台后(区域实时对比或同区跨时对比)等量化跟踪,可适用不同分析框架生产各类可视政策对比报告。
5.为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
6.一种政策发布对比评估系统,包括数据采集存储模块、分类提取模块、检索匹配模块、排序展示模块、报告生成模块;
7.所述数据采集存储模块用于采集政府面向企业的各类政策文本,并将采集到的政策文本进行格式转换,形成统一文本格式,再将信息储存入系统,形成统一标准的政策数据中台;
8.所述分类提取模块用于将待检测管理机构的对比政策进行读取,再将格式文本转换成与数据中台统一格式,在文本中提取关键字,生成关键词组并将关键词组发送至政策数据中台;
9.所述检索匹配模块将分类提取模块发送的关键词组在数据中台中检索匹配,产生系列命中结果集并发送给排序展示模块;
10.所述排序展示模块用于读取命中结果集,对命中结果集的各个条目数据按规模、时间、单位、区域进行统计排序和可视展示,并提供结果集的关键词组,再将关键词组发送给报告生成模块;
11.所述报告生成模块用于接收排序展示模块的关键词组,用户可根据自身实际需求,自定义首页显示的数据模块以及图表展现方式。
12.进一步地,所述关键词组为使用多组词组通过机器学习训练得出的,关键词组采用doc2vec模型,采用政策文件文本作为训练样本,对模型进行训练;采用结巴分词器计算方法进行训练,生成分词库;采用word2vec算法对分词进行向量化,生成关键词组。
13.一种政策发布对比评估方法:
14.a、数据采集模块根据政策文本发布时间、管理办法文本、项目截止时间、实行的工
作方式、采取的一般步骤、遵循的行动原则进行文章搜索,并抓取文章标题;
15.b、将搜索到的文章进行分类下载,再转换为统一格式,提取关键字后存入数据中台;
16.c、分类提取模块对待检测的政策文章进行数据处理,删除连词、介词、代词这类结构性词汇、去除动词、形容词、副词这类词汇,提取名词组成关键词组,再将关键词组发送至数据中台;
17.d、检索匹配模块将两组关键词组在数据中台内检索匹配,将相同、相近的词组进行标记和储存,产生系列命中结果集并发送给排序展示模块;
18.e、排序展示模块将结果集进行词频计算得出相似程度,按规模、时间、单位、区域将数据源得出的词汇进行横向对比,统计排序和可视展示;
19.f、报告生成模块根据统计结果,对目标政策与整体结果集的结果进行分维度比较,产生实时查询比较报告,报告可以图表或者数据展示呈现。
20.本发明的有益效果是:该种政策发布对比评估系统及方法,有利于政府相关单位对政策出台前(背景快速调研)、出台后(区域实时对比或同区跨时对比)等量化跟踪,可适用不同分析框架生产各类可视政策对比报告。
附图说明
21.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
22.图1是本发明方法流程示意图;
23.图2是本发明方法采集模块示意图
具体实施方式
24.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
25.如图1所示的一种政策发布对比评估的系统,包括数据采集存储模块、分类提取模块、检索匹配模块、排序展示模块、报告生成模块;
26.数据采集存储模块用于采集政府面向企业的各类政策文本,并将采集到的政策文本进行格式转换,形成统一文本格式,再将信息储存入系统,形成统一标准的政策数据中台;
27.分类提取模块用于将待检测管理机构的对比政策进行读取,再将格式文本转换成与数据中台统一格式,在文本中提取关键字,生成关键词组并将关键词组发送至政策数据中台;
28.检索匹配模块将分类提取模块发送的关键词组在数据中台中检索匹配,产生系列命中结果集并发送给排序展示模块;
29.排序展示模块用于读取命中结果集,对命中结果集的各个条目数据按规模、时间、单位、区域进行统计排序和可视展示,并提供结果集的关键词组,再将关键词组发送给报告
生成模块;
30.报告生成模块用于接收排序展示模块的关键词组,用户可根据自身实际需求,自定义首页显示的数据模块以及图表展现方式。
31.将搜索到的文章进行分类下载,再转换为统一格式,提取关键字后存入数据中台;
32.分类提取模块对待检测的政策文章进行数据处理,删除连词、介词、代词这类结构性词汇、去除动词、形容词、副词这类词汇,提取名词组成关键词组,再将关键词组发送至数据中台;
33.检索匹配模块将两组关键词组在数据中台内检索匹配,将相同、相近的词组进行标记和储存,产生系列命中结果集并发送给排序展示模块;
34.排序展示模块将结果集进行词频计算得出相似程度,按规模、时间、单位、区域将数据源得出的词汇进行横向对比,统计排序和可视展示;
35.报告生成模块根据统计结果,对目标政策与整体结果集的结果进行分维度比较,产生实时查询比较报告,报告可以图表或者数据展示呈现
36.关键词组为使用多组词组通过机器学习训练得出的,关键词组采用doc2vec模型,采用政策文件文本作为训练样本,对模型进行训练;采用结巴分词器计算方法进行训练,生成分词库;采用word2vec算法对分词进行向量化,生成关键词组。
37.如图2所示数据采集模块根据政策文本发布时间、管理办法文本、项目截止时间、实行的工作方式、采取的一般步骤、遵循的行动原则进行文章搜索,并抓取文章标题。
38.在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
39.以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献