一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于舆情信息的企业风险预警方法、设备及介质与流程

2022-02-22 08:14:36 来源:中国专利 TAG:


1.本技术涉及风险监测技术领域,尤其涉及一种基于舆情信息的企业风险预警方法、设备及介质。


背景技术:

2.在国家的大力支持下,自主创业凭借其自由度高、工作认可度强的特点,受到越来越多的年轻人选择,正在成为一种新的流行趋势。然而,由于近几年的突发公共卫生事件以及气候变化带来的各种天灾,中小型企业的经营及生产面临着巨大的挑战。与此同时,很多大型企业也因内部因素,导致经营情况、人员结构等出现不稳定的状况。
3.目前,银行主要是根据企业年报或者季度财报来评估一个企业的资金能力,然而这种财报并不具备很强的时效性,无法很好的应对突发情况。银行很难第一时间接收到媒体的报道,因此无法及时得知企业的实时情况。此时,如果银行对企业的经营情况并不知情,只考虑企业之前良好的履约状况,而未进行多重审核,轻易的将钱款发放给经营不稳定的企业,极可能会因为企业经营不善无法平稳度过危机,而造成银行无法及时收回钱款。


技术实现要素:

4.本技术实施例提供了一种基于舆情信息的企业风险预警方法、设备及介质,用以解决现有的银行无法及时获取企业的经营状况,轻易放款给经营不善的企业,而造成钱款无法及时收回的技术问题。
5.一方面,本技术实施例提供了一种基于舆情信息的企业风险预警方法,包括:通过预设的爬取规则,对与企业经营相关的舆情信息进行爬取,并存储至数据库中;获取预先确定的与企业经营相关的若干情感词,并将所述若干情感词添加至情感词词典,以构建文本正负向情感分析模型;根据所述文本正负向情感分析模型中的情感词,对所述数据库中的舆情信息进行分析,得到分析结果;若根据所述分析结果确定所述舆情信息为负向信息,则确定出所述舆情信息中与预设的类别关键词词典相匹配的关键词,并根据所述关键词确定所述舆情信息对应的类别;将所述类别设置为所述舆情信息的标签,以将带有标签的舆情信息推送至具有所述舆情信息对应企业权限的银行系统。
6.在本技术的一种实现方式中,所述根据所述文本正负向情感分析模型中的情感词,对所述数据库中的舆情信息进行分析,得到分析结果,具体包括:遍历所述舆情信息,确定出所述舆情信息中的舆情词汇以及所述舆情词汇所在语句;其中,所述舆情词汇与所述文本正负向情感分析模型中的情感词相匹配;若所述舆情词汇所在语句中包括预设词,则根据所述舆情词汇和所述预设词,确定所述舆情词汇所在语句的正负向;若所述舆情词汇所在语句中不包括所述预设词,则根据所述舆情词汇确定所述舆情词汇所在语句的正负向;统计所述舆情信息中正向语句和负向语句的数量,以确定所述舆情信息的正负向。
7.在本技术的一种实现方式中,所述对与企业经营相关的舆情信息进行爬取之后,还包括:确定所述舆情信息的信息来源,并根据所述信息来源确定所述舆情信息的发布方;
其中,所述发布方包括:个人或者媒体;通过爬虫技术,从网络中爬取所述发布方的基本信息以及违纪信息,以确定所述发布方的权威程度;根据所述发布方的权威程度,确定所述舆情信息的真实性。
8.在本技术的一种实现方式中,所述对与企业经营相关的舆情信息进行爬取之后,还包括:从所述数据库中获取所述爬取到的舆情信息,并将所述舆情信息中的所有空格删除;确定出所述舆情信息的标题以及所述舆情信息对应的企业;通过分布式处理技术,将所述企业的简称与所述企业的全称建立映射关系;根据所述标题以及所述企业的简称或者全称,对所述舆情信息进行空值填充以及重复值过滤;将所述过滤后的舆情信息统一为预设格式。
9.在本技术的一种实现方式中,所述获取预先确定的与企业经营相关的若干情感词之前,还包括:从所述数据库中获取若干企业的历史风险预警信息;通过文本识别技术,从所述若干历史风险预警信息中,确定出与企业经营相关的若干情感词,并存储至数据库中。
10.在本技术的一种实现方式中,所述将所述若干情感词添加至情感词词典之前,还包括:将所述若干情感词对应的文件设置为文本txt格式,并将所述txt格式的文件设置为每行一个词。
11.在本技术的一种实现方式中,所述将所述类别设置为所述舆情信息的标签之后,还包括:根据所述舆情信息对应的企业,从网络中爬取所述企业的注册地址以及实际地址,确定出所述企业意向贷款的地理位置范围;根据所述企业的规模,确定出所述地理位置范围内所述企业有权限申请贷款的银行;将所述带有标签的舆情信息以及所述舆情信息对应企业的全称,推送给所述地理位置范围内有权限申请贷款的所有银行。
12.在本技术的一种实现方式中,所述根据所述分析结果确定所述舆情信息为负向信息之后,还包括:根据若干描述风险的关键词,确定出所述舆情信息的类别,并创建类别关键词词典;其中,所述类别关键词词典中包括:关键词与类别的对应关系;遍历所述舆情信息中与所述关键词相关的所有语句;其中,所述关键词为所述类别关键词词典中的关键词;根据所述舆情信息的语句中包含的关键词,确定出所述舆情信息对应的类别。
13.另一方面,本技术实施例还提供了一种基于舆情信息的企业风险预警设备,设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:通过预设的爬取规则,对与企业经营相关的舆情信息进行爬取,并存储至数据库中;获取预先确定的与企业经营相关的若干情感词,并将所述若干情感词添加至情感词词典,以构建文本正负向情感分析模型;根据所述文本正负向情感分析模型中的情感词,对所述数据库中的舆情信息进行分析,得到分析结果;若根据所述分析结果确定所述舆情信息为负向信息,则确定出所述舆情信息中与预设的类别关键词词典相匹配的关键词,并根据所述关键词确定所述舆情信息对应的类别;将所述类别设置为所述舆情信息的标签,以将带有标签的舆情信息推送至具有所述舆情信息对应企业权限的银行系统。
14.另一方面,本技术实施例还提供了一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:通过预设的爬取规则,对与企业经营相关的舆情信息进行爬取,并存储至数据库中;获取预先确定的与企业经营相关的若干情感词,并将所述若干情感词添加至情感词词典,以构建文本正负向情感分析模型;根据所述文本正负
向情感分析模型中的情感词,对所述数据库中的舆情信息进行分析,得到分析结果;若根据所述分析结果确定所述舆情信息为负向信息,则确定出所述舆情信息中与预设的类别关键词词典相匹配的关键词,并根据所述关键词确定所述舆情信息对应的类别;将所述类别设置为所述舆情信息的标签,以将带有标签的舆情信息推送至具有所述舆情信息对应企业权限的银行系统。
15.本技术实施例提供了一种基于舆情信息的企业风险预警方法、设备及介质,至少包括以下有益效果:通过从网络中爬取与企业经营相关的舆情信息并对其进行分析处理,实现了对舆情信息的有效利用;通过建立文本正负向情感分析模型,对舆情信息进行综合分析,确定出舆情信息的正负向以及舆情信息对应的类别标签,并推送给相关银行,能够为银行提供有价值的参考,避免了现有的银行因无法及时获知企业的实际经营情况,而轻易放款给存在风险的企业,造成钱款无法及时收回的情况。
附图说明
16.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
17.图1为本技术实施例提供的一种基于舆情信息的企业风险预警方法的流程图;
18.图2为本技术实施例提供的一种爬取到的舆情信息;
19.图3为本技术实施例提供的一种企业简称和企业全称的映射关系展示图;
20.图4为本技术实施例提供的舆情信息类别的展示图;
21.图5为本技术实施例提供的一种基于舆情信息的企业风险预警设备的内部结构示意图。
具体实施方式
22.为使本技术的目的、技术方案和优点更加清楚,下面将结合本技术具体实施例及相应的附图对本技术技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
23.本技术实施例提供了一种基于舆情信息的企业风险预警方法、设备及介质,通过从网络中爬取与企业经营相关的舆情信息并对其进行分析处理,实现了对舆情信息的有效利用;通过建立文本正负向情感分析模型,对舆情信息进行综合分析,确定出舆情信息的正负向以及舆情信息对应的类别标签,并推送给相关银行,能够为银行提供有价值的参考。解决了现有的银行无法及时获取企业的经营状况,轻易放款给经营不善的企业,而造成钱款无法及时收回的技术问题。
24.下面通过附图对本技术实施例提出的技术方案进行详细的说明。
25.图1为本技术实施例提供的一种基于舆情信息的企业风险预警方法的流程图。如图1所示,本技术实施例提供的基于舆情信息的企业风险预警方法主要包括以下步骤:
26.步骤101:通过预设的爬取规则,对与企业经营相关的舆情信息进行爬取,并存储至数据库中。
27.服务器从搜索引擎上搜索与企业经营相关的网站、网页或者平台,并将其作为目
标数据源,确定出根据用户的实际需求预设的爬取规则,然后建立相关的爬取任务。服务器通过爬虫技术,根据具体地爬取任务,从目标数据源爬取媒体报道中与企业经营相关的舆情信息。
28.需要说明的是,本技术获取的舆情信息中包括企业名称、发布时间、新闻标题、新闻正文等信息。本技术实施例中的目标数据源包括但不限于当前主流金融类网站、财经类网站发布的与企业经营相关的新闻。本技术实施例中预设的爬取规则为:先爬取媒体报道中的标题以及相关的企业,然后爬取当前舆情信息的数据来源,即发布当前舆情信息的媒体,再继续爬取当前舆情信息的发布时间、正文中的关键字以及舆情信息的类别。
29.如图2所示,本技术实施例中的服务器是在某某新闻这个网页上爬取的舆情信息,舆情信息的信息来源为某某商报,发布事件为2021年10月15日22点59分,新闻标题为a公司ceo卸任!图2左下角包括新闻正文,图2右下角包括股份申购日历。服务器爬取到舆情信息之后,将舆情信息存储至数据库中。
30.在本技术的一个实施例中,服务器通过爬虫爬取到的与企业经营相关的舆情信息中包括信息来源。在对与企业经营相关的舆情信息进行爬取之后,服务器通过爬取到的数据确定出舆情信息的信息来源,根据信息来源确定舆情信息的发布方是个人或者媒体,然后通过爬虫技术,从网络中爬取舆情信息发布方的基本信息及违纪信息。在发布方是媒体时,服务器明确当前媒体的规模、创立时间以及是否存在虚假新闻、恶意诋毁等违法乱纪的行为信息,据此判断当前媒体的权威程度;在发布方是个人时,服务器获取该发布人的身份信息以及其历史发布的信息,据此确定出该发布人发布信息的权威程度。从而,服务器能够根据发布方的权威程度,确定出当前舆情信息的真实性。这样能够进一步判断爬取到的与企业经营相关的舆情信息的真实性,从而确定企业的实际经营情况。
31.在本技术的一个实施例中,在对与企业经营相关的舆情信息进行爬取之后,服务器从数据库中获取爬取到的若干舆情信息,并将若干舆情信息中标题、正文中的所有空格删除,以便于后续分析使用。服务器根据爬取到的舆情信息,找到舆情信息的标题以及舆情信息对应的企业,并通过分布式处理技术,将企业的简称与企业的全称建立映射关系,从而能够根据企业的简称或者全称,将若干舆情信息进行对比。服务器根据预设的填充规则,对内容存在空缺的舆情信息进行填充;针对同一家企业同一种标签的重复舆情信息,服务器会将其删除过滤,若同一家企业同一种标签的重复舆情信息中包括重要的非重复内容,服务器会将其合并为一条数据,避免了数据库存储空间的浪费,同时还减少了文本正负向情感分析模型处理舆情信息的工作量。此外,服务器还将过滤后的舆情信息中的数据统一为预设的标准格式,从而能够直观的对比若干舆情信息,并对统一格式后仍重复的舆情信息再次进行过滤,进一步减轻了数据库的存储压力。
32.如图3所示,企业简称和企业全称的映射关系分为两种,第一种是上市公司,例如企业简称a是上市公司,那么a对应的企业全称就是a控股集团股份有限公司;第二种是非上市公司,例如企业简称b是非上市公司,那么b对应的企业全称就是b有限公司。通过上述映射关系,本技术实施例爬取到的舆情信息中不论是企业简称还是企业全称,服务器都能将其统一。
33.步骤102:获取预先确定的与企业经营相关的若干情感词,并将若干情感词添加至情感词词典,以构建文本正负向情感分析模型。
34.服务器从数据库中获取预先确定出的与企业经营相关的若干情感词,通过将若干情感词添加至情感词词典中,来扩充情感词词典,并建立文本正负向情感分析模型。这样丰富文本正负向情感分析模型的情感词词典,提高文本正负向情感分析模型分析舆情信息正负向的准确度。
35.在本技术的一个实施例中,在获取预先确定的与企业经营相关的若干情感词之前,服务器从数据库中获取若干企业的历史风险预警信息,并通过文本识别技术,获取若干历史风险预警信息中与企业经营相关的情感词,然后将获取到的情感词存储至数据库中,以便于后续使用。
36.在本技术的一个实施例中,在将获取到的若干情感词添加至情感词词典之前,服务器需要将若干情感词存储在一个文件中,并且由于将情感词导入情感词词典仅支持导入txt格式的文件,所以服务器要将该文件设置为txt格式,同时还要将txt格式文件设置为每行一个词,从而实现情感词词典的扩充。
37.步骤103:根据文本正负向情感分析模型中的情感词,对数据库中的舆情信息进行分析,得到分析结果。
38.服务器根据文本正负向情感分析模型的情感词词典中的若干情感词以及其他词汇,对数据库中爬取到的舆情信息进行综合分析,并得出舆情信息的分析结果。
39.需要说明的是,本技术实施例的情感词词典中不仅包括导入的情感词,还包括描述舆情信息正负向的形容词。
40.具体地,服务器遍历舆情信息,确定出舆情信息中与文本正负向情感分析模型中的情感词相匹配的舆情词汇,以及该舆情词汇所在的语句,并判断舆情词汇所在语句中是否包括预设词。需要说明的是,本技术实施例中的预设词是指对情感词具有修饰作用的强度副词或者对情感词具有语义反转作用的定语。
41.若舆情词汇所在语句中包括预设词,则服务器根据舆情词汇的正负向,以及预设词对该舆情词汇的加强作用或者语义反转作用,最终确定出舆情词汇所在语句的正负向。若舆情词汇中不包括预设词,则服务器只需要根据舆情词汇的正负向,即可确定出当前舆情词汇所在语句的正负向。
42.确定出舆情词汇以及舆情词汇所在语句的正负向之后,服务需要分别统计当前舆情信息中正向语句和负向语句的数量,然后根据正向语句和负向语句共同确定出当前舆情信息的正负向。
43.步骤104:若根据分析结果确定舆情信息为负向信息,则确定出舆情信息中与预设的类别关键词词典相匹配的关键词,并根据关键词确定舆情信息对应的类别。
44.若服务器根据文本正负向情感分析模型的分析结果,确定出当前舆情信息为负向信息,则服务器会继续遍历舆情信息,确定出舆情信息中预设的类别关键词词典相匹配的关键词,并根据匹配出来的关键词,确定舆情信息对应的类别。
45.在本技术的一个实施例中,服务器在根据分析结果确定舆情信息为负向信息之后,会根据若干描述与企业经营相关风险的关键词,分别确定出若干关键词对应舆情信息的类别,从而建立类别关键词词典。需要说明的是,本技术实施例中的关键词词典中包括关键词与类别的对应关系。
46.服务器遍历舆情信息,确定出舆情信息中与类别关键词词典中的关键词相关的所
有语句,然后根据确定出来的各语句中的关键词,确定出当前舆情信息对应的类别。
47.步骤105:将类别设置为舆情信息的标签,以将带有标签的舆情信息推送至具有舆情信息对应企业权限的银行系统。
48.服务器将确定出来的舆情信息的类别,设置为舆情信息的标签,通过标签简要的标注出该舆情信息是属于哪一类风险预警。服务器通过舆情信息对应的企业,确定出具有当前企业权项的银行,然后将带有标签的负向舆情信息,推送给具有当前企业权限的所有银行系统,以便于银行能够及时获取企业的实际经营状况或者巨大的内部人员变动,从而为银行的贷款工作提供及时、有价值的参考,避免银行因信息获取不及时而轻易的将钱款发放给经营不稳定的企业,造成钱款无法及时收回的情况。
49.如图4所示,服务器爬取到的舆情信息中包括企业名称以及具体的舆情信息正文,在舆情信息为负向信息时,服务器遍历舆情信息,确定出舆情信息中的关键词,并从类别关键词词典中确定出关键词对应的类别,从而将该类别设置为该舆情信息的标签,以便于在服务器将舆情信息发送给银行系统时,银行能够根据舆情信息的标签,直接明确舆情信息的类别,从而提高了银行系统的识别效率。
50.在本技术的一个实施例中,服务器在将类别设置为舆情信息的标签之后,能够根据舆情信息中对应的企业名称,从网络中爬取该企业的注册地址、实际地址以及企业的规模;并根据企业的注册地址和实际地址,确定出该企业意向贷款的地理位置范围;然后再根据企业的规模,确定出当前地理位置范围内该企业有权限申请贷款的银行;最后,服务器将带有标签的负向舆情信息,以及该舆情信息对应企业的全称,推送给当前地理位置范围内该企业有权限申请贷款的所有银行。这样能够避免该企业向之前未合作过的银行申请贷款,而未合作过的银行因为没有权限而无法及时得知该企业的舆情信息,从而保护当前地理位置范围内其他银行的利益。需要说明的是,本技术不直接将该企业的舆情信息推送给所有银行,是为了防止无用的信息推送,浪费其他银行的资源以及对应工作人员的时间。
51.以上为本技术提出的方法实施例。基于同样的发明构思,本技术实施例还提供了一种基于舆情信息的企业风险预警设备,其结构如图5所示。
52.图5为本技术实施例提供的一种基于舆情信息的企业风险预警设备的内部结构示意图。如图5所示,设备包括至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:通过预设的爬取规则,对与企业经营相关的舆情信息进行爬取,并存储至数据库中;获取预先确定的与企业经营相关的若干情感词,并将若干情感词添加至情感词词典,以构建文本正负向情感分析模型;根据文本正负向情感分析模型中的情感词,对数据库中的舆情信息进行分析,得到分析结果;若根据分析结果确定舆情信息为负向信息,则确定出舆情信息中与预设的类别关键词词典相匹配的关键词,并根据关键词确定舆情信息对应的类别;将类别设置为舆情信息的标签,以将带有标签的舆情信息推送至具有舆情信息对应企业权限的银行系统。
53.本技术实施例还提供了一种非易失性计算机存储介质,存储有计算机可执行指令,计算机可执行指令设置为:通过预设的爬取规则,对与企业经营相关的舆情信息进行爬取,并存储至数据库中;获取预先确定的与企业经营相关的若干情感词,并将若干情感词添加至情感词词典,以构建文本正负向情感分析模型;根据文本正负向情感分析模型中的情
感词,对数据库中的舆情信息进行分析,得到分析结果;若根据分析结果确定舆情信息为负向信息,则确定出舆情信息中与预设的类别关键词词典相匹配的关键词,并根据关键词确定舆情信息对应的类别;将类别设置为舆情信息的标签,以将带有标签的舆情信息推送至具有舆情信息对应企业权限的银行系统。
54.本技术中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备和介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
55.本技术实施例提供的设备和介质与方法是一一对应的,因此,设备和介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述设备和介质的有益技术效果。
56.本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
57.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
58.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
59.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
60.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
61.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
62.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除
可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
63.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
64.以上所述仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献