一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于自适应阈值的化工原料舆情因子构建方法及相关组件与流程

2022-10-13 00:15:16 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,尤其涉及一种基于自适应阈值的化工原料舆情因子构建方法及相关组件。


背景技术:

2.目前,石化化工行业的发展中,“数字化转型”为近年的重要目标,需建设产业链检测,加快大数据、人工智能等新一代信息技术与石化化工行业融合。化工行业舆情是指大众和媒体等舆情主题通过互联网媒介,对化工行业上下游公司的公开信息(包括公司有关的重大新闻热点信息、供需信息、上下游公司信息、宏观信息)的态度、意见和观点的有关信息。这些信息有利于企业管理者、行业分析师、政府管理者了解公司和行业的情况,以便采取有效的措施面对异常的舆情情况,更好对公司和行业进行分析和管理。
3.目前市场的舆情监测系统主要是通过对行业热点信息进行收集,筛选出对舆情影响最大的top n条信息,通过渠道、情感属性、发布地区等维度对舆情影响情况进行分析。这些舆情监测系统针对的舆情本体是单条的舆情信息,无法概括当天与该化工公司(行业)有关的所有重要舆情信息的信息;且这些舆情监测系统使用的分析方法都是定性的数据分析方法,无法给出一个定量的影响力系数。


技术实现要素:

4.本发明的目的是提供一种基于自适应阈值的化工原料舆情因子构建方法及相关组件,旨在解决现有舆情监测系统无法对化工行业进行定量分析导致评估舆情影响不准确的问题。
5.第一方面,本发明实施例提供一种基于自适应阈值的化工原料舆情因子构建方法,包括:
6.根据不同检索关键词采集与指定化工原料相关的舆情文本集;
7.将所述舆情文本集中的每一舆情文本输入推理模型,分别输出对所述指定化工原料的价格影响结果;
8.构建不同检索关键词采集的所述舆情文本的舆情因子;
9.利用所述舆情因子判定所述指定化工原料的价格影响结果的舆情重要性。。
10.第二方面,本发明实施例提供一种基于自适应阈值的化工原料舆情因子构建装置,包括:
11.采集单元,用于根据不同检索关键词采集与指定化工原料相关的舆情文本集;
12.推理单元,用于将所述舆情文本集中的每一舆情文本输入推理模型,分别输出对所述指定化工原料的价格影响结果;
13.构建单元,用于构建不同检索关键词采集的所述舆情文本的舆情因子;
14.判定单元,用于利用所述舆情因子判定所述指定化工原料的价格影响结果的舆情重要性。
15.第三方面,本发明实施例提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于自适应阈值的化工原料舆情因子构建方法。
16.第四方面,本发明实施例提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于自适应阈值的化工原料舆情因子构建方法。
17.本发明实施例公开了基于自适应阈值的化工原料舆情因子构建方法及相关组件。该方法包括:根据不同检索关键词采集与指定化工原料相关的舆情文本集;将舆情文本集中的每一舆情文本输入推理模型,分别输出对指定化工原料的价格影响结果;构建不同检索关键词采集的舆情文本的舆情因子;利用舆情因子判定指定化工原料的价格影响结果的舆情重要性。本发明实施例提供的方法能够逐日对化工行业舆情信息的影响力进行挖掘,并进行定量分析后给出舆情重要性系数,具有精准评估舆情对指定化工原料的价格影响结果的优点。
附图说明
18.为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
19.图1为本发明实施例提供的基于自适应阈值的化工原料舆情因子构建方法的流程示意图;
20.图2为本发明实施例提供的步骤s101的子流程示意图;
21.图3为本发明实施例提供的步骤s103的子流程示意图;
22.图4为本发明实施例提供的基于自适应阈值的化工原料舆情因子构建装置的示意性框图;
23.图5为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
24.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
25.应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
26.还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
27.还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
28.请参阅图1,图1为本发明实施例提供的基于自适应阈值的化工原料舆情因子构建方法的流程示意图;
29.如图1所示,该方法包括步骤s101~s104。
30.s101、根据不同检索关键词采集与指定化工原料相关的舆情文本集;
31.该步骤中,通过不同检索关键词采集到的舆情文本集更加全面,以便后续更加精准的进行评估;
32.s102、将舆情文本集中的每一舆情文本输入推理模型,分别输出对指定化工原料的价格影响结果;
33.s103、构建不同检索关键词采集的舆情文本的舆情因子;
34.该步骤中,舆情因子中可以包含舆情影响力因子和舆情演化因子,舆情影响力因子的大小代表舆情文本对化工原料的价格影响结果的大小,舆情影响力因子越大,说明当日舆情对价格的推动作用越大;舆情演化因子反映随时间演化,舆情对价格的影响。
35.s104、利用舆情因子判定指定化工原料的价格影响结果的舆情重要性。
36.该步骤中,基于步骤s103构建的舆情因子判定舆情对该指定化工原料的价格影响结果的舆情重要性,即舆情因子越大说明对该指定化工原料的价格影响结果越重要。
37.本实施例能够逐日对化工行业舆情信息的影响力进行挖掘,并进行定量分析后给出舆情重要性系数,具有精准评估舆情对指定化工原料的价格影响结果的优点。
38.在一实施例中,如图2所示,步骤s101包括:
39.s201、根据指定化工原料的本称采集相关的舆情文本集{x
ip
}
p=1

p
,其中x
ip
表示以指定化工原料的本称作为关键词查询到第i天的第p条舆情文本,当日共有p条舆情文本;
40.s202、根据指定化工原料的上游化工原料名称采集相关的舆情文本集 {y
iq
}
q=1
…q,其中y
iq
表示以指定化工原料的上游原料名称作为关键词查询到第 i天的第q条舆情文本,当日一共有q条舆情文本;
41.s203、根据指定化工原料的下游产品名称采集相关的舆情文本集{z
iz
}
z=1
…z,其中z
iz
表示以指定化工原料的的下游产品名称作为关键词查询到第i天的第z 条舆情文本,当日一共有z条舆情文本。
42.本实施例通过信息采集模块采集与该指定化学原料相关的舆情文本,从业内产业链来看上游原料的供给情况与下游产品的需求情况对该原料市场环境有重要影响作用,基于业内产业链的相关性,信息采集的检索关键词列表包括指定化工原料的本称、上游化工原料名称(多个名称可形成列表)与下游化工产品名称(多个名称可形成列表),从而得到与指定化工原料相关的舆情文本集。
43.在一实施例中,步骤s102包括:
44.对每一舆情文本进行归一化编码并输入推理模型,并按照对指定化工原料的价格影响输出正向影响、中性影响和负向影响。
45.本实施例中,可将舆情文本集按照4:1的比例划分为训练集和测试集,将训练集中的每一舆情文本进行归一化编码后输入推理模型,按照对指定化工原料的价格影响输出表示为sign(x)=1的正向影响,代表该舆情文本的含义为正向,输出表示为sign(x)=0的中性影响,代表该舆情文本的含义为中性,输出表示为sign(x)=-1的负向影响,代表该舆情文本的含义为负向。
46.基于训练集学习训练得到的推理模型,通过测试集进行验证以便进行模型优化。
47.在一实施例中,如图3所示,步骤s103包括:
48.s301、按如下公式构建以指定化工原料的本称为关键词的舆情文本的舆情因子nx:
[0049][0050]
s302、按如下公式构建以上游化工原料名称为关键词的舆情文本的舆情因子ny:
[0051][0052]
s303、按如下公式构建以下游产品名称为关键词的舆情文本的舆情因子nz:
[0053][0054]
其中,nxi表示第i天指定化工原料的本称为关键词的舆情重要性,nyi表示第i天上游化工原料名称为关键词的舆情重要性,nzi表示第i天下游产品名称为关键词的舆情重要性;rd表示阅读量,sign(x
ip
)表示第i天的第p条舆情文本对指定化工原料的价格影响结果,lk表示点赞量,ct表示收藏量,fd表示转发量,ε表示历史1年读者反馈值序列的上四分位数,表示若表示若则值为1,否则为0。
[0055]
需说明的是,随着时间推移历史消息对原料价格的影响越来越小,经过实验验证仅考虑历史10天的舆情文本,当日舆情文本i=1,ti=1,昨日舆情文本用i=2表示,ti=2以此类推;上游化工原料和下游产品对原料价格的影响存在间接影响,a和b均表示对应渠道的影响因子,e表示常数。
[0056]
本实施例中,将各个参数代入上述舆情因子公式进行计算并得到舆情因子 nx、舆情因子ny和舆情因子nz。
[0057]
在一实施例中,步骤s104包括:
[0058]
根据指定化工原料的本称为关键词的舆情文本的舆情因子、上游化工原料名称为关键词的舆情文本的舆情因子以及下游产品名称为关键词的舆情文本的舆情因子的总和,得到舆情文本集对指定化工原料的价格影响结果的舆情重要性。
[0059]
本实施例中,按公式ni=nx ny nz计算并得到当日的舆情重要性系数 ni;基于该舆情重要性系数ni可获知对指定化工原料的价格影响结果的重要性,以便管理者更加精准的对公司和行业进行分析和管理。
[0060]
本发明实施例还提供一种基于自适应阈值的化工原料舆情因子构建装置,该基于自适应阈值的化工原料舆情因子构建装置用于执行前述基于自适应阈值的化工原料舆情因子构建方法的任一实施例。具体地,请参阅图4,图4是本发明实施例提供的基于自适应阈值的化工原料舆情因子构建装置的示意性框图。
[0061]
如图4所示,基于自适应阈值的化工原料舆情因子构建装置400,包括:采集单元401、推理单元402、构建单元403以及判定单元404。
[0062]
采集单元401,用于根据不同检索关键词采集与指定化工原料相关的舆情文本集;
[0063]
推理单元402,用于将舆情文本集中的每一舆情文本输入推理模型,分别输出对指定化工原料的价格影响结果;
[0064]
构建单元403,用于构建不同检索关键词采集的舆情文本的舆情因子;
[0065]
判定单元404,用于利用舆情因子判定指定化工原料的价格影响结果的舆情重要性
[0066]
该装置能够逐日对化工行业舆情信息的影响力进行挖掘,并进行定量分析后给出舆情重要性系数,具有精准评估舆情对指定化工原料的价格影响结果的优点。
[0067]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0068]
上述基于自适应阈值的化工原料舆情因子构建装置可以实现为计算机程序的形式,该计算机程序可以在如图5所示的计算机设备上运行。
[0069]
请参阅图5,图5是本发明实施例提供的计算机设备的示意性框图。该计算机设备500是服务器,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
[0070]
参阅图5,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器 504。
[0071]
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行基于自适应阈值的化工原料舆情因子构建方法。
[0072]
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
[0073]
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行基于自适应阈值的化工原料舆情因子构建方法。
[0074]
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图5中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0075]
本领域技术人员可以理解,图5中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图5所示实施例一致,在此不再赘述。
[0076]
应当理解,在本发明实施例中,处理器502可以是中央处理单元(centralprocessing unit,cpu),该处理器502还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0077]
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现本发明实施例的基于自适应阈值的化工原料舆情因子构建方
法。
[0078]
存储介质为实体的、非瞬时性的存储介质,例如可以是u盘、移动硬盘、只读存储器(read-only memory,rom)、磁碟或者光盘等各种可以存储程序代码的实体存储介质。
[0079]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0080]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献