信息处理方法、装置、电子设备和存储介质与流程

2021-11-03 20:28:00 来源：中国专利 TAG：

1.本技术涉及信息处理技术领域，尤其涉及知识图谱、深度学习领域，特别涉及一种信息处理方法、装置、电子设备和存储介质。

背景技术：

2.随着互联网的发展，智能创作在媒体、金融、广告等多个行业逐渐体现其应用价值。当用户对于某一话题感兴趣，希望围绕该话题进行创作时，可在互联网的海量信息中挖掘该话题的潜在发酵舆情事件。相关技术中，潜在发酵舆情事件的自动挖掘方案基本依赖于预先配置的关键词表，通过关键词在关键词表中检索与之对应的潜在发酵舆情事件；或者通过热度变化对潜在发酵舆情事件进行识别。

技术实现要素：

3.本技术提供了一种信息处理方法、装置、电子设备和存储介质。
4.根据本技术的第一方面，提供了一种信息处理方法，包括：
5.对抓取到的原始数据进行预处理；
6.采用预设策略对经过预处理后的原始数据进行检测，将检测到的数据作为潜在发酵舆情事件进行召回；其中，所述预设策略包括下述至少一项：关键词过滤策略、发酵预测模型判别策略和热度爆发检测策略；
7.对召回的所述潜在发酵舆情事件进行属性计算，获得所述潜在发酵舆情事件的属性信息；
8.将所述潜在发酵舆情事件和所述潜在发酵舆情事件的属性信息存储至潜在发酵舆情库。
9.根据本技术的第二方面，提供了一种信息处理装置，包括：
10.预处理模块，用于对抓取到的原始数据进行预处理；
11.检测召回模块，用于采用预设策略对经过预处理后的原始数据进行检测，将检测到的数据作为潜在发酵舆情事件进行召回；其中，所述预设策略包括下述至少一项：关键词过滤策略、发酵预测模型判别策略和热度爆发检测策略；
12.属性计算模块，用于对召回的所述潜在发酵舆情事件进行属性计算，获得所述潜在发酵舆情事件的属性信息；
13.存储模块，用于将所述潜在发酵舆情事件和所述潜在发酵舆情事件的属性信息存储至潜在发酵舆情库。
14.根据本技术的第三方面，提供了一种电子设备，包括：
15.至少一个处理器；以及
16.与所述至少一个处理器通信连接的存储器；其中，
17.所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行前述第一方面所述的信息处理方法。
18.根据本技术的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行前述第一方面所述的信息处理方法。
19.根据本技术的第五方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据前述第一方面所述的信息处理方法。
20.根据本技术的技术方案，通过预设策略对经过预处理后的原始数据进行检测，通过是否包含高价值领域的关键词、是否具有足够热度以及是否具有发酵潜力等条件，筛选出具有舆情发酵潜力的内容做为潜在发酵舆情事件，并对该潜在发酵舆情事件进行召回，其中，该预设策略包括关键词过滤策略、发酵预测模型判别策略或热度爆发检测策略中的至少一项，使得潜在发酵舆情事件的挖掘具有更高的时效性、覆盖性和传播价值。
21.应当理解，本部分所描述的内容并非旨在标识本技术的实施例的关键或重要特征，也不用于限制本技术的范围。本技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
22.附图用于更好地理解本方案，不构成对本技术的限定。其中：
23.图1为本技术实施例一所提供的一种信息处理方法的流程图；
24.图2为本技术实施例二所提供的一种获得潜在发酵舆情事件的流程示意图；
25.图3为本技术实施例三所提供的一种获得数据作为潜在发酵舆情事件的流程示意图；
26.图4为本技术实施例四所提供的一种获得潜在发酵舆情事件的流程示意图；
27.图5为本技术实施例五所提供的一种获得潜在发酵舆情事件的流程示意图；
28.图6为本技术实施例六所提供的一种获得潜在发酵舆情事件的流程示意图；
29.图7为本技术实施例七所提供的一种信息处理方法的流程图；
30.图8为本技术实施例八所提供的一种信息处理方法的流程图；
31.图9为本技术实施例九所提供的一种信息处理装置的结构框图；
32.图10为本技术实施例十所提供的一种信息处理装置的结构框图；
33.图11为本技术实施例十一所提供的一种信息处理装置的结构框图；
34.图12是用来实现本技术实施例的信息处理方法的电子设备的框图。
具体实施方式
35.以下结合附图对本技术的示范性实施例做出说明，其中包括本技术实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本技术的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
36.需要说明的是，目前业内的潜在发酵舆情的自动挖掘方案基本依赖于预先配置的关键词表，或者通过热度变化进行识别，检索出潜在发酵舆情事件并进行召回。但基于关键词表的方案对新出现的事物感知较差，而基于热度变化的监测方案存在较多的误召回问题，需要人工挑选等干预措施。此外，用于潜在发酵舆情挖掘的数据通常来自于服务提供商自有的部分数据，数据来源有限。由此，目前的潜在发酵舆情的自动挖掘方案不能保证挖掘潜在发酵舆情事件的时效性、准确性和覆盖性。
37.为此，本技术提供了一种信息处理方法、装置、电子设备和存储介质。具体地，下面参考附图描述本技术实施例的信息处理方法、装置、电子设备和存储介质。
38.图1为本技术实施例一所提供的信息处理方法的流程图。需要说明的是，本技术实施例的信息处理方法可应用于本技术实施例的信息处理装置，该信息处理装置可被配置于电子设备上。
39.如图1所示，该信息处理方法可以包括如下步骤。
40.步骤101，对抓取到的原始数据进行预处理。
41.可选地，本技术实施例的信息处理方法可从海量互联网信息中抓取原始数据，再通过实时数据接口读取实时抓取的原始数据，该实时数据接口可通过消息中间件bigpipe实现，上游将抓取到的实时数据通过bigpipe下发。下游提前部署好多个消费者，通过restful api(representational state transfer application programming interface,rest风格的网络接口)从bigpipe的队列中竞争消费这些数据，从而多例并行的挖掘潜在发酵舆情事件，提高了数据抓取的覆盖性。
42.步骤102，采用预设策略对经过预处理后的原始数据进行检测，将检测到的数据作为潜在发酵舆情事件进行召回；其中，预设策略包括下述至少一项：关键词过滤策略、发酵预测模型判别策略和热度爆发检测策略。
43.可选地，可通过不同策略检测是否将检测到的数据作为潜在发酵舆情事件并进行召回。具体实现方式可参见后续实施例的描述。
44.步骤103，对召回的潜在发酵舆情事件进行属性计算，获得潜在发酵舆情事件的属性信息。
45.在本技术一些实施例中，属性计算可以包括情感倾向、行业分类、主题提取等操作，该属性用于支持下游用户的各类需求。
46.步骤104，将潜在发酵舆情事件和潜在发酵舆情事件的属性信息存储至潜在发酵舆情库。
47.也就是说，将潜在发酵舆情事件和潜在发酵舆情事件的属性信息存储至潜在发酵舆情库后，就可根据内容创作者的搜索请求，在潜在发酵舆情库中检索出满足搜索筛选条件的潜在发酵舆情事件。
48.根据本技术实施例的信息处理方法，对抓取到的原始数据进行预处理，采用关键词过滤策略、发酵预测模型判别策略或热度爆发检测策略对经过预处理后的原始数据进行检测，将检测到的数据作为潜在发酵舆情事件进行召回。对召回的潜在发酵舆情事件进行属性计算，获得潜在发酵舆情事件的属性信息，并将潜在发酵舆情事件和潜在发酵舆情事件的属性信息存储至潜在发酵舆情库。通过是否包含高价值领域的关键词、是否具有足够热度以及是否具有发酵潜力等条件，筛选出具有舆情发酵潜力的内容做为潜在发酵舆情事件并进行召回，使得潜在发酵舆情事件的挖掘具有更高的时效性、覆盖性和传播价值。
49.需要说明的是，在本技术一些实施例中，步骤102中采用预设策略对经过预处理后的原始数据进行检测中的预设策略可以包括关键词过滤策略。作为一种示例，如图2所示，本技术实施例二所提供的采用关键词过滤策略对经过预处理后的原始数据进行检测，将检测到的数据作为潜在发酵舆情事件进行召回的实现方式可以包括如下步骤。
50.步骤201，根据预先配置的关键词表构建有限状态自动机。
51.在本技术一些实施例中，预先配置的关键词表可包含潜在发酵舆情时间通常包含的关键词。基于该关键词构建有限状态自动机，该有限状态自动机用于进行高效的多模式的文本匹配。
52.步骤202，根据有限状态自动机对经过预处理后的原始数据进行文本匹配，从经过预处理后的原始数据之中获取满足文本匹配条件的数据。
53.需要说明的是，文本匹配条件是为了筛选出高价值、领域定位更精准的文本数据。作为一种示例，文本匹配条件可以为：文本数据的领域分类不是娱乐、情感等低价值领域，由此可保留高价值数据，具有更高的舆情发酵潜力。
54.步骤203，确定满足文本匹配条件的数据的时效性是否满足预设条件。如果时效性满足预设条件，则执行步骤204。
55.作为一种示例，该预设条件可以是：满足文本匹配条件的数据发布时间在1小时内。若该数据发布时间在1小时内，即视为满足预设条件，可继续执行下一步骤。
56.步骤204，将满足文本匹配条件且时效性满足预设条件的数据作为潜在发酵舆情事件进行召回。
57.作为一种示例，当时效性预设条件为：发布时间在1小时以内；文本匹配条件为：文本数据的领域不是娱乐等低价值领域。若一组文本数据发布时间为半小时以内，且是社会问题领域，满足前述时效性预设条件和文本匹配条件，即将该文本数据作为潜在发酵舆情事件并进行召回。
58.需要说明的是，在本技术一些实施例中，步骤102中采用预设策略对经过预处理后的原始数据进行检测中的预设策略可以包括发酵预测模型判别策略。作为一种示例，如图3所示，本技术实施例三所提供的采用发酵预测模型判别策略对经过预处理后的原始数据进行检测，将检测到的数据作为潜在发酵舆情事件进行召回的实现方式可以包括如下步骤。
59.步骤301，将经过预处理后的原始数据输入至预设的发酵预测模型，获得发酵预测模型输出的预测概率；其中，发酵预测模型已经学习得到输入数据与潜在发酵舆情事件之间的映射关系。
60.需要说明的是，发酵预测模型可基于训练模型通过学习训练得到，训练数据可来自于带有热度信息的互联网数据，经过规则过滤和人工检查处理得到的。发酵预测模型针对输入的经过预处理后的原始数据，返回一个0～1的值作为概率，代表该数据发酵潜力的大小。
61.步骤302，判断预测概率是否大于第一阈值。如果预测概率大于第一阈值，则执行步骤303。
62.需要说明的是，通过预测概率与第一阈值相比较，可判断原始数据是否具有足够的发酵潜力。若预测概率大于第一阈值，则判断该数据具有足够的发酵潜力；若预测概率小于等于第一阈值，则判断该数据发酵潜力不足。
63.步骤303，从经过预处理后的原始数据之中，确定出预测概率大于第一阈值的数据。
64.也就是说，在原始数据中，筛选出具有发酵潜力的那部分数据。
65.步骤304，将预测概率大于第一阈值的数据作为潜在发酵舆情事件进行召回。
66.作为一种示例，将第一阈值设为0.85。若将经过预处理后的原始数据输入至预设
的发酵预测模型后，获得发酵预测模型输出的预测概率为0.9，预测概率大于第一阈值，即判断该数据具有足够的发酵潜力，可将该数据作为潜在发酵舆情事件进行召回。
67.需要说明的是，在本技术一些实施例中，步骤102中采用预设策略对经过预处理后的原始数据进行检测中的预设策略可以包括热度爆发检测策略。作为一种示例，如图4所示，本技术实施例四所提供的采用热度爆发检测策略对经过预处理后的原始数据进行检测，将检测到的数据作为潜在发酵舆情事件进行召回的实现方式可以包括如下步骤。
68.步骤401，确定经过预处理后原始数据的历史热度值。
69.可选地，作为一种示例，可通过点赞数、评论数、转发数、阅读数的加权求和计算热度值。
70.步骤402，根据历史热度值，统计n次的热度变化。
71.需要说明的是，可以通过当前时刻热度减去前一刻热度得到热度变化。作为一种示例，假设n为5，统计最近5次的热度变化。第一次热度变化为第一次记录的历史热度值减去上一次记录的历史热度值；第二次热度变化为第二次记录的历史热度值减去第一次记录的历史热度值；第三次热度变化为第三次记录的历史热度值减去第二次记录的历史热度值；第四次热度变化为第四次记录的历史热度值减去第三次记录的历史热度值；第五次热度变化为第五次记录的历史热度值减去第四次记录的历史热度值。
72.步骤403，根据n次的热度变化计算热度变化平均值，并根据历史热度值计算平均热度值。
73.作为一种示例，也就是说，根据步骤402中得到的最近5次的热度变化计算热度变化平均值。在根据最近5次的历史热度值计算平均热度值。
74.步骤404，从经过预处理后的原始数据之中，将热度变化平均值大于第二阈值且平均热度值大于第三阈值的数据作为潜在发酵舆情事件进行召回。
75.需要说明的是，第二阈值用于判断该数据的热度在最近n次的统计中，是否处于上升的趋势；第三阈值用于判断该数据是否有足够热度。需同时满足热度变化平均值大于第二阈值且平均热度值大于第三阈值的数据，才能将该数据作为潜在发酵舆情事件进行召回。若数据的热度变化平均值大于第二阈值，但平均热度值小于第三阈值的数据，则仅代表该数据的热度逐渐上升，但整体热度并不高，没有足够的发酵潜力；若数据的平均热度值大于第三阈值，但热度变化平均值小于第二阈值，则代表虽然数据的整体热度高，但热度呈现下降趋势，也不能作为潜在发酵舆情事件进行召回。
76.需要说明的是，在本技术一些实施例中，步骤102中采用预设策略对经过预处理后的原始数据进行检测中的预设策略还可以为多种策略的组合。例如，预设策略可以为关键词过滤策略和热度爆发检测策略的组合，发酵预测模型判别策略和热度爆发检测策略的组合，或者关键词过滤策略、发酵预测模型判别策略和热度爆发检测策略的组合等。
77.当预设策略包括多项策略时，如果检测到其中任一项策略命中(即其中任一项策略确定检测到的数据可作为潜在发酵舆情事件)，就会将该数据作为潜在发酵舆情事件进行召回。在此，以包括关键词过滤策略和热度爆发检测策略的预设策略，和包括关键词过滤策略、发酵预测模型判别策略和热度爆发检测策略的预设策略为例，解释当预设策略包括多项策略时，步骤102中采用预设策略对经过预处理后的原始数据进行检测，将检测到的数据作为潜在发酵舆情事件进行召回的实现方式。
78.作为一种示例，如图5所示，本技术实施例五所提供的采用关键词过滤策略和热度爆发检测策略对经过预处理后的原始数据进行检测，将检测到的数据作为潜在发酵舆情事件进行召回的实现方式可以包括如下步骤。
79.步骤501，根据预先配置的关键词表构建有限状态自动机。
80.步骤502，根据有限状态自动机对经过预处理后的原始数据进行文本匹配，从经过预处理后的原始数据之中获取满足文本匹配条件的数据。
81.步骤503，确定满足文本匹配条件的数据的时效性是否满足预设条件。如果时效性不满足预设条件，则执行步骤504；如果时效性满足预设条件，则执行步骤508，将满足文本匹配条件且时效性满足预设条件的数据作为潜在发酵舆情事件进行召回。
82.步骤504，确定经过预处理后原始数据的历史热度值。
83.步骤505，根据历史热度值，统计n次的热度变化。
84.步骤506，根据n次的热度变化计算热度变化平均值，并根据历史热度值计算平均热度值。
85.步骤507，判断热度变化值是否大于第二阈值且平均热度值大于第三阈值。如果热度变化平均值大于第二阈值且平均热度值大于第三阈值，则执行步骤508，从经过预处理后的原始数据之中，将热度变化平均值大于第二阈值且平均热度值大于第三阈值的数据作为潜在发酵舆情事件进行召回。
86.步骤508，从经过预处理后的原始数据之中，确定出满足条件的数据，将该数据作为潜在发酵舆情事件进行召回。
87.在本技术实施例中，步骤501
‑
步骤508可以分别采用本技术的各实施例中的任一种方式实现，本技术并不对此作出限定，也不再赘述。
88.根据本技术实施例提出的采用关键词过滤策略和热度爆发检测策略对经过预处理后的原始数据进行检测，若判断该数据满足文本匹配条件和时效条件，即可将该数据作为潜在发酵舆情事件进行召回，无需再通过热度爆发检测策略进行检测；若该数据不满足文本匹配条件和时效条件，再通过热度爆发检测策略进行检测，若热度爆发检测策略判断该数据可作为潜在发酵舆情事件，则该不满足文本匹配条件和时效条件的数据也可作为潜在发酵舆情事件。需要说明的是，策略的先后顺序不唯一，也可先采用热度爆发检测策略进行检测，若热度不满足条件，再采用关键词过滤策略进行检测，其具体步骤不再赘述。
89.作为一种示例，如图6所示，本技术实施例六所提供的采用关键词过滤策略、发酵预测模型判别策略和热度爆发检测策略对经过预处理后的原始数据进行检测，将检测到的数据作为潜在发酵舆情事件进行召回的实现方式可以包括如下步骤。
90.步骤601，根据预先配置的关键词表构建有限状态自动机。
91.步骤602，根据有限状态自动机对经过预处理后的原始数据进行文本匹配，从经过预处理后的原始数据之中获取满足文本匹配条件的数据。
92.步骤603，确定满足文本匹配条件的数据的时效性是否满足预设条件。如果时效性不满足预设条件，则执行步骤604；如果时效性满足预设条件，则执行步骤610，将满足文本匹配条件且时效性满足预设条件的数据作为潜在发酵舆情事件进行召回。
93.步骤604，将经过预处理后的原始数据输入至预设的发酵预测模型，获得发酵预测模型输出的预测概率；其中，发酵预测模型已经学习得到输入数据与潜在发酵舆情事件之
间的映射关系.
94.步骤605，判断预测概率是否大于第一阈值。如果预测概率小于等于第一阈值，则执行步骤606；如果预测概率大于第一阈值，则执行步骤610，将预测概率大于第一阈值的数据作为潜在发酵舆情事件进行召回。
95.步骤606，确定经过预处理后原始数据的历史热度值。
96.步骤607，根据历史热度值，统计n次的热度变化。
97.步骤608，根据n次的热度变化计算热度变化平均值，并根据历史热度值计算平均热度值。
98.步骤609，判断热度变化值是否大于第二阈值且平均热度值大于第三阈值。如果热度变化平均值大于第二阈值且平均热度值大于第三阈值，则执行步骤610，从经过预处理后的原始数据之中，将热度变化平均值大于第二阈值且平均热度值大于第三阈值的数据作为潜在发酵舆情事件进行召回。
99.步骤610，从经过预处理后的原始数据之中，确定出满足条件的数据，将该数据作为潜在发酵舆情事件进行召回。
100.在本技术实施例中，步骤601
‑
步骤610可以分别采用本技术的各实施例中的任一种方式实现，本技术并不对此作出限定，也不再赘述。
101.根据本技术实施例提出的采用关键词过滤策略、发酵预测模型判别策略和热度爆发检测策略对经过预处理后的原始数据进行检测，三种策略中有一种判断该数据可作为潜在发酵舆情事件，即可将该数据作为潜在发酵舆情事件进行召回。
102.需要说明的是，将从原始数据过滤出的潜在发酵舆情事件及其属性信息存储至潜在发酵舆情库后，还可以根据内容创造者的搜索请求，在潜在发酵舆情库中检索出与之对应的目标潜在发酵舆情事件并进行展示。可选地，如图7所示，本技术实施例七所提供的信息处理方法包括如下步骤。
103.步骤701，对抓取到的原始数据进行预处理。
104.步骤702，采用预设策略对经过预处理后的原始数据进行检测，将检测到的数据作为潜在发酵舆情事件进行召回；其中，预设策略包括下述至少一项：关键词过滤策略、发酵预测模型判别策略和热度爆发检测策略。
105.步骤703，对召回的潜在发酵舆情事件进行属性计算，获得潜在发酵舆情事件的属性信息。
106.步骤704，将潜在发酵舆情事件和潜在发酵舆情事件的属性信息存储至潜在发酵舆情库。
107.步骤705，通过检索接口或检索页面，获取内容创造者的搜索请求。
108.步骤706，从搜索请求中获取对应的搜索筛选条件。
109.可选地，该搜索筛选条件可以为某个关键词或者某个领域。
110.步骤707，根据搜索筛选条件和潜在发酵舆情库之中的属性信息，从潜在发酵舆情库中检索出满足搜索筛选条件的至少一个目标潜在发酵舆情事件。
111.步骤708，通过检索接口或检索页面，将至少一个目标潜在发酵舆情事件进行展示。
112.在本技术实施例中，步骤701
‑
步骤704可参考步骤101
‑
步骤104，在此不再赘述。
113.根据本技术实施例的信息处理方法，对抓取到的原始数据进行过滤筛选，将具备发酵潜力的数据存储至潜在发酵舆情库中，并判断其属性。通过检索接口或检索页面，获取内容创造者的搜索请求，根据该搜索请求中的搜索筛选条件，在潜在发酵舆情库中检索出满足条件的目标潜在发酵舆情事件，供内容创作者参考。
114.需要说明的是，将从原始数据过滤出的潜在发酵舆情事件及其属性信息存储至潜在发酵舆情库，根据内容创造者的搜索请求，在潜在发酵舆情库中检索出与之对应的目标潜在发酵舆情事件后，还可以根据预先提供的内容撰写模板，生成与目标潜在舆情事件对应的文章。可选地，如图8所示，本技术实施例八所提供的信息处理方法包括如下步骤。
115.步骤801，对抓取到的原始数据进行预处理。
116.步骤802，采用预设策略对经过预处理后的原始数据进行检测，将检测到的数据作为潜在发酵舆情事件进行召回；其中，预设策略包括下述至少一项：关键词过滤策略、发酵预测模型判别策略和热度爆发检测策略。
117.步骤803，对召回的潜在发酵舆情事件进行属性计算，获得潜在发酵舆情事件的属性信息。
118.步骤804，将潜在发酵舆情事件和潜在发酵舆情事件的属性信息存储至潜在发酵舆情库。
119.步骤805，通过检索接口或检索页面，获取内容创造者的搜索请求.
120.步骤806，从搜索请求中获取对应的搜索筛选条件。
121.步骤807，根据搜索筛选条件和潜在发酵舆情库之中的属性信息，从潜在发酵舆情库中检索出满足搜索筛选条件的至少一个目标潜在发酵舆情事件。
122.步骤808，通过检索接口或检索页面，将至少一个目标潜在发酵舆情事件进行展示。
123.步骤809，提供至少一个内容撰写模板。
124.可选地，可将内容撰写模板按照属性分类，例如情感倾向模板、行业分类模板、主题提取模板。这样在内容创作者在后续选择内容撰写模板时可以更快的找到与潜在发酵舆情事件适配的内容撰写模板。
125.步骤810，确定内容创造者从至少一个内容撰写模板中选择的内容撰写模板。
126.步骤811，确定内容创造者从至少一个目标潜在发酵舆情事件中选择的目标潜在发酵舆情事件。
127.步骤812，根据内容创造者选择的内容撰写模板，生成与选择的目标潜在发酵舆情事件对应的文章。
128.在本技术实施例中，步骤801
‑
步骤808可以分别采用本技术的各实施例中的任一种方式实现，本技术并不对此作出限定，也不再赘述。
129.根据本技术实施例的信息处理方法，对抓取到的原始数据进行过滤筛选，将具备发酵潜力的数据存储至潜在发酵舆情库中，并判断其属性。通过检索接口或检索页面，获取内容创造者的搜索请求，根据该搜索请求中的搜索筛选条件，在潜在发酵舆情库中检索出满足条件的目标潜在发酵舆情事件，供内容创作者参考。内容创作者可选择一个预先提供的内容撰写模板，在展示出的目标潜在发酵舆情事件中选择自己需要的目标潜在发酵舆情事件，根据内容创造者选择的内容撰写模板，生成与选择的目标潜在发酵舆情事件对应的
文章，由此可实现在海量的互联网信息中快速、准确的找到高价值的、具有发酵潜力的事件，作为创作的素材，也可以基于内容撰写模板进行智能创作，有助于提升内容创作的时效性和传播价值。
130.图9是根据本技术实施例九所提供的一种信息处理装置的结构框图。如图9所示，该信息处理装置可以包括预处理模块901、检测召回模块902、属性计算模块903和存储模块904。
131.具体地，预处理模块901，用于对抓取到的原始数据进行预处理。
132.检测召回模块902，用于采用预设策略对经过预处理后的原始数据进行检测，将检测到的数据作为潜在发酵舆情事件进行召回。其中，预设策略包括下述至少一项：关键词过滤策略、发酵预测模型判别策略和热度爆发检测策略。
133.在本技术一些实施例中，检测召回模块902具体用于：根据预先配置的关键词表构建有限状态自动机；根据有限状态自动机对经过预处理后的原始数据进行文本匹配，从经过预处理后的原始数据之中获取满足文本匹配条件的数据；确定满足文本匹配条件的数据的时效性是否满足预设条件；响应于时效性满足预设条件，将满足文本匹配条件且时效性满足预设条件的数据作为潜在发酵舆情事件进行召回。
134.在本技术一些实施例中，检测召回模块902具体用于：将经过预处理后的原始数据输入至预设的发酵预测模型，获得发酵预测模型输出的预测概率；其中，发酵预测模型已经学习得到输入数据与潜在发酵舆情事件之间的映射关系；判断预测概率是否大于第一阈值；从经过预处理后的原始数据之中，确定出预测概率大于第一阈值的数据；将预测概率大于第一阈值的数据作为潜在发酵舆情事件进行召回。
135.在本技术一些实施例中，检测召回模块902具体用于：确定经过预处理后的原始数据的历史热度值；根据历史热度值，统计n次的热度变化；根据n次的热度变化计算热度变化平均值，并根据历史热度值计算平均热度值；从经过预处理后的原始数据之中，将热度变化平均值大于第二阈值且平均热度值大于第三阈值的数据作为潜在发酵舆情事件进行召回。
136.属性计算模块903，用于对召回的潜在发酵舆情事件进行属性计算，获得潜在发酵舆情事件的属性信息。
137.存储模块904，用于将潜在发酵舆情事件和潜在发酵舆情事件的属性信息存储至潜在发酵舆情库。
138.可选地，如图10所示，在本技术实施例十所提供的信息处理装置中，该信息处理装置还可以包括第一获取模块1005、第二获取模块1006、检索模块1007和展示模块1008。
139.具体地，第一获取模块1005，用于通过检索接口或检索页面，获取内容创造者的搜索请求。
140.第二获取模块1006，用于从搜索请求中获取对应的搜索筛选条件。
141.检索模块1007，用于根据搜索筛选条件和潜在发酵舆情库之中的属性信息，从潜在发酵舆情库中检索出满足搜索筛选条件的至少一个目标潜在发酵舆情事件。
142.展示模块1008，用于通过检索接口或检索页面，将至少一个目标潜在发酵舆情事件进行展示。
143.其中，图10中的1001
‑
1004和图9中的901
‑
904具有相同功能和结构。
144.可选地，如图11所示，在本技术实施例十一所提供的信息处理装置中，该信息处理
装置还可以包括提供模块1109、第一确定模块1110、第二确定模块1111和生成模块1112。
145.具体地，提供模块1109，用于提供至少一个内容撰写模板；
146.第一确定模块1110，用于确定内容创造者从至少一个内容撰写模板中选择的内容撰写模板；
147.第二确定模块1111，用于确定内容创造者从至少一个目标潜在发酵舆情事件中选择的目标潜在发酵舆情事件；
148.生成模块1112，用于根据内容创造者选择的内容撰写模板，生成与选择的目标潜在发酵舆情事件对应的文章。
149.其中，图11中的1101
‑
1108和图10中的1001
‑
1008具有相同功能和结构。
150.关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
151.根据本技术实施例的信息处理装置，对抓取到的原始数据进行过滤筛选，将具备发酵潜力的数据存储至潜在发酵舆情库中，并判断其属性。通过检索接口或检索页面，获取内容创造者的搜索请求，根据该搜索请求中的搜索筛选条件，在潜在发酵舆情库中检索出满足条件的目标潜在发酵舆情事件，供内容创作者参考。内容创作者可选择一个预先提供的内容撰写模板，在展示出的目标潜在发酵舆情事件中选择自己需要的目标潜在发酵舆情事件，根据内容创造者选择的内容撰写模板，生成与选择的目标潜在发酵舆情事件对应的文章，由此可实现在海量的互联网信息中快速、准确的找到高价值的、具有发酵潜力的事件，作为创作的素材，也可以基于内容撰写模板进行智能创作，有助于提升内容创作的时效性和传播价值。
152.根据本技术的实施例，本技术还提供了一种电子设备、一种存储有计算机指令的非瞬时计算机可读存储介质和一种计算机程序产品。
153.如图12所示，是根据本技术实施例的信息处理方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本技术的实现。
154.如图12所示，该电子设备包括：一个或多个处理器1201、存储器1202，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图12中以一个处理器1201为例。
155.存储器1202即为本技术所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本技术所提供的信息处理方法。本技术的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使
计算机执行本技术所提供的信息处理方法。
156.存储器1202作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本技术实施例中的信息处理方法对应的程序指令/模块(例如，附图11所示的预处理模块1101、检测召回模块1102、属性计算模块1103、存储模块1104、第一获取模块1105、第二获取模块1106、检索模块1107、展示模块1108、提供模块1109、第一确定模块1110、第二确定模块1111和生成模块1112)。处理器1201通过运行存储在存储器1202中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的信息处理方法。
157.存储器1202可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据信息处理电子设备的使用所创建的数据等。此外，存储器1202可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器1202可选包括相对于处理器1201远程设置的存储器，这些远程存储器可以通过网络连接至信息处理电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
158.信息处理方法的电子设备还可以包括：输入装置1203和输出装置1204。处理器1201、存储器1202、输入装置1203和输出装置1204可以通过总线或者其他方式连接，图12中以通过总线连接为例。
159.输入装置1203可接收输入的数字或字符信息，以及产生与信息处理电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1204可以包括显示设备、辅助照明装置(例如，led)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。
160.此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，即本技术还提出了一种计算机程序，该计算机程序在被处理器执行时，实现上述实施例所描述的信息处理方法，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
161.这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(pld))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
162.为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，crt(阴极射线管)或者lcd(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
163.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(lan)、广域网(wan)、互联网和区块链网络。
164.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端
‑
服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与vps服务("virtual private server"，或简称"vps")中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。
165.应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本技术公开的技术方案所期望的结果，本文在此不进行限制。
166.上述具体实施方式，并不构成对本技术保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本技术的精神和原则之内所作的修改、等同替换和改进等，均应包含在本技术保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种锂电池底焊工位追溯系统的制作方法

信息处理方法、装置、电子设备和存储介质与流程

相关文献

最热文献