一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

事件检测方法、装置、电子设备和存储介质与流程

2022-05-18 04:42:07 来源:中国专利 TAG:


1.本公开涉及人工智能技术领域,尤其涉及计算机视觉技术领域和语音识别技术领域。更具体地,本公开提供了一种事件检测方法、装置、电子设备和存储介质。


背景技术:

2.与心理健康相关的事件检测,主要通过心理健康评估等方式进行。例如,可以通过问卷调查的方式进行心理健康评估。


技术实现要素:

3.本公开提供了一种事件检测方法、装置、电子设备以及存储介质。
4.根据第一方面,提供了一种事件检测方法,该方法包括:根据与目标对象相关的第一文本信息,进行情绪识别,得到第一情绪信息;根据所述第一情绪信息,确定所述目标对象的情绪类别;响应于确定所述情绪类别表征预设情绪,获取与目标对象相关的视频流信息;以及根据所述视频流信息,进行事件检测。
5.根据第二方面,提供了一种事件检测装置,该装置包括:情绪识别模块,用于根据与目标对象相关的第一文本信息,进行情绪识别,得到第一情绪信息;第一确定模块,用于根据所述第一情绪信息,确定所述目标对象的情绪类别;获取模块,用于响应于确定所述情绪类别表征预设情绪,获取与目标对象相关的视频流信息;以及检测模块,用于根据所述视频流信息,进行事件检测。
6.根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据本公开提供的方法。
7.根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行根据本公开提供的方法。
8.根据第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开提供的方法。
9.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
10.附图用于更好地理解本方案,不构成对本公开的限定。其中:
11.图1是根据本公开的一个实施例的可以应用事件检测方法和装置的示例性系统架构示意图;
12.图2是根据本公开的一个实施例的事件检测方法的流程图;
13.图3是根据本公开的另一个实施例的进行情绪识别的方法的流程图;
14.图4是根据本公开的一个实施例的事件检测方法的流程图;
15.图5是根据本公开的一个实施例的事件检测装置的框图;以及
16.图6是根据本公开的一个实施例的可以应用事件检测方法的电子设备的框图。
具体实施方式
17.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
18.根据一种基于心理健康评估的事件检测方法,可以基于心理健康评估的结果,判断预设事件发生的概率,以进行事件检测。然而,进行心理评估时,被评估的对象的心理状态会受到影响,使得该对象会隐藏真实想法,甚至抵触心理健康评估,导致评估结果出现偏差。此外,对象的心理状态会发生变化。根据之前的心理健康评估结果,可能难以得到较高的事件检测效率。
19.图1是根据本公开一个实施例的可以应用事件检测方法和装置的示例性系统架构示意图。
20.需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
21.如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
22.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
23.服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
24.需要说明的是,本公开实施例所提供的事件检测方法一般可以由服务器105执行。相应地,本公开实施例所提供的事件检测装置一般可以设置于服务器105中。本公开实施例所提供的事件检测方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的事件检测装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
25.图2是根据本公开的一个实施例的事件检测方法的流程图。
26.如图2所示,该方法200可以包括操作s210至操作s240。
27.在操作s210,根据与目标对象相关的第一文本信息,进行情绪识别,得到第一情绪信息。
28.例如,第一文本信息可以是目标对象在搜索引擎中搜索的文本,也可以是目标对
象在社交平台分享的文本。
29.例如,第一情绪信息可以是一个大于等于0且小于等于1的值。在一个示例中,可以从第一文本信息中提取出关键词。将该关键词与多个预设文本进行匹配。每个预设文本对应一个情绪评估值。若该关键词与一个预设文本匹配成功,可以将与该预设文本对应的情绪评估值作为该关键词的第一情绪信息。
30.在操作s220,根据第一情绪信息,确定目标对象的情绪类别。
31.在本公开实施例中,可以根据第一情绪信息和预设情绪阈值,确定目标对象的情绪类别。
32.例如,若第一情绪信息大于预设情绪阈值,可以确定目标对象的情绪类别表征预设情绪。预设情绪可以是异常情绪。在一个示例中,异常情绪可以是抑郁、暴躁、悲伤等情绪。
33.在操作s230,响应于确定情绪类别表征预设情绪,获取与目标对象相关的视频流信息。
34.在本公开实施例中,视频流信息可以是与目标对象相关的直播视频流信息。
35.例如,在确定情绪类别表征预设情绪之后,可以确定常用直播站点中是否有与目标对象相关的直播视频流。若存在直播视频流,可以获取该直播视频流,作为视频流信息。
36.在操作s240,根据视频流信息,进行事件检测。
37.在本公开实施例中,可以根据视频流信息,得到目标对象的第二文本信息。
38.例如,可以根据视频流信息中的多个音频帧,进行语音识别,得到第二文本信息。
39.在本公开实施例中,可以根据视频流信息,确定目标对象的行为信息。
40.例如,可以根据视频流信息中的多个图像帧,进行行为识别,得到行为信息。
41.在本公开实施例中,可以根据第二文本信息和/或行为信息,进行事件检测。
42.例如,以根据第二文本信息和行为信息进行事件检测为示例。可以根据第二文本信息,进行情绪识别,得到第二情绪信息。根据该第二情绪信息和预设情绪阈值,再次确定目标对象的情绪类别是否表征预设情绪。此外,根据行为信息,确定目标对象的行为信息是否表征预设行为。预设行为可以是异常行为。在一个示例中,若再次确定目标对象的情绪类别表征异常情绪且确定目标对象的行为信息表征异常行为,可以确定事件发生。
43.通过本公开实施例,根据较容易获取的第一文本信息,可以便捷地确定目标对象的情绪。在确定目标对象的情绪异常后,可以根据目标对象的视频流信息,进行事件检测,以更加准确地检测事件是否发生。降低了确定事件是否发生的成本,提高了事件检测的准确率。
44.在一些实施例中,与方法200不同之处在于,本实施例中,以根据第二文本信息进行事件检测为示例。
45.例如,根据视频流信息,进行事件检测包括:根据视频流信息,得到第二文本信息;根据第二文本信息,进行情绪识别,得到第二情绪信息;以及根据第二情绪信息,进行事件检测。在一个示例中,可以根据第二情绪信息和预设情绪阈值,确定目标对象的情绪类别。若根据第二情绪信息,仍确定目标对象的情绪类别表征异常情绪,可以将该目标对象确定为重点关注对象,也可以确定目标对象心理处于亚健康状态这一事件发生。
46.在一些实施例中,与方法200不同之处在于,本实施例中,以根据行为信息进行事
件检测为示例。
47.例如,根据视频流信息,进行事件检测包括:根据视频流信息,确定目标对象的行为信息;以及根据行为信息,进行事件检测。在一个示例中,行为信息可以表征一类行为,比如异常行为或正常行为。若确定目标对象的行为信息表征异常行为,可以确定事件发生。
48.在一些实施例中,事件可以是异常事件。例如,事件可以包括:心理处于亚健康状态、自杀事件、自残事件等等。
49.在一些实施例中,在例如方法200的操作s240之后,响应于确定事件发生,发送报警信号。例如,在确定自残事件发生的情况下,可以发送报警信号。
50.在一些实施例中,第一文本信息包括预设时段内的多个搜索文本信息,根据与目标对象相关的第一文本信息,进行情绪识别,得到第一情绪信息包括:根据多个搜索文本信息,得到多个搜索关键词;根据多个搜索关键词,进行情绪识别,得到多个第一情绪信息。
51.例如,搜索文本信息可以是文本信息m_1。文本信息m_1为“不想吃饭怎么办”。
52.例如,对象1在一周内利用多个搜索文本信息进行了搜索。可以利用jointkpe(joint keyphrase extraction,联合关键词提取)模型从多个搜索文本信息中确定搜索关键词。
53.接下来,在一些实施例中,根据第一情绪信息,确定目标对象的情绪类别包括:根据多个第一情绪信息和对应多个搜索文本信息的时间信息,确定目标对象在预设时段内的情绪变化趋势信息;以及根据情绪变化趋势信息,确定目标对象的情绪类别。
54.例如,根据获取每个搜索文本信息的时间信息,可以得到每个情绪类别的时间信息。在一个示例中,对象1在周一使用文本信息m_1进行了搜索,则对应文本信息m_1的时间信息可以为周一。相应地,根据文本信息m_1得到的情绪类别emo_1的时间信息也为周一。采用类似的方式,可以确定每个情绪类别emo_i的时间信息。
55.例如,再根据多个情绪类别的时间信息,确定目标对象在预设时段内的情绪变化趋势信息。在一个示例中,在周一,对象1的情绪类别表征异常情绪的次数为1次。在周三,对象1的情绪类别表征异常情绪的次数为2次。在周日,对象1的情绪类别表征异常情绪的次数为4次。据此,可以得到情绪变化趋势信息为异常情绪增多。在这种情况下,可以确定对象1的情绪类别emo_i表征异常情绪,可以执行例如上文所述的操作s230。根据一个时段内确定的多个情绪类别emo_i,确定最终的情绪类别emo_i,可以更加准确地确定对象的情绪,降低误判的概率。
56.需要说明的是,若根据多个情绪类别emo_i’,得到的情绪变化趋势信息为异常情绪减少。在这种情况下,可以确定对象的情绪类别emo_i’表征正常情绪。
57.在一些实施例中,根据视频流信息,得到第二文本信息包括:根据视频流信息,得到n个音频帧和m个图像帧;针对n个音频帧,对每个音频帧进行特征提取,得到n个音频特征信息;针对m个图像帧,对每个图像帧进行切分,得到m个局部图像;针对m个局部图像,对每个局部图像进行特征提取,得到m个第二图像特征信息;将n个音频特征信息和m个第二图像特征信息进行融合,得到第二融合特征信息;以及根据第二融合特征信息,得到第二文本信息。
58.例如,每个音频帧对应一个图像帧。n为大于或等于1的整数。m为大于或等于1的整数。
59.在本公开实施例中,可以利用文本识别模型处理视频流信息,得到第二文本信息。
60.例如,根据视频流信息,可以获取一定时段内的视频。基于该视频片段,可以得到n个音频帧和m个图像帧。
61.例如,针对n个音频帧,对每个音频帧执行以下操作,以进行特征提取:对每个音频帧进行预加重处理、分帧处理和加窗处理,得到加窗后的音频信息。对加窗后的音频信息进行快速傅里叶变换,得到该音频信息的频谱图和时域图。基于梅尔滤波器和离散余弦变换,对该音频信息的频谱图和时域图进行处理,得到音频特征信息。采用类似的操作,得到n个音频特征信息。
62.例如,每个局部图像对应一个图像帧中的唇部区域。
63.例如,可以通过各种目标检测模型,从图像帧中定位出唇部区域,进行切分,得到包含唇部区域的局部图像。再利用face_landmarks(脸部目标检测)模型,识别出多个唇部的特征点。可以根据多个唇部的特征点,得到唇部轮廓线。可以根据唇部轮廓线和局部图像,得到包含唇部轮廓线的图像。利用resnet(residual network,残差网络)模型对包含轮廓线的图像进行特征提取,得到第二图像特征信息。
64.接下来,以n大于m为示例。可以对m个第二图像特征信息进行插值处理,得到n个第二图像特征信息。将n个音频特征信息和n个第二图像特征信息,进行融合,得到第二融合特征信息。使得每个子时段的音频特征信息均可以与对应每个子时段的第二图像特征信息融合。
65.例如,可以将第二融合特征信息输入bilstm(bidirectional long and short term memory,双向长短时记忆)模型,得到第二文本信息。
66.在一些实施例中,根据视频流信息,确定目标对象的行为信息包括:根据视频流信息,得到k个视频片段;针对k个视频片段,对每个视频片段进行采样,得到k个图像帧集合;针对k个图像帧集合,对每个图像帧集合中的至少一个图像帧进行特征提取,得到k个第一图像特征信息;对k个图像特征信息进行融合,得到第一融合特征信息;以及根据第一融合特征信息,得到行为信息。
67.例如,k为大于或等于1的整数。又例如,每个图像帧集合包括至少一个图像帧。
68.在本公开实施例中,可以利用行为识别模型处理视频流信息,确定目标对象的行为信息。行为识别模型包括resnext模型和softmax层。
69.例如,根据视频流信息,可以获取一定时段内的视频。比如,获取5分钟内的视频。可以将该5分钟的视频切分为5个视频片段。每个视频片段的时长为1分钟。即,本实施例中,k=5。
70.例如,可以从每个视频片段中抽取一个或多个图像帧,以得到一个图像帧集合。本实施例,以每个图像帧集合中包括一个图像帧为示例。接下来,对每个图像帧集合中包含的一个图像帧,利用resnext模型进行特征提取,得到每个第一图像特征信息。本实施例中,共可以得到5个第一图像特征信息。在一个示例中,第一图像特征信息可以是一个多维的特征向量。第一图像特征信息中的每个维度的数据表征一个行为类别。
71.例如,可以根据多个第一图像特征信息,进行融合,得到第一融合特征信息。在一个示例中,可以根据5个第一图像特征信息中的每个维度的数据的平均数,得到第一融合特征信息中的每个维度的数据。比如,5个第一图像特征信息中表征行为类别1的数据分别为:
0.60、0.40、0.70、0.30、0.70,则第一融合特征信息中表征行为类别1的数据为0.54。
72.例如,可以利用一个softmax层处理第一融合特征信息,得到行为信息。
73.需要说明的是,可以利用多个具有异常行为标签的视频数据,对上文所述的行为识别模型进行训练,以获取能够识别出异常行为的行为识别模型。在一个示例中,异常行为标签包括“自杀”、“自残”等。
74.图3是根据本公开的一个实施例的进行情绪识别的方法的流程图。
75.如图3所示,该方法300可以根据文本信息进行情绪识别,下面将结合操作s301至操作s309进行详细说明。
76.在操作s301,获取文本信息。
77.例如,本实施例中,文本信息可以是上文所述的第一文本信息,也可以是上文所述的第二文本信息。
78.在操作s302,确定文本信息中字符数量是否小于或等于第一预设阈值。
79.在本公开实施例中,响应于确定文本信息中字符数量小于或等于第一预设阈值,执行操作s303。
80.在本公开实施例中,响应于确定文本信息中字符数量大于第一预设阈值,执行操作s308。
81.例如,第一预设阈值可以是20个字符。
82.接下来,以文本信息中字符数量小于第一预设阈值为示例,结合操作s303至操作s307进行详细说明。
83.在操作s303,将文本信息与多个预设文本进行匹配。
84.例如,可以将文本信息与预设词典中的多个预设文本进行匹配。每个预设文本对应一个情绪评估值。在一个示例中,预设文本1可以为“不吃饭”,该预设文本1对应的情绪评估值为“0.6”。预设文本2可以为“自杀”,该预设文本2对应的情绪评估值为“1”。
85.在操作s304,确定文本信息是否与预设文本匹配成功?
86.在本公开实施例中,响应于确定文本信息与预设文本匹配成功,执行操作s305。
87.在本公开实施例中,响应于确定文本信息与预设文本匹配不成功,执行操作s309。在操作s309,结束流程。
88.例如,可以基于模糊匹配技术,确定文本信息是否与多个预设文本中的一个预设文本匹配成功。在一个示例中,以文本信息m_1是“不想吃饭怎么办”为示例,基于模糊匹配技术,可以确定该文本信息m_1与预设文本“不吃饭”匹配成功。
89.在操作s305,根据与文本信息匹配的预设文本,得到文本信息的第一情绪评估值。
90.例如,如上文所述,文本信息m_1与预设文本“不吃饭”匹配成功。预设文本“不吃饭”对应的情绪评估值为0.6。可以将该情绪评估值作为文本信息m_1的第一情绪评估值。
91.在操作s306,对文本信息进行卷积处理,得到文本信息的第二情绪评估值。
92.例如,利用textcnn模型对文本信息m_1进行卷积处理。textcnn模型是一种cnn(convolutional neural network,卷积神经网络)模型。在一个示例中,该textcnn模型可以根据一个文本信息,输出该文本信息对应的消极概率,作为文本信息的第二情绪评估值。比如,文本信息m_1的第二情绪评估值可以为0.3。
93.在操作s307,根据第一情绪评估值和第二情绪评估值,得到情绪信息。
94.例如,可以将第一情绪评估值和第二情绪评估值相加,再进行归一化操作,得到情绪信息。例如,如上文所述,文本信息m_1的第一情绪评估值为0.6,文本信息m_1的第二情绪评估值为0.3。二者之和为0.9。可以根据各种方式进行归一化,在一个示例中,可以计算二者的平均数,进行归一化,得到情绪信息为0.45。
95.接下来,以文本信息中字符数量大于第一预设阈值为示例,结合操作s308进行详细说明。
96.在操作s308,将文本信息输入情绪分析模型,得到情绪信息。
97.例如,文本信息m_2的字符数量为40个。文本信息m_2的字符数量大于第一预设阈值。
98.例如,情绪分析模型可以经训练的深度学习模型,例如bert(bidirectional encoder representation from transformer,双向编码表示的transformer)模型或n_reader(面向中文多文档任务的片段抽取型机器阅读理解)模型。
99.例如,情绪分析模型可以确定目标对象的情绪为消极的概率。
100.通过本公开实施例,可以根据文本信息的字符数量,采用不同的方式确定对象的情绪信息,使得情绪信息可以准确地表征对象的情绪类别。例如,对于字符数量较少的短文本,采用预设词典和textcnn模型确定对象的情绪信息,可以更加准确地确定情绪信息。
101.在一个示例中,文本信息m_3为“不吃饭已经10天了”。基于上文所述的心理健康评估方式,与文本信息m_1相关的对象1的情绪可能为中性,而与文本信息m_3相关的对象2的情绪很消极。如上文所述,文本信息m_3也可以与预设文本“不吃饭”匹配成功。文本信息m_3的第一情绪评估值也为0.6。接下来,将文本信息m_3输入上文所述的textcnn模型后,得到的文本信息m_3的第二情绪评估值例如为0.8。如上文所述,可以得到对象2的情绪信息为0.7,明显不同于文本信息m_1的情绪信息。基于预设词典和textcnn模型,可以更加准确地区分不同的情绪类别。
102.在一些实施例中,情绪分析模型包括第一情绪分析子模型。响应于确定文本信息中字符数量大于第一预设阈值,将文本信息输入情绪分析模型,得到情绪信息包括:响应于确定文本信息中字符数量小于或等于第二预设阈值,将文本信息输入第一情绪分析子模型,得到情绪信息。
103.例如,第二预设阈值可以是50个字符。又例如,第一情绪分析子模型可以是bert模型。
104.在一些实施例中,情绪分析模型包括第二情绪分析子模型。响应于确定文本信息中字符数量大于第一预设阈值,将文本信息输入情绪分析模型,得到情绪信息包括:响应于确定文本信息中字符数量大于第二预设阈值,将文本信息输入第二情绪分析子模型,得到情绪信息。
105.例如,第二情绪分析子模型可以是上文所述的n-reader模型。大于第二预设阈值的文本信息可以来自于用户在社交平台上分享的长篇文档。从长篇文档中,可以确定是否存在具有与异常事件相关的句子或者关键文本片段。n-reader模型是一个端到端机器阅读理解模型。该模型的主要特点是采用双层self-attention(自注意力)机制进行文本编码。通过双层self-attention机制,不仅可以获取单篇文档中的关键信息,还可以利用多篇文档中的相似性信息进行编码,得到更加准确的情绪信息。
106.例如,可以利用多个带有情绪标签的长篇文档作为训练样本,训练n-reader模型。使得根据经训练的n-reader模型输出的情绪信息可以更准确地表达对象的真实情绪。
107.图4是根据本公开的另一个实施例的事件检测方法的流程图。
108.如图4所示,该方法400可以包括操作s410至操作s420、操作s431至操作s432、操作s441至操作s446、操作s450至操作s460。
109.在操作s410,根据与目标对象相关的第一文本信息,进行情绪识别,得到第一情绪信息。
110.例如,第一文本信息为上文所述的文本信息m_3。如上文所述,与文本信息m_3相关的对象2的情绪信息为0.7。本实施例中,将该情绪信息作为第一情绪信息。
111.在操作s420,根据第一情绪信息,确定目标对象的第一情绪类别。
112.例如,将第一情绪信息与预设情绪阈值(例如0.5)比较,可以确定第一情绪类别。
113.在操作s431,确定第一情绪类别是否表征异常情绪?
114.在本公开实施例中,响应于确定第一情绪类别表征异常情绪,执行操作s432。
115.在本公开实施例中,响应于确定第一情绪类别表征正常情绪,执行操作s460。在操作s460,结束流程。
116.例如,对象2的第一情绪信息大于预设情绪阈值,可以确定第一情绪类别表征异常情绪。在这种情况下,可以执行操作s432。
117.在操作s432,获取与目标对象相关的视频流信息。
118.例如,可以获取与对象2相关的直播账号信息,以获取与对象2相关的视频流信息。
119.在操作s441,根据视频流信息,得到第二文本信息。
120.例如,可以利用上文的文本识别模型处理视频流信息,得到第二文本信息。在一个示例中,从视频流信息得到的第二文本信息为文本信息m_4。文本信息m_4是“我今天很难过”。
121.在操作s442,根据第二文本信息,进行情绪识别,得到第二情绪信息。
122.例如,根据文本信息m_4,得到的对象2的第二情绪信息为0.6。
123.在操作s443,根据第二情绪信息,确定目标对象的第二情绪类别。
124.例如,将第二情绪信息与预设情绪阈值(例如0.5)比较,可以确定第二情绪类别。
125.在操作s444,确定第二情绪类别是否表征异常情绪?
126.在本公开实施例中,响应于确定第二情绪类别表征异常情绪,执行操作s445。
127.在本公开实施例中,响应于确定第二情绪类别表征正常情绪,执行操作s460。
128.例如,对象2的第二情绪信息(例如0.6)大于预设情绪阈值(例如0.5),可以确定第二情绪类别表征异常情绪。在这种情况下,可以执行操作s445。在一个示例中,响应于确定第二情绪类别表征异常情绪,可以将目标对象确定为重点关注对象,持续地根据与该重点关注对象相关的视频流进行事件检测。
129.在操作s445,根据视频流信息,确定目标对象的行为信息。
130.例如,可以利用上文所述行为识别模型,根据视频流信息,确定目标对象的行为信息。
131.在操作s446,确定行为信息是否表征异常行为?
132.在本公开实施例中,响应于确定行为信息表征异常行为,执行操作s450。
133.在本公开实施例中,响应于确定行为信息表征正常行为,执行操作s460。
134.例如,利用上文所述的resnext模型处理视频流信息,得到的对象2的行为信息为“自杀”。在这种情况下,可以执行操作s450。
135.在操作s450,发送异常事件发生的报警信号。
136.例如,可以向与对象2相关的其他对象发送报警信号,以便其他对象及时阻止对象2继续实施异常行为。
137.图5是根据本公开的一个实施例的事件检测装置的框图。
138.如图5所示,该装置500可以包括情绪识别模块510、第一确定模块520、获取模块530和检测模块540。
139.情绪识别模块510,用于根据与目标对象相关的第一文本信息,进行情绪识别,得到第一情绪信息。
140.第一确定模块520,用于根据所述第一情绪信息,确定所述目标对象的情绪类别.
141.获取模块530,用于响应于确定所述情绪类别表征预设情绪,获取与目标对象相关的视频流信息。
142.检测模块540,用于根据所述视频流信息,进行事件检测。
143.在一些实施例中,所述检测模块包括:第一获得子模块,用于根据所述视频流信息,得到第二文本信息;第一情绪识别子模块,用于根据所述第二文本信息,进行情绪识别,得到第二情绪信息;以及第一检测子模块,用于根据所述第二情绪信息,进行事件检测。
144.在一些实施例中,所述情绪识别模块通过以下子模块执行相关操作进行情绪识别:匹配子模块,用于响应于确定文本信息中字符数量小于或等于第一预设阈值,将所述文本信息与多个预设文本进行匹配,其中,每个预设文本对应一个情绪评估值;第二获得子模块,用于响应于匹配成功,根据与所述文本信息匹配的预设文本,得到所述文本信息的第一情绪评估值;卷积子模块,用于对所述文本信息进行卷积处理,得到所述文本信息的第二情绪评估值;以及第三获得子模块,用于根据所述第一情绪评估值和所述第二情绪评估值,得到情绪信息。
145.在一些实施例中,所述情绪识别模块通过以下子模块执行相关操作进行情绪识别:第四获得子模块,用于响应于确定文本信息中字符数量大于第一预设阈值,将所述文本信息输入情绪分析模型,得到情绪信息。
146.在一些实施例中,所述情绪分析模型包括第一情绪分析子模型和第二情绪分析子模型,所述第四获得子模块包括:第一获得单元,用于响应于确定所述文本信息中字符数量小于或等于第二预设阈值,将所述文本信息输入所述第一情绪分析子模型,得到情绪信息;或者,第二获得单元,用于响应于确定所述文本信息中字符数量大于第二预设阈值,将所述文本信息输入所述第二情绪分析子模型,得到情绪信息。
147.在一些实施例中,所述检测模块包括:第一确定子模块,用于根据所述视频流信息,确定所述目标对象的行为信息;以及第二检测子模块,用于根据所述行为信息,进行事件检测。
148.在一些实施例中,所述第一确定子模块包括:第三获得单元,用于根据所述视频流信息,得到k个视频片段,其中,k为大于或等于1的整数;采样单元,用于针对所述k个视频片段,对每个视频片段进行采样,得到k个图像帧集合,其中,每个图像帧集合包括至少一个图
像帧;第一特征提取单元,用于针对所述k个图像帧集合,对每个图像帧集合中的至少一个图像帧进行特征提取,得到k个第一图像特征信息;第一融合单元,用于对所述k个图像特征信息进行融合,得到第一融合特征信息;以及确定单元,用于根据所述第一融合特征信息,确定所述行为信息。
149.在一些实施例中,所述第一获得子模块包括:第五获得单元,用于根据所述视频流信息,得到n个音频帧和m个图像帧,其中,每个音频帧对应一个图像帧,n为大于或等于1的整数,m为大于或等于1的整数;第二特征提取单元,用于针对所述n个音频帧,对每个音频帧进行特征提取,得到n个音频特征信息;切分单元,用于针对所述m个图像帧,对每个图像帧进行切分,得到m个局部图像,其中,每个局部图像对应一个图像帧中的唇部区域;第三特征提取单元,用于针对所述m个局部图像,对每个局部图像进行特征提取,得到m个第二图像特征信息;第二融合单元,用于将所述n个音频特征信息和所述m个第二图像特征信息进行融合,得到第二融合特征信息;以及第六获得单元,用于根据所述第二融合特征信息,得到所述第二文本信息。
150.在一些实施例中,所述第一文本信息包括预设时段内的多个搜索文本信息,所述情绪识别模块包括:第六获得子模块,用于根据多个所述搜索文本信息,得到多个搜索关键词;第二情绪识别子模块,用于根据所述多个搜索关键词,进行情绪识别,得到多个第一情绪信息;所述确定模块包括:第二确定子模块,用于根据所述多个第一情绪信息和对应所述多个搜索文本信息的时间信息,确定所述目标对象在所述预设时段内的情绪变化趋势信息;以及第三确定子模块,用于根据所述情绪变化趋势信息,确定所述目标对象的情绪类别。
151.本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
152.在本公开的技术方案中,在获取或采集用户个人信息之前,均获取了用户的授权或同意。
153.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
154.图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
155.如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(rom)602中的计算机程序或者从存储单元608加载到随机访问存储器(ram)603中的计算机程序,来执行各种适当的动作和处理。在ram 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、rom 602以及ram 603通过总线604彼此相连。输入/输出(j/o)接口605也连接至总线604。
156.设备600中的多个部件连接至i/o接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通
信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
157.计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如事件检测方法。例如,在一些实施例中,事件检测方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由rom 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到ram 603并由计算单元601执行时,可以执行上文描述的事件检测方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行事件检测方法。
158.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
159.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
160.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
161.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
162.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
163.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
164.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
165.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献