一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

即时通信数据的处理方法及装置、计算机可读存储介质与流程

2022-07-02 09:08:50 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,更具体地,其涉及一种即时通信数据的处理方法及装置、计算机可读存储介质。


背景技术:

2.随着互联网的发展,微信、钉钉等即时通信工具成为人们日常工作生活中进行信息传递的重要渠道,无线对讲设备与语音电话也同样在信息传递中发挥着重要的作用。在信息传递的同时,伴随生成了无数的信息,其中夹杂着有用与无用的信息,若不对即时通信工具中的信息加以整理、保存,将导致重要信息遗漏,进而影响到工作的正常进行。
3.现有技术在对信息传递中产生的信息进行处理时,通常是使用即时通信工具中自带的聊天记录功能进行数据的保存。
4.但是,现有技术在保存信息传递过程中产生的数据时,仅仅是直接保存聊天记录,并没有对其中的数据加以整理。人们在需要查找重要信息时,只能凭借记忆翻找聊天记录,查询效率低下。


技术实现要素:

5.本发明解决的技术问题是如何对信息传递中产生的即时通信数据进行整理,确定即时通信数据之间的关联关系,以便于即时通信数据的筛查与调用。
6.为解决上述技术问题,本发明实施例提供一种即时通信数据的处理方法,所述即时通信数据的处理方法包括:获取所述即时通信数据并转换为待处理文本;根据业务字典解析所述待处理文本,得到所述待处理文本的标准分词集合,其中,所述业务字典存储有至少一个维度下,至少一个标准分词、至少一个原始分词以及所述标准分词和所述原始分词的关联关系,所述原始分词为提取自所述待处理文本的分词结果;查找所述业务字典,确定所述标准分词集合中各个标准分词关联的标签,所述业务字典还存储有至少一个标签以及所述标准分词和标签的关联关系;存储所述待处理文本、所述标准分词集合及其关联的标签之间的关联关系。
7.可选地,所述获取所述即时通信数据包括:从第一数据库中获取所述即时通信数据,其中,所述第一数据库存储数据捕捉机器人从至少一个信息传播系统捕捉得到的即时通信数据。
8.可选地,所述数据捕捉机器人部署于各个信息传播系统所属的服务器,或者,所述数据捕捉机器人与各个信息传播系统所属的服务器的接口连接。
9.可选地,所述根据业务字典解析所述待处理文本,得到所述待处理文本的标准分词集合包括:根据所述业务字典对所述待处理文本进行文本分词,得到原始分词集合;查找所述业务字典,将所述原始分词集合包括的各个原始分词校准为对应的标准分词,得到所述标准分词集合。
10.可选地,针对不同类型的即时通信数据采用不同的转换操作,以得到所述待处理
文本。
11.可选地,所述即时通信数据包括视频数据,所述获取所述即时通信数据并转换为待处理文本包括:接收所述视频数据;从所述视频数据中提取得到至少一个关键帧,所述关键帧是所述视频数据中与前一图像帧的图像差异比例大于预设比例的图像帧,所述图像差异比例用于表示相邻图像帧的图像差异程度;对于每一关键帧的图像数据,对所述图像数据进行图像识别以得到所述待处理文本。
12.可选地,所述即时通信数据包括图像数据,所述获取所述即时通信数据并转换为待处理文本包括:接收所述图像数据;对所述图像数据进行图像识别以得到所述待处理文本。
13.可选地,所述对所述图像数据进行图像识别以得到所述待处理文本包括:对所述图像数据进行图像分割,以得到表征至少一个维度的关键目标;对每一图像数据,基于图像识别将所述图像数据中的每一关键目标转换为描述文本,汇总所述图像数据中所有关键目标的描述文本得到所述待处理文本。
14.可选地,所述即时通信数据包括地理位置数据,所述获取所述即时通信数据并转换为待处理文本包括:获取所述地理位置数据对应的经纬度信息;将预设地图上所述经纬度信息对应的位置信息确定为所述待处理文本。
15.可选地,所述获取所述地理位置数据对应的经纬度信息包括:根据所述地理位置数据的生成时间、所述地理位置数据的生成端的预设行进路线以及根据所述生成端历史上报的历史地理位置数据确定的历史经纬度信息,确定所述地理位置数据对应的经纬度信息。
16.可选地,所述即时通信数据包括语音数据,所述获取所述即时通信数据并转换为待处理文本包括:接收所述语音数据;对所述语音数据进行语音识别以得到所述待处理文本。
17.可选地,所述业务字典存储的内容的维度包括:人物、地点、时间、事件。
18.可选地,所述存储所述待处理文本、所述标准分词集合及其关联的标签之间的关联关系包括:将所述关联关系存储至第二数据库,其中,所述第二数据库包括关系型数据库。
19.本发明实施例还公开一种即时通信数据的处理装置,所述即时通信数据的处理装置包括:即时通信数据获取模块,用于获取所述即时通信数据并转换为待处理文本;标准分词集合获取模块,用于根据业务字典解析所述待处理文本,得到所述待处理文本的标准分词集合,其中,所述业务字典存储有至少一个维度下,至少一个标准分词、至少一个原始分词以及所述标准分词和所述原始分词的关联关系,所述原始分词为提取自所述待处理文本的分词结果;标签确认模块,查找所述业务字典,确定所述标准分词集合中各个标准分词关联的标签,所述业务字典还存储有至少一个标签以及所述标准分词和标签的关联关系;存储模块,用于存储所述待处理文本、所述标准分词集合及其关联的标签之间的关联关系。
20.本发明实施例还公开另一种即时通信数据的处理装置,包括存储器和处理器,所述存储器上存储有可在处理器上运行的计算机程序,所述计算机程序被处理器运行时执行上述任一种所述即时通信数据的处理方法的步骤。
21.本发明实施例还公开一种计算机可读存储介质,其上存储有计算机程序,所述计
算机程序被处理器运行时执行上述任一种所述即时通信数据的处理方法的步骤。
22.与现有技术相比,本发明实施例的技术方案具有以下有益效果:
23.本发明提出一种即时通信数据的处理方法,通过将即时通信数据转换为待处理文本,并使用业务字典解析待处理文本,将待处理文本中的原始分词转换为标准分词,以形成标准分词集合;通过形成标准分词集合,可以在用户的语言习惯不同的情况下对各个原始分词进行归一化处理,以便于即时通信数据的处理;并根据业务字典确定标准分词集合中各个标准分词关联的标签,以形成原始分词、标准分词及其标签的关联关系,并将此关联关系进行存储,在实际应用中即可根据关联关系对即时通信数据中的重要数据进行快速定位,并确定有关的即时通信数据作为辅助数据,极大地提升信息的筛选与查找效率。
24.进一步地,将视频数据、图像数据、地理位置数据以及语音数据转换为待处理文本,以统一待处理数据的格式,避免即时通信数据格式不同带来的数据处理问题,便于对即时通信数据进行后续处理。
25.进一步地,在确定地理位置数据对应的位置信息时,根据该地理位置数据的生成时间、地理位置数据的生成端的预设行进路线以及根据生成端历史上报的历史地理位置数据确定的历史经纬度信息确定地理位置数据对应的经纬度信息,通过结合时间、预设行进路线和历史经过的位置信息,对生成端目前所在位置进行精准定位。
附图说明
26.图1是本发明实施例提供的一种即时通信数据的处理方法的整体流程图;
27.图2是本发明实施例提供的一种业务字典的示意图;
28.图3是本发明实施例提供的一种在即时通信软件系统中进行即时通信数据处理的具体流程图;
29.图4是本发明实施例提供的一种在对讲机构建的信息传播系统中进行即时通信数据处理的具体流程图;
30.图5是本发明实施例提供的一种即时通信数据的处理装置的结构示意图。
具体实施方式
31.如背景技术中所述,即时通信工具成为人们日常工作生活中进行信息传递的重要渠道,在信息传递的同时,伴随生成了无数的信息,若不对即时通信工具中的信息加以整理、保存,将导致重要信息遗漏,进而影响到工作的正常进行。现有技术在对信息传递中产生的信息进行处理时,通常是使用即时通信工具中自带的聊天记录功能进行数据的保存,并没有对其中的数据加以整理。人们在需要查找重要信息时,只能凭借记忆翻找聊天记录,查询效率低下。
32.本发明实施例中,通过将即时通信数据转换为待处理文本,并使用业务字典解析待处理文本,将待处理文本中的原始分词转换为标准分词,以形成标准分词集合;通过形成标准分词集合,可以在用户的语言习惯不同的情况下对各个原始分词进行归一化处理,以便于即时通信数据的处理;并根据业务字典确定标准分词集合中各个标准分词关联的标签,以形成原始分词、标准分词及其标签的关联关系,并将此关联关系进行存储,在实际应用中即可根据关联关系对即时通信数据中的重要数据进行快速定位,并确定有关的即时通
信数据作为辅助数据,极大地提升信息的筛选与查找效率。
33.进一步地,将视频数据、图像数据、地理位置数据以及语音数据转换为待处理文本,以统一待处理数据的格式,避免即时通信数据格式不同带来的数据处理问题,便于对即时通信数据进行后续处理。
34.进一步地,在确定地理位置数据对应的位置信息时,根据该地理位置数据的生成时间、地理位置数据的生成端的预设行进路线以及根据生成端历史上报的历史地理位置数据确定的历史经纬度信息确定地理位置数据对应的经纬度信息,通过结合时间、预设行进路线和历史经过的位置信息,对生成端目前所在位置进行精准定位。
35.为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
36.图1是本发明实施例提供的一种即时通信数据的处理方法的整体流程图。
37.在具体实施中,下述步骤101至步骤104所记载的即时通信数据的处理方法可以用于即时通信数据的处理装置中。上述步骤具体可以由即时通信数据的处理装置来执行,也可以由即时通信数据的处理装置中具有数据处理功能的芯片所执行,也可以由即时通信数据的处理装置中包含有数据处理功能的芯片的芯片模组来执行。在一个具体的实施例中,可以由服务器执行即时通信数据的处理方法的各个步骤。
38.具体地,如图1所示,即时通信数据的处理方法可以包括以下步骤:
39.在步骤101中,获取所述即时通信数据并转换为待处理文本;
40.在步骤102中,根据业务字典解析所述待处理文本,得到所述待处理文本的标准分词集合;
41.在步骤103中,查找所述业务字典,确定所述标准分词集合中各个标准分词关联的标签;
42.在步骤104中,存储所述待处理文本、所述标准分词集合及其关联的标签之间的关联关系。
43.至此,即时通信数据已处理完毕,可根据待处理文本、标准分词集合及其关联的标签之间的关联关系进行数据查询。
44.在一个非限制性的实施例中,第一数据库用于存储数据捕捉机器人捕捉得到的即时通信数据,可以从第一数据库中获取即时通信数据。具体地,所述第一数据库可以存储于服务器本地;或者,所述第一数据库也可以为外设数据库并与所述服务器相通信。
45.进一步地,即时通信数据也可存储于服务器、移动存储装置或者其他可实现的存储设备中,本技术对此不作限制。
46.在一个非限制性的实施例中,信息传播系统可以是即时通信软件系统,或者是由硬件设备构建的信息传播系统。例如,由对讲机以及视频会议设备等硬件设备构建的信息传播系统。
47.在一个非限制性的实施例中,数据捕捉机器人从至少一个信息传播系统捕捉即时通信数据。
48.在一种具体实施方式中,数据捕捉机器人可以是运行于信息捕捉设备中的信息捕
捉程序,信息捕捉设备嵌入在各信息传输系统中。由此,可以将数据捕捉机器人部署至各信息传播系统以实现即时通信数据的抓取。例如,数据捕捉机器人可以部署于各个信息传播系统所属的服务器中。信息捕捉设备可以例如是网络服务器、集群通信数字网关或者网络通话网关等硬件设备。
49.在另一种具体实施方式中,数据捕捉机器人可以为独立于信息传播系统与信息捕捉设备的硬件设备,数据捕捉机器人与信息捕捉设备串行连接。具体地,信息捕捉设备与各个信息传播系统所属的服务器的接口连接,以捕获信息传播系统中的即时通信数据。进一步,数据捕捉机器人通过与信息捕捉设备的串行接口捕捉信息捕捉设备捕获的即时通信数据。信息捕捉设备可以是网络服务器、集群通信数字网关或者网络通话网关。
50.在步骤101的具体实施中,即时通信数据包括多种类型,针对不同类型的即时通信数据可以采用不同的转换操作,以将即时通信数据转换为待处理文本。具体地,即时通信数据包括待处理文本、视频数据、图像数据、地理位置数据以及语音数据,对待处理文本以外的即时通信数据进行转换。
51.在一个非限制性的实施例中,即时通信数据可以指即时通信过程中产生的数据。即时通信可以包括基于即时通信(instant messaging)软件实现的通信,具体可以是一种基于互联网的即时交流消息的业务,可以让多个用户使用网络实时地传递文字消息、图片数据、语音数据以及视频文件。即时通信还可以包括基于实时通信设备实现的通信,具体可以是一种借助于实时通话媒介实现的即时交流方式,如通过对讲机、电话等物理硬件实现的即时通讯。
52.在一个具体实施中,当接收到的即时通信数据为视频数据时,将视频数据中的每一图像帧与其前一图像帧进行差异比对,以确定与前一帧差异较大的关键帧。关键帧与其前一图像帧的差异比例大于预设比例,图像差异比例用于表示相邻图像帧的图像差异程度。例如,对当前图像帧以及前一图像帧进行差异比对,得到当前图像帧与前一图像帧的差异比例为50%。此时,差异程度的预设比例为40%,当前图像帧与前一图像帧的差异比例大于预设比例,将当前图像帧作为关键帧。
53.在一个非限制性的实施例中,视频数据可以从即时通信系统所属的服务器中获取,或者,可以从公共摄像头所属的服务器中获取。具体地,信息捕捉设备可以从公共摄像头用于存储视频数据的服务器中获取公共摄像头拍摄到的视频数据。例如,公共摄像头可以包括设置于工厂、商场等公共场所的监控设备,从公共摄像头获取的视频数据为不涉及个人隐私信息的视频数据。
54.需要说明的是,可以采用感知哈希算法、汉明距离比对算法或者图像直方图比对算法进行图像帧的差异比对,或者其他任一可实现的图像差异比对方法进行图像帧的差异比对,图像差异比对方法可根据实际应用场景进行选择,本技术对此不作限制。
55.进一步地,提取出视频数据中的所有关键帧后,对每一关键帧的图像数据进行图像分割,以得到图像数据中至少一个维度的关键目标。对图像数据中的每一关键目标进行图像识别,以将各个关键目标转换为描述文本,并汇总图像数据中所有关键目标的描述文本得到待处理文本。具体地,关键目标可以包括人物、车辆、道路以及建筑等维度。例如,当前图像帧中包括a路的路牌以及b大厦及其标牌,对当前图像帧进行图像分割,得到的关键目标为a路的路牌、b大厦及其标牌。对当前图像帧中的关键目标进行图像识别,可以得到的
描述文本为a路和b大厦,汇总图像数据中所有关键目标的描述文本,得到待处理文本a路和b大厦。
56.需要说明的是,可采用基于卷积神经网络的图像识别算法,或者其他任一可实现的图像识别算法对图像数据进行图像识别,图像识别算法可根据实际应用场景进行选择,本技术对此不作限制。
57.在一个具体实施中,当接收到的即时通信数据为图像数据时,对图像数据进行分割,以得到图像数据中至少一个维度的关键目标。对图像数据中的每一关键目标进行图像识别,以将各个关键目标转换为描述文本,并汇总图像数据中所有关键目标的描述文本得到待处理文本。图像数据的具体处理步骤可参考前述关键帧的图像数据的处理步骤,此处不再赘述。
58.在一个具体实施中,当接收到的即时通信数据为地理位置数据时,获取地理位置对应的经纬度信息,并根据经纬度信息在预设地图上确定该经纬度信息对应的位置信息,以将位置信息确定为待处理文本,预设地图为预先存储于数据库中的地图。例如,根据地理位置数据对应的经纬度信息a,在预设地图上确定经纬度信息a对应的位置信息为b大厦,将b大厦确定为待处理文本。
59.在另一个具体实施中,当接收到的即时通信数据为地理位置数据时,可以根据地理位置数据的生成时间、地理位置数据的生成端的预设行进路线以及根据生成端历史上报的历史地理位置数据确定的历史经纬度信息,以确定地理位置数据对应的经纬度信息。具体地,地理位置数据的生成端具有预设行进路线,预设行进路线对应的经纬度信息预先存储于数据库中,预设行进路线可以是巡逻路线。根据生成端历史上报的历史地理位置数据确定的历史经纬度信息,可以确定生成端于行进路线中已经过的路段以及经过各个位置的时间,并结合地理位置数据的生成时间,确定当前地理位置数据在行进路线中对应的经纬度信息。根据经纬度信息在预设地图上确定该经纬度信息对应的位置信息,以将位置信息确定为待处理文本。
60.进一步地,通过结合时间、预设行进路线和历史经过的位置信息,对生成端目前所在位置进行精准定位,可以提高位置信息的精度。
61.在一个具体实施中,当接收到的即时通信数据为语音数据时,对语音数据进行语音识别,将语音数据转换为待处理文本。
62.需要说明的是,可采用基于卷积神经网络的语音识别算法,或者其他任一可实现的语音识别算法对图像数据进行语音识别,语音识别算法可根据实际应用场景进行选择,本技术对此不作限制。
63.在步骤102的具体实施中,对前述得到的待处理文本进行文本分词,得到原始分词集合。并查找业务字典,将原始分词集合包括的各个原始分词校准为对应的标准分词,得到标准分词集合。
64.在一个非限制性的实施例中,业务字典存储有至少一个维度下,至少一个标准分词、至少一个原始分词以及标准分词和原始分词的关联关系,原始分词为提取自待处理文本的分词结果。具体地,业务字典存储的内容的维度包括人物、地点、时间以及事件,地点可以包括位置信息以及位置补充信息,事件可以包括业务以及状态。
65.图2是本发明实施例提供的一种业务字典的示意图。现结合图2对标准分词集合的
生成步骤进行说明。
66.在一个具体实施例中,业务字典中的内容可根据不同的应用场景进行设置。具体地,在a区域的综合治理场景中,业务字典所涉及的地名与街道名均与a区域相关,业务字典所涉及的事件维度中的内容均与综合治理相关。例如,综合治理场景中的业务可以包括乱扔垃圾和噪音扰民。当应用场景为在b区域的城市管理场景中,业务字典所涉及的地名与街道名均与b区域相关,业务字典所涉及的事件维度中的内容均与城市管理相关。例如,城市管理场景中的业务可以包括流动摊贩和跨门经营。
67.需要说明的是,业务字典中的内容可根据实际应用场景进行适应性的调整,本技术不作限制。
68.在一个具体实施例中,巡逻人员在信息传播系统中发送语音消息“a公园门口目前正常”。获取语音数据,并将语音数据转换为待处理文本,得到待处理文本为“a公园门口目前正常”。对待处理文本进行文本分词,得到原始分词集合,原始分词集合包括原始分词“a公园”、“门口”、“目前正常”。根据业务字典将原始分词集合包括的各个原始分词校准为对应的标准分词,得到位置信息维度的标准分词“a公园路”、位置补充信息维度的标准分词“门口”以及状态维度的标准分词“目前正常”,并汇总形成标准分词集合。
69.进一步地,通过对待处理文本中的原始分词进行校准,可以在用户的语言习惯不同的情况下对各个原始分词进行标准化处理,或者对原始分词中的错别字进行纠正,使多个原始分词对应于一个标准分词,便于标准分词与标签的关联关系的查找。
70.在步骤103的具体实施中,查找业务字典,并确定标准分词集合中各个标准分词关联的标签。具体地,业务字典还存储有至少一个标签以及标准分词与标签的关联关系。
71.现结合步骤102中的具体实施例对标签的确定进行说明。
72.在一个具体实施例中,标准分词集合中包括位置信息维度的标准分词“a公园路”、位置补充信息维度的标准分词“门口”以及状态维度的标准分词“目前正常”,查找业务字典,以确定各个标准分词关联的标签。具体地,标准分词可以有关联的标签,此时标签的查找结果为标准分词对应的标签;标准分词也可以没有关联的标签,此时标签的查找结果为空值。确定标准分词“a公园路”对应的标签为map000013甲路北段,标准分词“门口”与标准分词“目前正常”对应的标签为空值。
73.在一个具体实施中,还可以将即时通信数据的发送日期作为一个时间维度的标准分词加入至标准分词集合中,可通过即时通信数据的发送日期确定发送日期当日涉及到的即时通信数据。
74.在一个具体实施中,还可以将即时通信数据发送端的标识(identity document,id)作为一个人物维度的标准分词加入至标准分词集合中,一个标识对应于一个信息传播系统的使用者,可通过即时通信数据发送端的标识查找该标识发送过的消息。
75.进一步地,可以对预设时间内同一即时通信数据发送端发送的消息进行去重处理,在多条重复的即时通信数据中仅保留发送时间最早或最晚的即时通信数据,以降低数据库的存储压力,提高数据的处理效率。
76.在步骤104的具体实施中,将待处理文本、标准分词集合及其关联的标签之间的关联关系存储至第二数据库。
77.在一个具体实施中,第二数据库包括关系型数据库。具体地,所述第二数据库可以
存储于服务器本地;或者,所述第二数据库也可以为外设数据库并与所述服务器相通信。
78.现结合步骤104中的具体实施例对关联关系的存储进行说明。
79.在一个具体实施例中,待处理文本“a公园门口目前正常”对应于位置信息维度的标准分词“a公园路”、位置补充信息维度的标准分词“门口”以及状态维度的标准分词“目前正常”;标准分词“a公园路”对应的标签为map000013甲路北段,标准分词“20220101”对应的标签为当日日期20220101,标准分词“id001”对应的标签为“id001”,标准分词“门口”与标准分词“目前正常”对应的标签为空值,将此关联关系存储至第二数据库。
80.需要说明的是,关联关系也可存储于服务器、移动存储装置或者其他可实现的存储设备中,本技术对此不作限制。
81.在另一个具体实施例中,巡逻人员在信息传播系统中发送待处理文本“c小学摆摊已驱离”,对待处理文本进行文本分词,得到原始分词集合,原始分词集合包括原始分词“c小学”“摆摊”“已驱离”。根据业务字典对原始分词进行校准,得到位置信息维度的标准分词“c小学”、业务维度的标准分词“流动摊贩”,状态维度的标准分词“已处理”,查询业务字典,确定标准分词对应的标签,得到标准分词“c小学”对应的标签为map000011乙南路,标准分词“20220101”对应的标签为当日日期20220101,标准分词“id002”对应的标签为“id002”,标准分词“流动摊贩”与标准分词“已处理”对应的标签为空值,将此关联关系存储至第二数据库。
82.进一步地,后续对标签“20220101”进行检索时,可得到前述待处理文本“a公园门口目前正常”及其标准分词、标签的关联关系,以及“c小学摆摊已驱离”及其标准分词、标签的关联关系。对即时通信数据中的重要数据进行快速定位,并确定有关的即时通信数据作为辅助数据,极大地提升信息的筛选与查找效率。
83.需要指出的是,本实施例中各个步骤的序号并不代表对各个步骤的执行顺序的限定。
84.可以理解的是,在具体实施中,所述即时通信数据的处理方法可以采用软件程序的方式实现,该软件程序运行于芯片或芯片模组内部集成的处理器中。该方法也可以采用软件结合硬件的方式实现,本技术不作限制。
85.图3是本发明实施例提供的一种在即时通信软件系统中进行即时通信数据处理的具体流程图。
86.在步骤301的具体实施中,数据捕捉机器人对信息传播系统中的即时通信数据进行捕捉。
87.在一个具体实施中,群组中的用户所发送的即时通信数据存储于信息传播系统所属的服务器中。
88.在步骤302的具体实施中,数据捕捉机器人将捕捉到的即时通信数据存储至第一数据库。即时通信数据可以具有多种类型。
89.在一个具体实施中,每个群组具有一个群组标识,群组标识与群组一一对应。数据捕捉机器人根据组标识,周期性地从信息传播系统所属的服务器中捕捉群组标识对应的群组的即时通信数据。此时,第一数据库中的即时通信数据为定期更新。
90.在另一个具体实施中,每当群组中有新消息时,数据捕捉机器人从信息传播系统所属的服务器中捕捉群组中的即时通信数据。此时,第一数据库中的即时通信数据为实时
更新。
91.在具体实施中,由服务器运行即时通信数据处理方法的各个步骤。第一数据库可以是该服务器中的存储装置,数据捕捉机器人可以将即时通信数据存储至服务器的存储装置中。
92.在步骤303的具体实施中,获取即时通信数据,针对不同类型的即时通信数据采用不同的转换操作,以得到待处理文本。具体的转换操作可参考步骤102中的相关描述,此处不再赘述。
93.在步骤304的具体实施中,根据业务字典对待处理文本进行处理。将待处理文本进行文本分割,并根据业务字典对原始分词进行校准,以得到标准分词,再查询业务字典以得到标准分词对应的标签。具体的处理步骤可参考步骤103中的相关描述,此处不再赘述。
94.在步骤305的具体实施中,将待处理文本、标准分词集合及其关联的标签之间的关联关系存储至第二数据库。
95.图4是本发明实施例提供的一种在对讲机构建的信息传播系统中进行即时通信数据处理的具体流程图。
96.在步骤401的具体实施中,数据捕捉机器人对对讲机构建的信息传播系统中的即时通信数据进行捕捉。
97.在一个具体实施例中,管理员设置对讲监听频段,同时,用户将对讲机的使用频段设置为对讲监听频段,并进行正常通话。数据捕捉机器人收集用户的通话并转换为语音数据。具体地,数据捕捉机器人可以是无线集群网关。
98.在步骤402的具体实施中,数据捕捉机器人将捕捉到的即时通信数据存储至第一数据库。此时,即时通信数据为语音数据。
99.在具体实施中,由服务器运行即时通信数据处理方法的各个步骤。第一数据库可以是该服务器中的存储装置,数据捕捉机器人可以将即时通信数据存储至服务器的存储装置中。
100.在步骤403的具体实施中,对语音数据进行语音识别,以得到待处理文本。
101.在步骤404的具体实施中,根据业务字典对语音识别得到的待处理文本进行处理。将待处理文本进行文本分割,并根据业务字典对原始分词进行校准,以得到标准分词,再查询业务字典以得到标准分词对应的标签。具体的处理步骤可参考步骤103中的相关描述,此处不再赘述。
102.在步骤405的具体实施中,将待处理文本、标准分词集合及其关联的标签之间的关联关系存储至第二数据库。
103.如图5所示,本发明实施例还公开了一种即时通信数据的处理装置。即时通信数据的处理装置50包括:
104.即时通信数据获取模块501,用于获取所述即时通信数据并转换为待处理文本;
105.标准分词集合获取模块502,用于根据业务字典解析所述待处理文本,得到所述待处理文本的标准分词集合,其中,所述业务字典存储有至少一个维度下,至少一个标准分词、至少一个原始分词以及所述标准分词和所述原始分词的关联关系,所述原始分词为提取自所述待处理文本的分词结果;
106.标签确认模块503,查找所述业务字典,确定所述标准分词集合中各个标准分词关
联的标签,所述业务字典还存储有至少一个标签以及所述标准分词和标签的关联关系;
107.存储模块504,用于存储所述待处理文本、所述标准分词集合及其关联的标签之间的关联关系。
108.在具体实施中,上述即时通信数据的处理装置可以对应于即时通信数据的处理装置中具有即时通信数据的处理功能的芯片,例如soc(system-on-a-chip,片上系统)、基带芯片等;或者对应于即时通信数据的处理装置中包括具有即时通信数据的处理功能的芯片模组;或者对应于具有数据处理功能芯片的芯片模组,或者对应于即时通信数据的处理装置。
109.关于所述即时通信数据的处理装置50的工作原理、工作方式的更多内容,可以参照图1、图3与图4中的相关描述,这里不再赘述。
110.关于上述实施例中描述的各个装置、产品包含的各个模块/单元,其可以是软件模块/单元,也可以是硬件模块/单元,或者也可以部分是软件模块/单元,部分是硬件模块/单元。例如,对于应用于或集成于芯片的各个装置、产品,其包含的各个模块/单元可以都采用电路等硬件的方式实现,或者,至少部分模块/单元可以采用软件程序的方式实现,该软件程序运行于芯片内部集成的处理器,剩余的(如果有)部分模块/单元可以采用电路等硬件方式实现;对于应用于或集成于芯片模组的各个装置、产品,其包含的各个模块/单元可以都采用电路等硬件的方式实现,不同的模块/单元可以位于芯片模组的同一组件(例如芯片、电路模块等)或者不同组件中,或者,至少部分模块/单元可以采用软件程序的方式实现,该软件程序运行于芯片模组内部集成的处理器,剩余的(如果有)部分模块/单元可以采用电路等硬件方式实现;对于应用于或集成于终端的各个装置、产品,其包含的各个模块/单元可以都采用电路等硬件的方式实现,不同的模块/单元可以位于终端内同一组件(例如,芯片、电路模块等)或者不同组件中,或者,至少部分模块/单元可以采用软件程序的方式实现,该软件程序运行于终端内部集成的处理器,剩余的(如果有)部分模块/单元可以采用电路等硬件方式实现。
111.本发明实施例还公开了一种存储介质,所述存储介质为计算机可读存储介质,其上存储有计算机程序,所述计算机程序运行时可以执行图1、图3与图4中所示方法的步骤。所述存储介质可以包括rom、ram、磁盘或光盘等。所述存储介质还可以包括非挥发性存储器(non-volatile)或者非瞬态(non-transitory)存储器等。
112.本发明实施例还公开了另一种即时通信数据的处理装置,所述即时通信数据的处理装置可以包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时可以执行图1、图3与图4中所示方法的步骤。
113.本技术实施例中出现的“多个”是指两个或两个以上。
114.本技术实施例中出现的第一、第二等描述,仅作示意与区分描述对象之用,没有次序之分,也不表示本技术实施例中对设备个数的特别限定,不能构成对本技术实施例的任何限制。
115.应理解,本技术实施例中,所述处理器可以为中央处理单元(central processing unit,简称cpu),该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor,简称dsp)、专用集成电路(application specific integrated circuit,简称asic)、现成可编程门阵列(field programmable gate array,简称fpga)或者其他可编程
逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
116.还应理解,本技术实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,简称rom)、可编程只读存储器(programmable rom,简称prom)、可擦除可编程只读存储器(erasable prom,简称eprom)、电可擦除可编程只读存储器(electrically eprom,简称eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,简称ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的随机存取存储器(random access memory,简称ram)可用,例如静态随机存取存储器(static ram,简称sram)、动态随机存取存储器(dram)、同步动态随机存取存储器(synchronous dram,简称sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,简称ddr sdram)、增强型同步动态随机存取存储器(enhanced sdram,简称esdram)、同步连接动态随机存取存储器(synchlink dram,简称sldram)和直接内存总线随机存取存储器(direct rambus ram,简称dr ram)。
117.上述实施例,可以全部或部分地通过软件、硬件、固件或其他任意组合来实现。当使用软件实现时,上述实施例可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令或计算机程序。在计算机上加载或执行所述计算机指令或计算机程序时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以为通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线或无线方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集合的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质。半导体介质可以是固态硬盘。
118.应理解,在本技术的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
119.在本技术所提供的几个实施例中,应该理解到,所揭露的方法、装置和系统,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的;例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式;例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
120.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
121.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以
是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
122.上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等各种可以存储程序代码的介质。
123.虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献