一种数据处理方法及系统与流程

2022-06-22 17:51:22 来源：中国专利 TAG：

1.本发明涉及智能家居技术领域，具体是一种数据处理方法及系统。

背景技术：

2.随着社会的发展，视频逐渐的成为了娱乐或信息传递的一种主流的方式，具体到实际，便是我们平时观看的电影、电视剧或短视频；其中，由于电影的制作成本较高，用户一般对观看环境要求比较高，总会希望能够获得更好的观影外部条件，其中，环境光照强度就是非常重要的一个影响因素。
3.在现有技术中，可控制亮度的灯很多，但是能够随着视频内容自动变化的灯还未出现，如何使得外界环境更好的适应视频内容，搭建良好的私人影院，提高用户观影体验是本发明技术方案想要解决的技术问题。

技术实现要素：

4.本发明的目的在于提供一种数据处理方法及系统，以解决上述背景技术中提出的问题。
5.为实现上述目的，本发明提供如下技术方案：一种数据处理方法，所述方法包括：实时获取用户发送的语音信号，并对所述语音信号进行人声识别；当所述语音信号为人声信号时，将所述语音信号转换为音频信号；对所述音频信号进行内容识别，确定基准亮度及相应的灯光调节模型，基于所述基准亮度生成基准调节指令，将所述基准调节指令向执行端发送；基于用户输入的播放请求获取影像文件，对所述影像文件进行重复性识别，根据重复性识别结果确定调节图像组；将所述调节图像组输入所述灯光调节模型，生成灯光调节指令，将所述灯光调节指令向执行端发送。
6.作为本发明进一步的方案：所述实时获取用户发送的语音信号，并对所述语音信号进行人声识别的步骤包括：实时获取用户发送的语音信号，将所述语音信号输入训练好的语音识别模型，得到识别文本；根据识别文本判断所述语音信号是否为有意信号；当所述语音信号为有意信号时，根据预设的振幅阈值确定语音信号信息点；根据所述语音信号信息点判断所述有意信号是否为人声信号。
7.作为本发明进一步的方案：所述根据所述语音信号信息点判断所述有意信号是否为人声信号的步骤包括：获取若干个语音信号信息点的振幅；获取若干个相邻语音信号信息点的相位差；
分别计算已获取的所述振幅和所述相位差的均值，并根据所述均值计算方差；将计算到的方差与预设的方差阈值进行比对，根据比对结果判断所述有意信号是否为人声信号。
8.作为本发明进一步的方案：所述基于用户输入的播放请求获取影像文件，对所述影像文件进行重复性识别，根据重复性识别结果确定调节图像组的步骤包括：接收用户输入的含有文件索引的播放请求，基于所述文件索引在预设的文件库中提取影像文件；当所述预设的文件库中不存在所述影像文件时，开放文件获取端口，基于所述文件获取端口获取影像文件；提取所述影像文件中的图像信息，生成图像序列；所述图像序列的编号与图像信息中的时间信息为映射关系；根据预设的转换公式将所述图像序列转换为单值图像库；对所述单值图像库进行重复性识别，基于重复性识别结果标记单值图像库中的重复图像，基于映射关系剔除所述影像文件中的重复图像，得到调节图像组。
9.作为本发明进一步的方案：所述对所述单值图像库进行重复性识别，基于重复性识别结果标记单值图像库中的重复图像的步骤包括：依次读取单值图像库中的单值图像，遍历所述单值图像中的各个像素点，获取各像素点的值；基于各像素点的值计算单值图像的特征值，得到与单值图像库对应的特征值组；依次计算特征值组中相邻特征值的偏移率，并将所述偏移率与预设的偏移阈值进行比对；当所述偏移率小于预设的偏移阈值时，将在后特征值对应的单值图像标记为重复图像。
10.作为本发明进一步的方案：所述将所述调节图像组输入所述灯光调节模型，生成灯光调节指令的步骤包括：读取所述调节图像组对应的特征值组；基于所述特征值组生成拟合曲线，将所述拟合曲线输入训练好的指令生成模型，得到预调节指令；获取特征值对应的调节图像，获取所述调节图像的时间信息，将所述时间信息插入所述预调节指令，得到灯光调节指令。
11.作为本发明进一步的方案：所述方法还包括：接收用户发送的亮度设定请求，开放亮度设定端口；基于亮度设定端口接收用户输入的触屏信号，并基于所述触屏信号确定亮度设定值；根据所述亮度设定值替换所述基准亮度。
12.本发明技术方案还提供了一种数据处理系统，所述系统包括：语音识别模块，用于实时获取用户发送的语音信号，并对所述语音信号进行人声识别；当所述语音信号为人声信号时，将所述语音信号转换为音频信号；基准调节模块，用于对所述音频信号进行内容识别，确定基准亮度及相应的灯光调节模型，基于所述基准亮度生成基准调节指令，将所述基准调节指令向执行端发送；
重复图像识别模块，基于用户输入的播放请求获取影像文件，对所述影像文件进行重复性识别，根据重复性识别结果确定调节图像组；指令生成模块，用于将所述调节图像组输入所述灯光调节模型，生成灯光调节指令，将所述灯光调节指令向执行端发送。
13.作为本发明进一步的方案：所述语音识别模块包括：文本生成单元，用于实时获取用户发送的语音信号，将所述语音信号输入训练好的语音识别模型，得到识别文本；意义判定单元，用于根据识别文本判断所述语音信号是否为有意信号；信息点确定单元，用于当所述语音信号为有意信号时，根据预设的振幅阈值确定语音信号信息点；处理执行单元，用于根据所述语音信号信息点判断所述有意信号是否为人声信号。
14.作为本发明进一步的方案：所述处理执行单元包括：振幅获取子单元，用于获取若干个语音信号信息点的振幅；相位差获取子单元，用于获取若干个相邻语音信号信息点的相位差；方差计算子单元，用于分别计算已获取的所述振幅和所述相位差的均值，并根据所述均值计算方差；比对子单元，用于将计算到的方差与预设的方差阈值进行比对，根据比对结果判断所述有意信号是否为人声信号。
15.与现有技术相比，本发明的有益效果是：本发明先确定基准亮度，再基于预设的灯光调节模型对待播放的影像文件进行内容识别，生成灯光调节指令，进而基于灯光调节指令调节环境光照强度，成功搭建了动态的观影平台，提高了用户的观影体验。
附图说明
16.为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例。
17.图1为数据处理方法的流程框图。
18.图2为数据处理方法的第一子流程框图。
19.图3为数据处理方法的第二子流程框图。
20.图4为数据处理方法的第三子流程框图。
21.图5为数据处理方法的第四子流程框图。
22.图6为数据处理方法的第五子流程框图。
23.图7为数据处理系统的组成结构框图。
24.图8为数据处理系统中语音识别模块的组成结构框图。
25.图9为语音识别模块中处理执行单元的组成结构框图。
具体实施方式
26.为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白，以下结
合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
27.实施例1图1为数据处理方法的流程框图，本发明实施例中，一种数据处理方法，所述方法包括步骤s100至步骤s400：步骤s100：实时获取用户发送的语音信号，并对所述语音信号进行人声识别；当所述语音信号为人声信号时，将所述语音信号转换为音频信号；本发明技术方案的其中一个应用场景是私人影院，私人影院具备声控功能，用户在进入某一个区域时，通过语音可以使得整个系统进行准备环节。
28.步骤s200：对所述音频信号进行内容识别，确定基准亮度及相应的灯光调节模型，基于所述基准亮度生成基准调节指令，将所述基准调节指令向执行端发送；所述灯光调节模型可能不唯一，比如，在看一些悬疑片时，遇到较暗的视频部分，有些用户比较害怕，他希望环境亮一点，增加安全感，而有些用户比较胆大，他希望环境暗一些，增加沉浸感，可以想到，这两种灯光调节模型的调节过程是相反的。步骤s200的目的仅仅是根据用户的语音信息确定灯光调节模型和基准亮度，其中，基准亮度是区域内的灯光亮度，调节过程均是基于这一基准亮度上的增强或减弱。
29.步骤s300：基于用户输入的播放请求获取影像文件，对所述影像文件进行重复性识别，根据重复性识别结果确定调节图像组；步骤s300是影像文件的处理过程，基于影像文件进行亮度调节时，如果实时的进行调节，消耗的计算资源会很高，实际上，影像文件是由一个个小的片段组成的，在每一个小片段中，图像的亮度（图像的色值）的变化幅度并不大，只有在切换场景时，图像的变化幅度才会很大，相应的，室内亮度也随之变化。
30.步骤s400：将所述调节图像组输入所述灯光调节模型，生成灯光调节指令，将所述灯光调节指令向执行端发送。
31.步骤s400是具体的环境亮度调节过程，灯光调节指令指的是增强或者减弱，增强或减弱的范围大概在基准亮度的10%或者20%左右，它一般不会超过50%，如果超过了50%，那么调整基准亮度是更好的方案。
32.本发明技术方案的架构包括两方，分别为用户终端和执行端，所述用户终端和执行端之间通过网络相互传输数据，所述网络的连接类型主要是无线通信链路。
33.用户在使用用户终端的过程中，可以通过网络与执行端进行交互。所述用户终端可以是硬件，也可以是软件，当用户终端为硬件时，所述用户终端为便于携带的设备，所述便于携带的设备最常见的是手机。当用户终端为软件时，可以安装在上述设备中，其可以实现成多个软件或软件模块，也可以实现成单个软件或软件模块，在此不做具体限定。
34.所述执行端可以是硬件，也可以是软件，当设备终端为硬件时，所述执行端为可以接收显示亮度或修正亮度，并基于显示亮度或修正亮度生成对应的光源强度指令的可编程灯具，进而调整光源强度；当执行端为软件时，可以安装在上述可编程灯具上，其可以实现成多个软件或软件模块，也可以实现成单个软件或软件模块，在此不做具体限定。
35.值得一提的是，所述用户终端还需要具体影像播放功能。
36.图2为数据处理方法的第一子流程框图，所述实时获取用户发送的语音信号，并对
所述语音信号进行人声识别的步骤包括步骤s101至步骤s104：步骤s101：实时获取用户发送的语音信号，将所述语音信号输入训练好的语音识别模型，得到识别文本；步骤s102：根据识别文本判断所述语音信号是否为有意信号；步骤s103：当所述语音信号为有意信号时，根据预设的振幅阈值确定语音信号信息点；步骤s104：根据所述语音信号信息点判断所述有意信号是否为人声信号。
37.步骤s101至步骤s104的功能是对用户发送的语音信号进行识别，发送语音信号实际上就是产生声音，但是发出声音的情形有很多，比如雷雨天气的雷声，因此，在进行语音识别之间，需要判断语音信号是否为人声信号。
38.图3为数据处理方法的第二子流程框图，所述根据所述语音信号信息点判断所述有意信号是否为人声信号的步骤包括步骤s1041至步骤s1044：步骤s1041：获取若干个语音信号信息点的振幅；步骤s1042：获取若干个相邻语音信号信息点的相位差；步骤s1043：分别计算已获取的所述振幅和所述相位差的均值，并根据所述均值计算方差；步骤s1044：将计算到的方差与预设的方差阈值进行比对，根据比对结果判断所述有意信号是否为人声信号。
39.在本发明技术方案中，用户在观看视频时，视频自然会产生一系列声音，这些声音肯定能被捕捉到，因此，人声识别过程中，很重要的一项功能就是剔除这些与人声信号极其相似的音频信号。
40.对于这些录制好的音频信号，需要通过一些特征点进行判断；可以想到，这些音频信号的稳定性较高，而真正由用户发出的音频信号，往往是很突兀的，从音频信号的角度来说，就是音频的稳定性不同。
41.图4为数据处理方法的第三子流程框图，所述基于用户输入的播放请求获取影像文件，对所述影像文件进行重复性识别，根据重复性识别结果确定调节图像组的步骤包括步骤s301至步骤s304：步骤s301：接收用户输入的含有文件索引的播放请求，基于所述文件索引在预设的文件库中提取影像文件；当所述预设的文件库中不存在所述影像文件时，开放文件获取端口，基于所述文件获取端口获取影像文件；步骤s302：提取所述影像文件中的图像信息，生成图像序列；所述图像序列的编号与图像信息中的时间信息为映射关系；步骤s303：根据预设的转换公式将所述图像序列转换为单值图像库；步骤s304：对所述单值图像库进行重复性识别，基于重复性识别结果标记单值图像库中的重复图像，基于映射关系剔除所述影像文件中的重复图像，得到调节图像组。
42.步骤s301至步骤s304对重复图像的识别过程进行了具体的限定，首先，影像文件的获取可以是系统中已有的，也可以是用户上传的，对于影像文件的处理，首先要将所述影像文件转换为图像序列，所述图像序列的编号与图像信息对应的时间是相关的；然后，对所述图像序列进行色值转换，得到单值图像库；在本发明技术方案的一个实例中，这一转换过
程可以是将图像序列中的图像全部转换为灰度图像；灰度图像中各像素点的值只有一个，后续的比对过程极其容易。
43.最后，在单值图像库中剔除重复图像即可。
44.图5为数据处理方法的第四子流程框图，所述对所述单值图像库进行重复性识别，基于重复性识别结果标记单值图像库中的重复图像的步骤包括步骤s3041至步骤s3044：步骤s3041：依次读取单值图像库中的单值图像，遍历所述单值图像中的各个像素点，获取各像素点的值；步骤s3042：基于各像素点的值计算单值图像的特征值，得到与单值图像库对应的特征值组；步骤s3043：依次计算特征值组中相邻特征值的偏移率，并将所述偏移率与预设的偏移阈值进行比对；步骤s3044：当所述偏移率小于预设的偏移阈值时，将在后特征值对应的单值图像标记为重复图像。
45.步骤s3041至步骤s3044对在单值图像库中剔除重复图像的过程进行了具体的描述，上述内容的核心是计算偏移率，如果相邻两个图像的偏移率较高，那么它们就是不同的，如果它们的偏移率较低，就说明它们在色彩层面是相似的。
46.图6为数据处理方法的第五子流程框图，所述将所述调节图像组输入所述灯光调节模型，生成灯光调节指令的步骤包括步骤s401至步骤s403：步骤s401：读取所述调节图像组对应的特征值组；步骤s402：基于所述特征值组生成拟合曲线，将所述拟合曲线输入训练好的指令生成模型，得到预调节指令；步骤s403：获取特征值对应的调节图像，获取所述调节图像的时间信息，将所述时间信息插入所述预调节指令，得到灯光调节指令。
47.对于灯光调节指令的生成过程，首先需要读取重复图像剔除过程中生成的特征值组，然后基于特征值组生成预调节指令；生成预调节指令的过程中，需要将不同的特征值及其时间信息转换为拟合曲线，这一过程可以使得最终的亮度调节过程是平滑的。
48.作为本发明技术方案的一个优选实施例，所述方法还包括：接收用户发送的亮度设定请求，开放亮度设定端口；基于亮度设定端口接收用户输入的触屏信号，并基于所述触屏信号确定亮度设定值；根据所述亮度设定值替换所述基准亮度。
49.本发明技术方案的重点在于，在预设的基准亮度上，根据影像文件实时的对环境亮度进行微调，其中，基准亮度的可调节幅度要远大于微调的幅度，基准亮度的调节由用户的语音信号确定，调节过程的颗粒度很大，调节难度也很大；因此，上述内容提供了一种颗粒度更小的基准亮度调节过程。
50.实施例2图7为数据处理系统的组成结构框图，本发明实施例中，一种数据处理系统，所述系统10包括：语音识别模块11，用于实时获取用户发送的语音信号，并对所述语音信号进行人
声识别；当所述语音信号为人声信号时，将所述语音信号转换为音频信号；基准调节模块12，用于对所述音频信号进行内容识别，确定基准亮度及相应的灯光调节模型，基于所述基准亮度生成基准调节指令，将所述基准调节指令向执行端发送；重复图像识别模块13，基于用户输入的播放请求获取影像文件，对所述影像文件进行重复性识别，根据重复性识别结果确定调节图像组；指令生成模块14，用于将所述调节图像组输入所述灯光调节模型，生成灯光调节指令，将所述灯光调节指令向执行端发送。
51.图8为数据处理系统中语音识别模块的组成结构框图，所述语音识别模块11包括：文本生成单元111，用于实时获取用户发送的语音信号，将所述语音信号输入训练好的语音识别模型，得到识别文本；意义判定单元112，用于根据识别文本判断所述语音信号是否为有意信号；信息点确定单元113，用于当所述语音信号为有意信号时，根据预设的振幅阈值确定语音信号信息点；处理执行单元114，用于根据所述语音信号信息点判断所述有意信号是否为人声信号。
52.图9为语音识别模块中处理执行单元的组成结构框图，所述处理执行单元114包括：振幅获取子单元1141，用于获取若干个语音信号信息点的振幅；相位差获取子单元1142，用于获取若干个相邻语音信号信息点的相位差；方差计算子单元1143，用于分别计算已获取的所述振幅和所述相位差的均值，并根据所述均值计算方差；比对子单元1144，用于将计算到的方差与预设的方差阈值进行比对，根据比对结果判断所述有意信号是否为人声信号。
53.所述数据处理方法所能实现的功能均由计算机设备完成，所述计算机设备包括一个或多个处理器和一个或多个存储器，所述一个或多个存储器中存储有至少一条程序代码，所述程序代码由所述一个或多个处理器加载并执行以实现所述数据处理方法的功能。
54.处理器从存储器中逐条取出指令、分析指令，然后根据指令要求完成相应操作，产生一系列控制命令，使计算机各部分自动、连续并协调动作，成为一个有机的整体，实现程序的输入、数据的输入以及运算并输出结果，这一过程中产生的算术运算或逻辑运算均由运算器完成；所述存储器包括只读存储器（read-only memory，rom），所述只读存储器用于存储计算机程序，所述存储器外部设有保护装置。
55.示例性的，计算机程序可以被分割成一个或多个模块，一个或者多个模块被存储在存储器中，并由处理器执行，以完成本发明。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述计算机程序在终端设备中的执行过程。
56.本领域技术人员可以理解，上述服务设备的描述仅仅是示例，并不构成对终端设备的限定，可以包括比上述描述更多或更少的部件，或者组合某些部件，或者不同的部件，例如可以包括输入输出设备、网络接入设备、总线等。
57.所称处理器可以是中央处理单元（central processing unit，cpu），还可以是其他通用处理器、数字信号处理器（digital signal processor，dsp）、专用集成电路
（application specific integrated circuit，asic）、现成可编程门阵列（field-programmable gate array，fpga）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，上述处理器是上述终端设备的控制中心，利用各种接口和线路连接整个用户终端的各个部分。
58.上述存储器可用于存储计算机程序和/或模块，上述处理器通过运行或执行存储在存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现上述终端设备的各种功能。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如信息采集模板展示功能、产品信息发布功能等）等；存储数据区可存储根据泊位状态显示系统的使用所创建的数据（比如不同产品种类对应的产品信息采集模板、不同产品提供方需要发布的产品信息等）等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡（smart media card， smc），安全数字（secure digital， sd）卡，闪存卡（flash card）、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
59.终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实现上述实施例系统中的全部或部分模块/单元，也可以通过计算机程序来指令相关的硬件来完成，上述的计算机程序可存储于计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个系统实施例的功能。其中，计算机程序包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（rom，read-only memory）、随机存取存储器（ram，random access memory）、电载波信号、电信信号以及软件分发介质等。
60.需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
61.以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种数据处理方法及系统与流程

相关文献

最热文献