数据可视化的处理方法、装置及存储介质与流程

2022-11-13 13:38:10 来源：中国专利 TAG：

1.本技术涉及数据处理领域，尤其涉及一种数据可视化的处理方法、装置及存储介质。

背景技术：

2.大数据的快速发展为人们的生产生活提供了诸多便利。为了进一步提高数据的可用性，使数据能够清晰有效地进行信息传达，数据可视化不失为一种有效的技术。数据可视化可以将相对枯燥的数据以用户更容易理解和更容易接受的方式进行呈现。
3.在数据可视化的过程中，服务器可以获取包含有大量数据的数据集。之后，服务器可以按照需求对数据集中的数据进行分类，得到多种类型的数据。然后，服务器对满足需求的目标类型的数据进行渲染处理，形成适用于需求的图像。但是，目前的技术方案中，仅通过一次分类便得到满足需求的数据，可能导致得到的数据的准确率较低，影响可视化效果。

技术实现要素：

4.本技术提供一种数据可视化的处理方法、装置及存储介质，用于提高数据可视化效果。
5.为达到上述目的，本技术采用如下技术方案：
6.第一方面，本技术提供一种数据可视化的处理方法。该方法中，数据可视化的处理装置(可以简称为“处理装置”)获取多个高维数据。处理装置可以对多个高维数据进行分类，确定第一数据集，第一数据集包括目标类型对应的高维数据。然后，处理装置可以根据决策树算法和多个预设特征对第一数据集进行分裂，确定多个特征集合，一个预设特征对应一个特征集合，多个预设特征为第一数据集中的高维数据的特征。之后，处理装置可以根据目标特征，从多个特征集合中确定目标集合，目标集合为多个特征集合中，与目标特征的匹配度大于预设相似度阈值的特征集合。之后，处理装置可以对目标集合进行渲染处理。
7.可选的，上述方法还包括：处理装置可以根据多个预设特征和第一数据集，确定第一信息熵，第一信息熵用于指示第一数据集中的高维数据与目标特征之间的匹配度。之后，处理装置可以根据多个预设特征和多个特征集合，确定多个第二信息熵，第二信息熵用于指示特征集合与目标特征之间的匹配度，一个特征集合对应一个第二信息熵。然后，处理装置可以根据第一信息熵和多个第二信息熵，确定多个信息增益，信息增益用于指示特征集合与目标特征之间的匹配度。上述“从多个特征集合中确定目标集合”的方法，包括：处理装置可以将多个信息增益进行比较，确定目标增益，目标增益为多个信息增益中最大的信息增益。之后，处理装置可以将目标增益对应的特征集合作为目标集合。
8.可选的，上述方法还包括：处理装置可以确定目标集合对应的渲染任务信息，渲染任务信息包括：渲染任务的数量和每个渲染任务的任务时长。上述“对目标集合进行渲染处理”的方法，包括：若渲染任务的数量小于第一预设阈值，且每个渲染任务的任务时长小于第二预设阈值，则处理装置可以对目标集合进行渲染处理。
9.可选的，目标集合包括第二数据集和第三数据集。上述方法还包括：若渲染任务的数量大于第一预设阈值，且每个渲染任务的任务时长大于第二预设阈值，则处理装置可以对第二数据集进行渲染处理。然后，处理装置可以向第二服务器发送渲染消息，渲染消息包括第三数据集，渲染消息用于指示第二服务器渲染第三数据集。之后，处理装置可以接收来自第二服务器的渲染数据，渲染数据为对第三数据集渲染后的数据。
10.第二方面，本技术提供一种数据可视化的处理装置，该装置包括获取模块和处理模块。
11.获取模块，用于获取多个高维数据。处理模块，用于对多个高维数据进行分类，确定第一数据集，第一数据集包括目标类型对应的高维数据。处理模块，还用于根据决策树算法和多个预设特征对第一数据集进行分裂，确定多个特征集合，一个预设特征对应一个特征集合，多个预设特征为目标集合中的高维数据的特征。处理模块，还用于根据目标特征，从多个特征集合中确定目标集合，目标集合为多个特征集合中，与目标特征的匹配度大于预设相似度阈值的特征集合。处理模块，还用于对目标集合进行渲染处理。
12.可选的，处理模块，具体用于根据多个预设特征和第一数据集，确定第一信息熵，第一信息熵用于指示第一数据集中的高维数据与目标特征之间的匹配度。处理模块，还用于根据多个预设特征和多个特征集合，确定多个第二信息熵，第二信息熵用于指示特征集合与目标特征之间的匹配度，一个特征集合对应一个第二信息熵。之后，处理模块，还用于根据第一信息熵和多个第二信息熵，确定多个信息增益，信息增益用于指示特征集合与目标特征之间的匹配度。然后，处理模块，具体用于将多个信息增益进行比较，确定目标增益，目标增益为多个信息增益中最大的信息增益。处理模块，还用于将目标增益对应的特征集合作为目标集合。
13.可选的，处理模块，具体用于确定目标集合对应的渲染任务信息，渲染任务信息包括：渲染任务的数量和每个渲染任务的任务时长。处理模块，还用于若渲染任务的数量小于第一预设阈值，且每个渲染任务的任务时长小于第二预设阈值，则对目标集合进行渲染处理。
14.可选的，处理模块，具体用于若渲染任务的数量大于第一预设阈值，且每个渲染任务的任务时长大于第二预设阈值，则对第二数据集进行渲染处理。处理模块，还用于向第二服务器发送渲染消息，渲染消息包括第三数据集，渲染消息用于指示第二服务器渲染第三数据集。之后，处理模块，还用于接收来自第二服务器的渲染数据，渲染数据为对第三数据集渲染后的数据。
15.第三方面，本技术提供了一种数据可视化的处理装置，该装置包括：处理器和存储器。处理器和存储器耦合。存储器用于存储一个或多个程序，该一个或多个程序包括计算机执行指令，当该数据可视化的处理装置运行时，处理器执行该存储器存储的该计算机执行指令，以实现如第一方面和第一方面的任一种可能的实现方式中所描述的数据可视化的处理方法。
16.第四方面，本技术提供了一种计算机可读存储介质，计算机可读存储介质中存储有指令，当指令在计算机上运行时，使得计算机执行上述第一方面和第一方面的任一种可能的实现方式中所描述的数据可视化的处理方法。
17.第五方面，本技术提供了一种计算机程序产品，包括计算机程序，当其计算机程序
被处理器执行时，使得计算机实现如第一方面和第一方面的任一种可能的实现方式中所描述的数据可视化的处理方法。
18.上述方案中，数据可视化的处理装置、计算机设备、计算机存储介质或者计算机程序产品所能解决的技术问题以及实现的技术效果可以参见上述第一方面所解决的技术问题以及技术效果，在此不再赘述。
19.本技术提供的技术方案至少带来以下有益效果：服务器可以获取多个高维数据并对多个高维数据进行分类，确定第一数据集，第一数据集包括目标类型对应的高维数据。之后，服务器可以根据决策树算法和多个预设特征对第一数据集进行分裂，确定多个特征集合，一个预设特征对应一个特征集合，多个预设特征为第一数据集中的高维数据的特征。也就是说，服务器可以对第一数据集进行分裂，减少了数据的处理量。并且，服务器可以通过决策树算法进行分裂，能够进一步提高数据的准确率。之后，服务器可以根据目标特征，从多个特征集合中确定目标集合，目标集合为多个特征集合中，与目标特征的匹配度大于预设相似度阈值的特征集合。也就是说，目标集合中的高维数据的准确率更高。之后，服务器可以对目标集合进行渲染处理。这样一来，由于数据准确率的提高，该目标集合可以较好地满足需求(与目标类型相近)，从而提高了数据可视化的效果。
附图说明
20.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本技术的实施例，并与说明书一起用于解释本技术的原理，并不构成对本技术的不当限定。
21.图1是根据一示例性实施例示出的一种服务器的结构示意图；
22.图2是根据一示例性实施例示出的一种数据可视化的处理方法的流程图；
23.图3是根据一示例性实施例示出的另一种数据可视化的处理方法的流程图；
24.图4是根据一示例性实施例示出的另一种数据可视化的处理方法的流程图；
25.图5是根据一示例性实施例示出的另一种数据可视化的处理方法的流程图；
26.图6是根据一示例性实施例示出的一种数据可视化的处理装置的结构框图；
27.图7是根据一示例性实施例示出的一种数据可视化的处理装置的结构示意图；
28.图8是根据一示例性实施例示出的一种计算机程序产品的概念性局部视图。
具体实施方式
29.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本技术保护的范围。
30.本文中字符“/”，一般表示前后关联对象是一种“或者”的关系。例如，a/b可以理解为a或者b。
31.本技术的说明书和权利要求书中的术语“第一”和“第二”是用于区别不同的对象，而不是用于描述对象的特定顺序。
32.此外，本技术的描述中所提到的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没
有限定于已列出的步骤或模块，而是可选地还包括其他没有列出的步骤或模块，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
33.另外，在本技术实施例中，“示例性的”、或者“例如”等词用于表示作例子、例证或说明。本技术中被描述为“示例性的”或“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言，使用“示例性的”、或者“例如”等词旨在以具体方式呈现概念。
34.为了便于理解，下面先对本技术实施例所涉及的术语进行介绍。
35.高维数据，是指具有模式性且高维度的数据。其中，模式性是指具有明确数据类型定义，可方便用户进行搜索的特性，高维度是指在明确数据类型定义的前提下，具有数据维度庞大。
36.在对本技术实施例的数据可视化的处理方法进行详细介绍之前，先对本技术实施例的实施环境和应用场景进行介绍。
37.在数据可视化的过程中，服务器可以获取包含有大量数据的数据集。之后，服务器可以按照需求对数据集中的数据进行分类，得到多种类型的数据。然后，服务器对满足需求的目标类型的数据进行渲染处理，形成适用于需求的图像。但是，目前的数据可视化系统，需要在数据分类后由工作人员选择满足需求的目标类型的数据。因此，目前的数据可视化系统需要消耗大量的人力、物力和时间成本。并且，目前的数据可视化系统仅通过一次分类便得到满足需求的数据，可能导致数据的准确率较低，影响可视化效果。
38.为了解决上述问题，本技术实施例提供一种数据可视化的处理方法，服务器可以获取多个高维数据并对多个高维数据进行分类，确定第一数据集，第一数据集包括目标类型对应的高维数据。之后，服务器可以根据第一数据集中的高维数据的特征对第一数据集进行划分，确定多个特征集合。然后，服务器可以根据目标特征，从多个特征集合中确定目标集合，该目标集合可以较好地满足需求。之后，服务器可以对目标集合进行渲染处理。如此，由于数据准确率的提高，目标集合可以更好地满足需求，从而提高了数据可视化的效果。
39.下面对本技术实施例的实施环境进行介绍。
40.图1为本公开实施例提供的一种应用本公开所提供方法的服务器的结构示意图。其中，该服务器10包括有处理器101和存储器102。
41.其中，处理器101可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器101可以包括应用处理器(application processor，ap)，调制解调处理器，图形处理器(graphics processing unit，gpu)，图像信号处理器(image signal processor，isp)，控制器，存储器，视频编解码器，数字信号处理器(digital signal processor，dsp)，基带处理器，和/或神经网络处理器(neural-network processing unit，npu)等。其中，不同的处理单元可以是独立的器件，也可以集成在一个或多个处理器中。
42.存储器102可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器102还可以包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一种可实施的方式中，存储器102中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器101所执行以实现本公开方法实施例提供的数据可视化的处理方法。
43.在一种可实施的方式中，服务器10还可选包括有：外围设备接口103和至少一个外围设备。处理器101、存储器102和外围设备接口103之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口103相连。具体地，外围设备包括：射频电路104、显示屏105、摄像头组件106、音频电路107、定位组件108和电源109中的至少一种。
44.外围设备接口103可被用于将i/o(input/output，输入/输出)相关的至少一个外围设备连接到处理器101和存储器102。在一种可实施的方式中，处理器101、存储器102和外围设备接口103被集成在同一芯片或电路板上；在一些其他实施例中，处理器101、存储器102和外围设备接口103中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不予限定。
45.射频电路104用于接收和发射rf(radio frequency，射频)信号，也称电磁信号。射频电路104通过电磁信号与通信网络以及其他通信设备进行通信。射频电路104将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路104包括：天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路104可以通过至少一种无线通信协议来与其它服务器进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wi-fi(wireless fidelity，无线保真)网络。在一种可实施的方式中，射频电路104还可以包括nfc(near field communication，近距离无线通信)有关的电路，本公开对此不加以限定。
46.显示屏105用于显示ui(user interface，用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏105是触摸显示屏时，显示屏105还具有采集在显示屏105的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器101进行处理。此时，显示屏105还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一种可实施的方式中，显示屏105可以为一个，设置服务器10的前面板；显示屏105可以采用lcd(liquid crystal display，液晶显示屏)、oled(organic light-emitting diode，有机发光二极管)等材质制备。
47.摄像头组件106用于采集图像或视频。可选地，摄像头组件106包括前置摄像头和后置摄像头。通常，前置摄像头设置在服务器的前面板，后置摄像头设置在服务器的背面。音频电路107可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器101进行处理，或者输入至射频电路104以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在服务器10的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器101或射频电路104的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一种可实施的方式中，音频电路107还可以包括耳机插孔。
48.定位组件108用于定位服务器10的当前地理位置，以实现导航或lbs(location based service，基于位置的服务)。定位组件108可以是基于美国的gps(global positioning system，全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的
伽利略系统的定位组件。
49.电源109用于为服务器10中的各个组件进行供电。电源109可以是交流电、直流电、一次性电池或可充电电池。当电源109包括可充电电池时，该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
50.在一种可实施的方式中，服务器10还包括有一个或多个传感器1010。该一个或多个传感器1010包括但不限于：加速度传感器、陀螺仪传感器、压力传感器、指纹传感器、光学传感器以及接近传感器。
51.加速度传感器可以检测以服务器10建立的坐标系的三个坐标轴上的加速度大小。陀螺仪传感器可以检测服务器10的机体方向及转动角度，陀螺仪传感器可以与加速度传感器协同采集用户对服务器10的3d动作。压力传感器可以设置在服务器10的侧边框和/或显示屏105的下层。当压力传感器设置在服务器10的侧边框时，可以检测用户对服务器10的握持信号。指纹传感器用于采集用户的指纹。光学传感器用于采集环境光强度。接近传感器，也称距离传感器，通常设置在服务器10的前面板。接近传感器用于采集用户与服务器10的正面之间的距离。
52.本公开提供的一种数据可视化的处理方法的执行主体可以为数据可视化的处理装置，该执行装置可以为图1所示的服务器。同时，该执行装置还可以为该服务器的中央处理器(central processing unit，cpu)，或者该服务器中的用于处理数据的控制模块。本技术实施例中以服务器执行数据可视化的处理方法为例，说明本技术实施例提供的数据可视化的处理方法。
53.在一种可实施的方式中，服务器用于向用户提供语音和/或数据连通性服务。服务器可以有不同的名称，例如ue端、终端单元、终端站、移动站、移动台、远方站、远程终端、移动设备、无线通信设备、车辆用户设备、终端代理或终端装置等。
54.可选的，服务器可以为各种具有通信功能的手持设备、车载设备、可穿戴设备、计算机，本公开实施例对此不作任何限定。例如，手持设备可以是智能手机。车载设备可以是车载导航系统。可穿戴设备可以是智能手环。计算机可以是个人数字助理(personal digital assistant，pda)电脑、平板型电脑以及膝上型电脑(laptop computer)。
55.下面结合说明书附图对本技术实施例进行具体说明。
56.如图2所示，为本技术实施例提供的一种数据可视化的处理方法，该方法包括：
57.s201、第一服务器获取多个高维数据。
58.在一种可能的实现方式中，第一服务器可以获取至少一个图像，每个图像均包括至少一个对象。之后，第一服务器可以对至少一个图像中的每个图像进行图像识别处理，确定多个对象以及每个对象对应的高维数据。
59.示例性的，假如图像中包含房屋、树木、汽车，则第一服务器可以确定多个对象，多个对象包括：房屋、树木和汽车。从而，第一服务器可以确定房屋对应的高维数据(如高度、宽度、长度)，树木对应的高维数据(如树木的高度、树干的粗细、树叶的颜色)，汽车对应的高维数据(如车标、颜色、长度)。
60.需要说明的是，本技术实施例中，对图像识别处理不作限定。例如，图像识别处理可以是神经网络的图像识别技术。又例如，图像识别处理可以是非线性降维的图像识别技术。又例如，图像识别处理可以是传统图像识别技术。
61.在另一种可能的实现方式中，第一服务器可以向其他设备发送第一请求消息，第一请求消息用于请求多个高维数据，其他设备为除第一服务器以外的任一设备。之后，第一服务器可以接收来自其他设备的多个高维数据。
62.s202、第一服务器对多个高维数据进行分类，确定第一数据集。
63.其中，第一数据集包括目标类型对应的高维数据。
64.在一种可能的设计中，目标类型为目标对象的目标维度的类型。也就是说，目标类型对应的高维数据可以为目标对象的目标维度的数据。
65.示例性的，假如目标对象为汽车，目标维度为颜色维度，则第一数据集可以包括汽车的颜色数据。假如目标对象为房屋，目标维度为高度维度，则第一数据集可以包括房屋的高度数据。
66.在一种可能的实现方式中，第一服务器可以根据多个对象对多个高维数据进行分类，确定多个第四数据集。其中，一个第四数据集包括一个对象类型的高维数据，多个第四数据集中包括第五数据集，第五数据集包括目标对象对应的高维数据。之后，第一服务器可以根据多个第四数据集和目标对象，确定第五数据集。然后，第一服务器可以根据第五数据集和目标维度，确定第一数据集。
67.示例性的，假如多个高维数据包括：房屋的高度、房屋的宽度、房屋的长度、树木的高度、树干的宽度、树叶的颜色、汽车的车标、汽车的颜色、汽车的长度，则多个第四数据集包括：房屋对应的高维数据(房屋的高度、房屋的宽度、房屋的长度)、树木对应的高维数据(树木的高度、树干的宽度、树叶的颜色)、汽车对应的高维数据(汽车的车标、汽车的颜色、汽车的长度)。假如目标类型为汽车的颜色，则目标对象为汽车，目标维度为颜色。则第一服务器可以确定第五数据集包括汽车对应的高维数据，第一数据集包括汽车的颜色对应的高维数据。
68.s203、第一服务器根据决策树算法和多个预设特征对第一数据集进行分裂，确定多个特征集合。
69.其中，一个预设特征对应一个特征集合，多个预设特征为第一数据集中的高维数据的特征。
70.在一种可能的实现方式中，第一服务器可以根据多个预设特征，确定多个预设特征对应的多个特征空间，一个预设特征对应一个特征空间，每个特征空间包括多个特征点。之后，第一服务器可以将多个特征空间中的特征点作为决策树的节点分裂标准，对第一数据集进行分裂，确定多个特征集合。
71.示例性的，假如第一数据集包括颜色为绿色的树叶的高维数据、颜色为淡绿色的树叶的高维数据、颜色为弱绿色的树叶的高维数据、颜色为金色的树叶的高维数据、颜色为黄色的树叶的高维数据、颜色为黄绿色的树叶的高维数据、颜色为褐色的树叶的高维数据、颜色为茶色的树叶的高维数据、颜色为硬木色的树叶的高维数据，假如多个预设特征为绿色、黄色、褐色，则多个特征空间包括：预设特征为绿色对应的特征空间(绿色、淡绿色、弱绿色)、预设特征为黄色对应的特征空间(金色、黄色、黄绿色)、预设特征为褐色对应的特征空间(褐色、茶色、硬木色)。之后，第一服务器可以确定多个特征集合包括：预设特征为绿色对应的特征集合(颜色为绿色的树叶的高维数据、颜色为淡绿色的树叶的高维数据、颜色为弱绿色的树叶的高维数据)、预设特征为黄色对应的特征集合(颜色为金色的树叶的高维数
据、颜色为黄色的树叶的高维数据、颜色为黄绿色的树叶的高维数据)、预设特征为褐色对应的特征集合(颜色为褐色的树叶的高维数据、颜色为茶色的树叶的高维数据、颜色为硬木色的树叶的高维数据)。
72.s204、第一服务器根据目标特征，从多个特征集合中确定目标集合。
73.其中，目标集合为多个特征集合中，与目标特征的匹配度大于预设相似度阈值的特征集合。
74.示例性的，假如多个特征集合为颜色为弱绿色的树叶的高维数据、颜色为黄绿色的树叶的高维数据、颜色为茶色的树叶的高维数据。目标特征为草绿色，则弱绿色与目标特征的匹配度为70％，黄绿色与目标特征的匹配度为90％，茶色与目标特征的匹配度为40％。假如预设相似度阈值为80％，则目标集合为颜色为黄绿色的树叶的高维数据。
75.需要说明的是，本技术实施例中，对预设相似度阈值不作限定。例如，预设相似度阈值可以是90％。又例如，预设相似度阈值可以是80％。又例如，预设相似度阈值可以是85％。
76.在一种可能的实现方式中，第一服务器可以根据多个预设特征、第一数据集和多个特征集合，确定每个特征集合与目标特征的匹配度，之后，第一服务器可以比较每个特征集合与目标特征的匹配度，将匹配度大于预设相似度阈值的特征集合作为目标集合。
77.在本技术实施例中，如图3所示，在s204之前，该数据可视化的处理方法还可以包括：s301-s303。
78.s301、第一服务器根据多个预设特征和第一数据集，确定第一信息熵。
79.其中，第一信息熵用于指示第一数据集中的高维数据与目标特征之间的匹配度。
80.在一种可能的实现方式中，在第一服务器确定多个预设特征之后，第一服务器可以根据多个预设特征中每个预设特征对应的高维数据的数量与第一数据集中的高维数据的数量，确定第一比值。
81.在一种可能的设计中，第一比值可以通过公式一表示。
[0082][0083]
其中，pk用于表示y个预设特征中第k个预设特征对应的高维数据的数量与第一数据集中的高维数据的数量的比值，k∈{1，2，...，y}，sk用于表示y个预设特征中第k个预设特征对应的高维数据的数量，m用于表示第一数据集中的高维数据的数量，y、k和m均为正整数。
[0084]
之后，第一服务器可以根据第一比值，确定第一信息熵。
[0085]
在一种可能的设计中，第一信息熵可以通过公式二表示。
[0086][0087]
其中，ent(d)用于表示第一信息熵，d用于表示第一数据集。
[0088]
需要说明的是，在本技术实施例中，第一数据集中的高维数据与目标特征之间的匹配度是指，第一数据集中的目标类型的高维数据的纯度。信息熵越小，说明数据集d中的高维数据对应的的类型越少，数据集d的纯度越高，即第一数据集的纯度越高。当信息熵为最小值0时，说明数据集d中只有一种类型的数据，即第一数据集中只有一种类型的高维数据。
[0089]
需要说明的是，在本技术实施例中，信息熵和第一数据集中的高维数据与目标特征之间的匹配度成反比。也就是说，信息熵越大，第一数据集中的高维数据与目标特征之间的匹配度越低；信息熵越小，第一数据集中的高维数据与目标特征之间的匹配度越高。
[0090]
s302、第一服务器根据多个预设特征和多个特征集合，确定多个第二信息熵。
[0091]
其中，第二信息熵用于指示特征集合与目标特征之间的匹配度，一个特征集合对应一个第二信息熵。
[0092]
在一种可能的实现方式中，对于每个第二信息熵，第一服务器可以根据第一操作确定每个第二信息熵。第一操作可以包括：第一服务器可以根据第一预设特征对应的特征空间的特征点对第一特征集合进行分裂，得到分裂后的数据集，第一预设特征为多个预设特征中任一预设特征，第一特征集合为多个特征集合中与第一预设特征对应的特征集合。之后，第一服务器可以根据第一预设特征对应的特征空间的特征点数量、分裂后的数据集中每个数据集的高维数据的数量和分裂后的数据集的信息熵，确定第一子信息熵，第一子信息熵为第一特征集合的信息熵。
[0093]
在一种可能的设计中，第二信息熵可以通过公式三表示。
[0094][0095]
其中，t用于表示第一子信息熵，x用于表示第一预设特征对应的特征空间中的特征点的数量，v用于表示第一预设特征对应的特征空间中的第v个特征点，用于表示第v个特征点对应的分裂后的数据集的高维数据的数量与第一数据集中高维数据的数量的比值，ent(dv)用于表示第v个特征点对应的分裂后的数据集的信息熵，x和v均为正整数。
[0096]
s303、第一服务器根据第一信息熵和多个第二信息熵，确定多个信息增益。
[0097]
其中，一个信息增益与一个特征集合对应，信息增益用于指示特征集合与目标特征之间的匹配度。
[0098]
在一种可能的实现方式中，对于每个信息增益，第一服务器可以根据第二操作确定每个信息增益。第二操作可以包括：第一服务器可以根据第一信息熵和第一子信息熵，确定第一信息增益，第一信息增益为第一特征集合对应的信息增益。
[0099]
在一种可能的设计中，第一信息增益可以满足公式四。
[0100][0101]
其中，gain(d，a)用于表示第一预设特征对应的信息增益，a为第一预设特征。
[0102]
在本技术实施例中，如图3所示，s204可以包括s304和s305。
[0103]
s304、第一服务器对多个信息增益进行比较，确定目标增益。
[0104]
其中，目标增益为多个信息增益中最大的信息增益。
[0105]
示例性的，假如多个信息增益包括：15、20、10，则第一服务器可以确定目标增益为20。需要说明的是，在本技术实施例中，信息增益和特征集合与目标特征之间的匹配度成正比。也就是说，信息增益越大，特征集合与目标特征之间的匹配度越高；信息增益越小，特征集合与目标特征之间的匹配度越低。
[0106]
s305、第一服务器将目标增益对应的特征集合作为目标集合。
[0107]
示例性的，假如目标增益对应的特征集合为颜色为黄绿色的树叶的高维数据，则第一服务器可以确定目标集合为颜色为黄绿色的树叶的高维数据。
[0108]
可以理解的是，第一服务器可以根据多个预设特征和第一数据集，确定第一信息熵，第一信息熵用于指示第一数据集中的高维数据与目标特征之间的匹配度。然后，第一服务器可以根据多个预设特征和多个特征集合，确定多个第二信息熵，第二信息熵用于指示特征集合与目标特征之间的匹配度，一个特征集合对应一个第二信息熵。之后，第一服务器可以根据第一信息熵和多个第二信息熵，确定多个信息增益，信息增益用于指示特征集合与目标特征之间的匹配度。之后，第一服务器可以对多个信息增益进行比较，确定目标增益，目标增益为多个信息增益中最大的信息增益。之后，第一服务器可以将目标增益对应的特征集合作为目标集合。由于信息增益越大，特征集合与目标特征之间的匹配度越高。如此，目标增益对应的目标集合与目标特征的匹配度比较高，从而数据的准确率比较高，目标集合比较满足需求。
[0109]
s205、第一服务器对目标集合进行渲染处理。
[0110]
需要说明的是，在本技术实施例中，对渲染处理不作限定。例如，渲染处理可以是扫描线渲染处理。又例如，渲染处理可以是间接照明处理。又例如，渲染处理可以是光线追踪处理。
[0111]
可以理解的是，第一服务器可以获取多个高维数据并对多个高维数据进行分类，确定第一数据集，第一数据集包括目标类型对应的高维数据。之后，第一服务器可以根据决策树算法和多个预设特征对第一数据集进行分裂，确定多个特征集合，一个预设特征对应一个特征集合，多个预设特征为第一数据集中的高维数据的特征。也就是说，第一服务器可以根据第一数据集中的高维数据的特征对第一数据集进行划分，减少了数据的处理量。并且，第一服务器可以通过决策树算法进行分裂，能够进一步提高数据的准确率。之后，第一服务器可以根据目标特征，从多个特征集合中确定目标集合，目标集合为多个特征集合中，与目标特征的匹配度大于预设相似度阈值的特征集合。也就是说，目标集合中的高维数据的准确率更高。之后，第一服务器可以对目标集合进行渲染处理。这样一来，由于数据准确率的提高，该目标集合可以较好地满足需求，从而提高了数据可视化的效果。
[0112]
如图4所示，在s205之前，本技术实施例提供的一种数据可视化的处理方法还可以包括：
[0113]
s401、第一服务器确定目标集合对应的渲染任务信息。
[0114]
其中，渲染任务信息包括：渲染任务的数量和每个渲染任务的任务时长。
[0115]
在一种可能的实现方式中，第一服务器可以根据目标集合中高维数据的数量，渲染任务的数量和每个渲染任务中高维数据的数量。之后，第一服务器可以根据每个渲染任务中高维数据的数量，确定每个渲染任务的任务时长。
[0116]
示例性的，假如目标集合中高维数据的数量为50，每个渲染任务可以渲染5个高维数据，第一服务器渲染一个高维数据需要12分钟。则渲染任务信息包括：渲染任务的数量为10个、每个渲染任务的任务时长为1小时。
[0117]
s402、第一服务器确定渲染任务的数量是否小于第一预设阈值，且每个渲染任务的任务时长是否小于第二预设阈值。
[0118]
在一些实施例中，若渲染任务的数量小于第一预设阈值，且每个渲染任务的任务
时长小于第二预设阈值，则执行s205。
[0119]
示例性的，假如目标集合对应的渲染任务信息包括：渲染任务的数量为4个、每个渲染任务的任务时长为50分钟，第一预设阈值为5个，第二预设阈值为1小时，则第一服务器可以对目标集合进行渲染处理。
[0120]
需要说明的是，在本技术实施例中，对第一预设阈值和第二与设阈值不作限定。第一预设阈值和第二预设阈值为第一服务器中数据渲染模块的处理范围。例如，第一预设阈值可以为5个，第二预设阈值可以为1小时。又例如，第一预设阈值可以为10个，第二预设阈值可以为2小时。又例如，第一预设阈值可以为7个，第二预设阈值可以为1.5小时。
[0121]
在一种可能的实现方式中，第一服务器可以包括多个渲染系统。第一服务器可以获取多个渲染系统的负载信息，负载信息用于反映渲染系统的负载量。第一服务器可以根据渲染任务信息和多个渲染系统的负载信息，将多个渲染任务分配至多个渲染系统。
[0122]
示例性的，假如渲染任务为6个，多个渲染系统包括：渲染系统a、渲染系统b、渲染系统c，渲染系统a的负载量为10％、渲染系统b的负载量为50％、渲染系统c的负载量为25％，则第一服务器可以将3个渲染任务分配给渲染系统a，将1个渲染任务分配给渲染系统b，将2个渲染任务分配给渲染系统c。
[0123]
也就是说，第一服务器可以多个渲染系统的负载信息，对渲染任务进行分配，如此，可以避免渲染系统负载过高或者过低，保障了负载均衡，提高了第一服务器渲染处理的效率。
[0124]
在一些实施例中，若渲染任务的数量小于第一预设阈值，且每个渲染任务的任务时长小于第二预设阈值，则执行s205。若渲染任务的数量大于第一预设阈值，且每个渲染任务的任务时长大于第二预设阈值，则执行s501-s504。
[0125]
如图5所示，本技术实施例提供的一种数据可视化的处理方法，该方法可以包括：
[0126]
s501、第一服务器将目标集合划分为第二数据集和第三数据集。
[0127]
其中，目标集合包括第二数据集和第三数据集。
[0128]
在一种可能的实现方式中，第一服务器可以根据第一预设阈值和第二预设阈值对目标集合进行划分，确定第二数据集和第三数据集。
[0129]
示例性的，假如目标集合对应的渲染任务信息包括：渲染任务的数量为15个、每个渲染任务的任务时长为2.5小时，第一预设阈值为5个，第二预设阈值为1小时，则第一服务器可以确定第二数据集中的高维数据对应的渲染任务信息包括：渲染任务的数量为5个、每个渲染任务的任务时长为1小时，第三数据集中的高维数据对应的渲染任务信息包括：渲染任务的数量为10个、每个渲染任务的任务时长为1.5小时。
[0130]
s502、第一服务器对第二数据集进行渲染处理。
[0131]
需要说明的是，对于第一服务器对第二数据集进行渲染处理的介绍，可以参考s205中第一服务器对目标集合进行渲染处理的描述，此处不予赘述。
[0132]
s503、第一服务器向第二服务器发送渲染消息。
[0133]
其中，渲染消息包括第三数据集，渲染消息用于指示第二服务器渲染第三数据集。
[0134]
在本技术实施例中，在第一服务器向第二服务器发送渲染消息之后，第二服务器可以接收来自第一服务器的渲染消息。之后，第二服务器可以对第三数据集进行渲染处理，得到渲染数据，渲染数据为对第三数据集渲染后的数据。之后，第二服务器可以向第一服务
器发送渲染数据。
[0135]
在一种可能的设计中，第二服务器中设置有云渲染系统，第二服务器可以通过云渲染系统对第三数据集进行渲染，确定渲染数据。
[0136]
在另一种可能的设计中，第二服务器可以为区块链服务器，区块链服务器中设置有多个云渲染系统。在第二服务器接收到来自服务器的渲染消息后，第二服务器中可以将第三数据集分配给多个云渲染系统进行渲染，确定渲染数据。
[0137]
在另一种可能的设计中，第二服务器可以为区块链服务器，区块链服务器中设置有多个云渲染系统。第二服务器中的多个云渲染系统可以进行资源竞争，对第三数据集进行渲染，确定渲染数据。
[0138]
s504、第一服务器接收来自第二服务器的渲染数据。
[0139]
其中，渲染数据为对第三数据集渲染后的数据。
[0140]
在本技术实施例中，对目标集合进行渲染处理后的数据包括：第一服务器对第二数据集渲染后的数据和渲染数据。
[0141]
可以理解的是，第一服务器可以确定目标集合对应的渲染任务信息，渲染任务信息包括：渲染任务的数量和每个渲染任务的任务时长。若渲染任务的数量小于第一预设阈值，且每个渲染任务的任务时长小于第二预设阈值，第一服务器可以对目标集合进行渲染处理。若渲染任务的数量大于第一预设阈值，且每个渲染任务的任务时长大于第二预设阈值，第一服务器可以对第二数据集进行渲染处理。之后，第一服务器可以向第二服务器发送渲染消息，渲染消息包括第三数据集，渲染消息用于指示第二服务器渲染第三数据集。目标集合包括第二数据集和第三数据集。第一服务器可以接收来自第二服务器的渲染数据，渲染数据为对第三数据集渲染后的数据。也就是说，在渲染任务较重的情况下，可以通过第一服务器和第二服务器共同对目标集合进行渲染处理。如此，可以减少第一服务器渲染的任务数量和任务时间，从而提高了渲染的效率。
[0142]
上述主要从计算机设备的角度对本技术实施例提供的方案进行了介绍。可以理解的是，计算机设备为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本技术所公开的实施例描述的各示例的数据可视化的处理方法步骤，本技术能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本技术的范围。
[0143]
本技术实施例还提供一种数据可视化的处理装置。该数据可视化的处理装置可以为计算机设备，也可以是上述计算机设备中的cpu，还可以是上述计算机设备中用于处理数据可视化的处理模块，还可以是上述计算机设备中用于处理数据可视化的客户端。
[0144]
本技术实施例可以根据上述方法示例对数据可视化的处理进行功能模块或者功能单元的划分，例如，可以对应各个功能划分各个功能模块或者功能单元，也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块或者功能单元的形式实现。其中，本技术实施例中对模块或者单元的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。
[0145]
如图6所示，为本技术实施例提供的一种数据可视化的处理装置的结构示意图。数
据可视化的处理装置用于执行图2、图3、图4和图5所示的数据可视化的处理方法。数据可视化的处理装置可以包括获取模块601和处理模块602。
[0146]
获取模块601，用于获取多个高维数据。处理模块602，用于对多个高维数据进行分类，确定第一数据集，第一数据集包括目标类型对应的高维数据。处理模块602，还用于根据决策树算法和多个预设特征对第一数据集进行分裂，确定多个特征集合，一个预设特征对应一个特征集合，多个预设特征为目标集合中的高维数据的特征。处理模块602，还用于根据目标特征，从多个特征集合中确定目标集合，目标集合为多个特征集合中，与目标特征的匹配度大于预设相似度阈值的特征集合。处理模块602，还用于对目标集合进行渲染处理。
[0147]
可选的，处理模块602，具体用于根据多个预设特征和第一数据集，确定第一信息熵，第一信息熵用于指示第一数据集中的高维数据与目标特征之间的匹配度。处理模块602，还用于根据多个预设特征和多个特征集合，确定多个第二信息熵，第二信息熵用于指示特征集合与目标特征之间的匹配度，一个特征集合对应一个第二信息熵。之后，处理模块602，还用于根据第一信息熵和多个第二信息熵，确定多个信息增益，信息增益用于指示特征集合与目标特征之间的匹配度。然后，处理模块602，具体用于将多个信息增益进行比较，确定目标增益，目标增益为多个信息增益中最大的信息增益。处理模块602，还用于将目标增益对应的特征集合作为目标集合。
[0148]
可选的，处理模块602，具体用于确定目标集合对应的渲染任务信息，渲染任务信息包括：渲染任务的数量和每个渲染任务的任务时长。处理模块602，还用于若渲染任务的数量小于第一预设阈值，且每个渲染任务的任务时长小于第二预设阈值，则对目标集合进行渲染处理。
[0149]
可选的，处理模块602，具体用于若渲染任务的数量大于第一预设阈值，且每个渲染任务的任务时长大于第二预设阈值，则对第二数据集进行渲染处理。处理模块602，还用于向第二服务器发送渲染消息，渲染消息包括第三数据集，渲染消息用于指示第二服务器渲染第三数据集。之后，处理模块602，还用于接收来自第二服务器的渲染数据，渲染数据为对第三数据集渲染后的数据。
[0150]
图7是根据一示例性实施例示出的一种数据可视化的处理装置的硬件结构示意图。该数据可视化的处理装置可以包括处理器701，处理器701用于执行应用程序代码，从而实现本技术中的数据可视化的处理方法。
[0151]
处理器701可以是一个中央处理器(central processing unit，cpu)，微处理器，特定应用集成电路(application-specific integrated circuit，asic)，或一个或多个用于控制本技术方案程序执行的集成电路。
[0152]
如图7所示，数据可视化的处理装置还可以包括存储器702。其中，存储器702用于存储执行本技术方案的应用程序代码，并由处理器701来控制执行。
[0153]
存储器702可以是只读存储器(read-only memory，rom)或可存储静态信息和指令的其他类型的静态存储设备，随机存取存储器(random access memory，ram)或者可存储信息和指令的其他类型的动态存储设备，也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory，eeprom)、只读光盘(compact disc read-only memory，cd-rom)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指
令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器702可以是独立存在，通过总线704与处理器701相连接。存储器702也可以和处理器701集成在一起。
[0154]
如图7所示，数据可视化的处理装置还可以包括通信接口703，其中，处理器701、存储器702、通信接口703可以相互耦合，例如，通过总线704相互耦合。通信接口703用于与其他设备进行信息交互，例如支持数据可视化的处理装置与其他装置的信息交互。
[0155]
需要指出的是，图7中示出的装置结构并不构成对该数据可视化的处理装置的限定，除图7所示部件之外，该数据可视化的处理装置可以包括比图示更多或更少的部件，或者组合某些部件，或者不相同的部件布置。
[0156]
在实际实现时，处理模块602所实现的功能可以由图7所示的处理器701调用存储器702中的程序代码来实现。
[0157]
本技术还提供了一种计算机可读存储介质，计算机可读存储介质上存储有指令，当计算机可读存储介质中的指令由计算机设备的处理器执行时，使得计算机能够执行上述所示实施例提供的数据可视化的处理方法。例如，计算机可读存储介质可以为包括指令的存储器702，上述指令可由计算机设备的处理器701执行以完成上述方法。可选地，计算机可读存储介质可以是非临时性计算机可读存储介质，例如，非临时性计算机可读存储介质可以是rom、ram、cd-rom、磁带、软盘和光数据存储设备等。
[0158]
图8示意性地示出本技术实施例提供的计算机程序产品的概念性局部视图，计算机程序产品包括用于在计算设备上执行计算机进程的计算机程序。
[0159]
在一个实施例中，计算机程序产品是使用信号承载介质800来提供的。信号承载介质800可以包括一个或多个程序指令，其当被一个或多个处理器运行时可以提供以上针对图2、图3、图4和图5描述的功能或者部分功能。因此，例如，参考图2中所示的实施例，s201～s205的一个或多个特征可以由与信号承载介质800相关联的一个或多个指令来承担。此外，图8中的程序指令也描述示例指令。
[0160]
在一些示例中，信号承载介质800可以包含计算机可读介质801，诸如但不限于，硬盘驱动器、紧密盘(cd)、数字视频光盘(dvd)、数字磁带、存储器、只读存储记忆体(read-only memory，rom)或随机存储记忆体(random access memory，ram)等等。
[0161]
在一些实施方式中，信号承载介质800可以包含计算机可记录介质802，诸如但不限于，存储器、读/写(r/w)cd、r/w dvd、等等。
[0162]
在一些实施方式中，信号承载介质800可以包含通信介质803，诸如但不限于，数字和/或模拟通信介质(例如，光纤电缆、波导、有线通信链路、无线通信链路、等等)。
[0163]
信号承载介质800可以由无线形式的通信介质803来传达。一个或多个程序指令可以是，例如，计算机可执行指令或者逻辑实施指令。
[0164]
在一些示例中，诸如针对图6描述的数据可视化的处理装置可以被配置为响应于通过计算机可读介质801、计算机可记录介质802、和/或通信介质803中的一个或多个程序指令，提供各种操作、功能、或者动作。
[0165]
通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不相同的功能模块完成，即将装置的内部结构划分成不相同的功能模块，以
完成以上描述的全分类部或者部分功能。
[0166]
在本技术所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个装置，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
[0167]
作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是一个物理单元或多个物理单元，即可以位于一个地方，或者也可以分布到多个不相同地方。可以根据实际的需要选择其中的部分或者全分类部单元来实现本实施例方案的目的。
[0168]
另外，在本技术各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
[0169]
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个可读取存储介质中。基于这样的理解，本技术实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全分类部或部分可以以软件产品的形式体现出来，该软件产品存储在一个存储介质中，包括若干指令用以使得一个设备(可以是单片机，芯片等)或处理器(processor)执行本技术各个实施例方法的全分类部或部分步骤。而前述的存储介质包括-u盘、移动硬盘、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
[0170]
以上，仅为本技术的具体实施方式，但本技术的保护范围并不局限于此，任何在本技术揭露的技术范围内的变化或替换，都应涵盖在本技术的保护范围之内。因此，本技术的保护范围应以权利要求的保护范围为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种基于大数据的碳交易市场智能分析预测方法及系统与流程

数据可视化的处理方法、装置及存储介质与流程

相关文献

最热文献