一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据分析方法与装置与流程

2022-06-05 12:42:27 来源:中国专利 TAG:


1.本技术涉及人工智能技术,尤其涉及一种数据分析方法与装置。


背景技术:

2.随着互联网行业的发展,可以监控用户在网页上的触发操作。例如,商家服务器可以记录用户对网页的每次点击操作、及浏览操作等行为,并记录成时序流量数据。如此,商家可以利用预训练的模型,对时序流量数据进行分析,得到分析结果。如此,商家可以参考分析结果进行业务开展。
3.目前,在模型的建立过程中,开发工程师需要对时序流量数据的表现的特征和规律进行深度挖掘,以便构建训练样本训练模型。如此,需要开发工程师花费大量的时间和精力熟悉网络业务,以便挖掘时序流量数据的表现的特征和规律,时间成本和人工成本高。


技术实现要素:

4.本技术提供一种数据分析方法与装置,用以解决建立模型的过程中,需要的时间成本和人工成本高的问题。
5.第一方面,本技术提供一种数据分析方法,应用于第一终端,所述方法包括:
6.第一终端接收用户输入的样本的筛选条件、模型配置参数以及待分析数据的筛选条件,样本的筛选条件包括用于指示第一时序流量的特征的流量类型参数,第一时序流量为第一时段内在第一服务器上运行的目标网页被第一终端触发时产生的;待分析数据的筛选条件包括用于指示第二时序流量的特征的流量类型参数,第二时序流量为第二时段内在第一服务器上运行的目标网页被第一终端触发时产生的,模型配置参数用于配置待训练网络的训练方式和训练目标,第二时段与第一时段没有重叠;
7.第一终端向第二服务器发送样本的筛选条件、模型配置参数以及数据筛选条件,用于第二服务器根据样本的筛选条件、模型配置参数训练模型;
8.第一终端接收来自第二服务器的数据分析结果,数据分析结果是第二服务器根据模型和待分析数据的筛选条件得到的。
9.第二方面,本技术还提供一种数据分析方法,应用于第二服务器,所述方法包括:
10.第二服务器接收来自第一终端的样本的筛选条件、模型配置参数以及待分析数据的筛选条件,其中,样本的筛选条件包括用于指示第一时序流量的特征的流量类型参数,第一时序流量为第一时段内在第一服务器上运行的目标网页被第一终端触发时产生的;待分析数据的筛选条件包括用于指示第二时序流量的特征的流量类型参数,第二时序流量为第二时段内在第一服务器上运行的目标网页被第一终端触发时产生的,所述模型配置参数用于配置待训练网络的训练方式和训练目标,第二时段与第一时段没有重叠;
11.第二服务器根据样本的筛选条件,从第一服务器中提取第一时序流量,以及根据待分析数据的筛选条件,从第一服务器中提取第二时序流量;
12.第二服务器提取第一时序流量的特征作为样本和第二时序流量的特征作为待分
析数据;
13.第二服务器将待分析数据输入到模型内进行数据分析,生成数据分析结果;其中,模型是第二服务器根据模型配置参数生成待训练网络后,将样本输入到待训练网络训练而成的;
14.第二服务器向第一终端发送数据分析结果。
15.第三方面,本技术还提供一种数据分析装置,应用于第一终端,该装置包括:
16.信息获取单元,用于接收用户输入的样本的筛选条件、模型配置参数以及待分析数据的筛选条件,样本的筛选条件包括用于指示第一时序流量的特征的流量类型参数,第一时序流量为第一时段内在第一服务器上运行的目标网页被第一终端触发时产生的;待分析数据的筛选条件包括用于指示第二时序流量的特征的流量类型参数,第二时序流量为第二时段内在第一服务器上运行的目标网页被第一终端触发时产生的,模型配置参数用于配置待训练网络的训练方式和训练目标,第二时段与第一时段没有重叠;
17.信息收发单元,用于向第二服务器发送样本的筛选条件、模型配置参数以及数据筛选条件,用于第二服务器根据样本的筛选条件、模型配置参数训练模型;
18.信息收发单元,还用于接收来自第二服务器的数据分析结果,数据分析结果是第二服务器根据模型和待分析数据的筛选条件得到的。
19.第四方面,本技术还提供一种电子设备,包括:存储器,处理器;
20.存储器;用于存储所述处理器可执行指令的存储器;
21.其中,处理器被配置为执行如本技术第一方面或第二方面提供的数据分析方法。
22.第五方面,本技术还提供一种所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如本技术第一方面提供的数据分析方法。
23.第六方面,本技术还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如本技术第一方面或第二方面提供的数据分析方法。
24.本技术提供的数据分析方法与装置,业务人员可以在第一终端输入样本的筛选条件、模型配置参数以及待分析数据的筛选条件,并发送到第二服务器。第二服务器可以根据样本的筛选条件自动提取训练样本,并将训练样本输入到根据模型配置参数构建的待训练网络中,自动训练模型。进而,第二服务器根据训练好的模型和待分析数据的筛选条件分析数据。如此,实现了由业务人员在终端侧直接控制第二服务器自动训练模型,以及根据训练好的模型分析数据。如此,无需开发人员介入,即可实现模型的训练和数据分析,节省了大量的时间成本和人力成本,效率高。
附图说明
25.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
26.图1为本技术实施例提供的数据分析系统的交互示意图;
27.图2为本技术实施例提供的数据分析方法的流程图;
28.图3为本技术实施例提供的第一终端显示的第一界面的界面示意图;
29.图4为本技术实施例提供的数据分析系统的架构示意图;
30.图5为本技术实施例提供的算法模型平台的架构示意图;
31.图6为本技术实施例提供的测试结果的示意图;
32.图7为本技术实施例提供的第二服务器与第一终端的交互示意图;
33.图8为本技术实施例提供的数据分析装置的功能模块框图;
34.图9为本技术实施例提供的电子设备的电路连接框图。
35.通过上述附图,已示出本技术明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本技术构思的范围,而是通过参考特定实施例为本领域技术人员说明本技术的概念。
具体实施方式
36.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
37.当用户在浏览网页时,服务器可以记录用户对网页在不同时刻的触发行为,且记录的数据即时序流量。进而,程序开发人员可以挖掘时序流量趋势和规律,提取出多个业务特征;并借助多个业务特征构建训练样本,以训练模型,其中,训练好的模型可以用于数据分析。
38.目前,由于程序开发人员不熟悉业务,需要花费大量的时间和精力研究时序流量的趋势和规律,才能提取出时序流量的多个业务特征,以便用于训练模型,如此,效率非常低。
39.有鉴于于此,本技术实施例提供了一种数据分析方法,业务人员可以在第一终端输入样本的筛选条件、模型配置参数以及待分析数据的筛选条件,并发送到第二服务器。第二服务器可以根据样本的筛选条件自动提取训练样本,并将训练样本输入到根据模型配置参数构建的待训练网络中,自动训练模型。进而,第二服务器根据训练好的模型和待分析数据的筛选条件分析数据。如此,实现了由业务人员在终端侧直接控制第二服务器自动训练模型,以及根据训练好的模型分析数据。如此,无需开发人员介入,节省了大量的时间成本和人力成本,效率高。
40.下面以具体地实施例对本技术的技术方案以及本技术的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本技术的实施例进行描述。
41.本技术实施例提供的一种数据分析方法,应用于数据分析系统。如图1所示,数据分析系统包括第一终端100、第二终端400、第一服务器300和第二服务器200。第二服务器200分别与第一终端100、第一服务器300通信连接,第二终端400与第一服务器300通信连接。其中,第一终端100可以为业务人员的电脑,第二终端400可以为客户的手机。客户可以使用第二终端400访问运行在第一服务器300的目标网页,并在目标网页触发点击行为、下单行为以及支付行为等,在此不作限定。如图2所示,本技术实施例提供的数据分析方法包括:
42.s201:第一终端100显示第一界面301,第一界面301包括文本输入区域302。
43.用户可以在文本输入区域302中输入样本的筛选条件、模型配置参数以及待分析数据的筛选条件。
44.如图3所示,用户输入的样本的筛选条件可以包括目标网页中的对象“服饰”、样本提取时段“2020.01.01-2020.12.31”、样本放大系数0.0001、第一时序流量的特征“总点击量、平均点击量以及点击量的极差”、以及提取特征的单位时长“1天”。用户输入的模型配置参数可以包括训练精度“普通”、训练目标“分类”以及测试样本与训练样本的占比“0.1”。用户输入的待分析数据的筛选条件可以包括目标网页中的对象“服饰”,数据提取时段“2021.01.01-2021.07.01”以及提取特征的单位时长“1天”,第二时序流量的特征“总点击量、平均点击量以及点击量的极差”。可以理解地,上述输入的样本的筛选条件、模型配置参数以及待分析数据的筛选条件仅仅举例说明,在此不作限定。
45.s202:第一终端100接收用户在文本输入区域302输入的样本的筛选条件、模型配置参数以及待分析数据的筛选条件。
46.如图4所示,第一终端100包括样本的筛选模块、模型配置模块以及待分析数据筛选模块。其中,样本的筛选模块可以用于接收输入的样本的筛选条件,模型配置模块用于接收模型配置参数,待分析数据筛选模块用于获取待分析数据的筛选条件。
47.其中,样本的筛选条件包括用于指示第一时序流量的特征的流量类型参数,第一时序流量为第一时段内在第一服务器上运行的目标网页被第一终端100触发时产生的。可以理解地,指示第一时序流量的特征的流量类型参数可以为第一时段内的每个单位时长对目标网页的总点击量、第一时段内的每个单位时长分别对目标网页的点击量的平均值,以及第一时段内的每个单位时长对目标网页的点击量的极差。其中,提取特征的单位时长可以为上述的“1天”,目标网页可以为上述的包含可以用于点击“服饰”选项的网页。当“服饰”选项每在目标网页上被点击一次时,记录一次在被点击时刻的点击行为。
48.待分析数据的筛选条件包括用于指示第二时序流量的特征的流量类型参数,第二时序流量为第二时段内在第一服务器上运行的目标网页被第一终端100触发时产生的。第二时段与第一时段没有重叠。其中,指示第二时序流量的特征的流量类型参数可以为第二时段内的每个单位时长对目标网页的总点击量、第二目标时段内的每个单位时长对目标网页的点击量的平均值,以及第二目标时段内的每个单位时长对目标网页的点击量的极差。单位时长可以为上述的“1天”;目标网页可以为上述的包含可以用于点击“服饰”选项的网页。当“服饰”选项每在目标网页上被点击一次时,记录一次在被点击时刻的点击行为。
49.模型配置参数用于配置待训练网络的训练方式和训练目标。示例性地,模型配置参数包括用于指示训练精度的信息、测试样本与训练样本的比例、以及用于指示训练目标的信息。其中,用于指示训练精度的信息可以包括“普通”、测试样本与训练样本的占比“0.1”,用于指示训练目标的信息可以包括上述的“分类”。
50.s203:第一终端100向第二服务器200发送样本的筛选条件、模型配置参数以及数据筛选条件,用于第二服务器200根据样本的筛选条件、模型配置参数训练模型。
51.s204:第二服务器200根据样本的筛选条件,从第一服务器中提取第一时序流量,以及根据待分析数据的筛选条件,从第一服务器中提取第二时序流量。
52.仍如图4所示,第二服务器200包括模型训练服务器和线上服务器。其中,模型训练服务器运行有算法模型平台,算法模型平台包括样本提取模块和模型训练模块。需要说明
的是,模型训练服务器为模型训练提供了必要的运行环境,如tensorflow分布式环境、pytorch运行环境等。线上服务器运行有模型部署平台,模型部署平台包括模型部署模块和数据解析模块。
53.例如,第二服务器200可以通过样本提取模块从第一服务器中提取在第一时段“2020.01.01-2021.12.31”的目标网页中“服饰”选项在不同时刻的点击行为作为第一时序流量;以及从第一服务器中提取在第二时段“2021.01.01-2021.07.01”的目标网页中“服饰”选项在不同时刻的点击行为作为第二时序流量。
54.s205:第二服务器200提取第一时序流量的特征作为样本和第二时序流量的特征作为待分析数据。
55.可以理解地,提取第一时序流量的特征和第二时序流量特征的功能,可以通过图4中的样本提取模块实现。另外,图4中的数据解析模块还用于将第一时序流量和第二时序流量转换为可以供模型识别的格式,以便后续能够被模型识别。
56.示例性地,若第一时序流量中携带的信息为每隔0.5h的点击量。例如,第二服务器200可以根据提取特征的单位时长“1天”,计算第一时序流量的日总点击量、日点击量的平均值以及日点击量的极差。可以理解地,同一天的日总点击量、日点击量的平均值以及日点击量的极差可以作为一个训练样本。
57.示例性地,若第二时序流量中携带的信息为每隔0.5h的点击量。例如,第二服务器200可以根据提取特征的单位时长“1天”,计算第二时序流量中日总点击量、日点击量的平均值以及日点击量的极差。可以理解地,第二时序流量中同一天的日总点击量、日点击量的平均值以及日点击量的极差即待分析数据。
58.另外,第一终端还可以接收用户输入的标记条件,第一终端向第二服务器发送标记条件,用于第二服务器对满足标记条件的样本标记标签。其中,标签用于作为训练模型的特征。
59.示例性地,标记条件可以为符合目标时段的样本。例如,目标时段可以包括11月11日、12月12日、大年初一、以及正月初六,则可以对处于11月11日、12月12日、大年初一、以及正月初六的提取样本标记标签(其中,标签可以是样本被提取的时段,也可以是其他的标签,在此不作限定)。可以理解地,根据标记有标签的样本训练的模型,可靠性更高。
60.s206:第二服务器200将待分析数据输入到模型内进行数据分析,生成数据分析结果。
61.其中,模型是第二服务器200根据模型配置参数生成待训练网络后,将训练样本输入到待训练网络训练而成的。其中,第二服务器200可以通过上述的算法模型平台完成训练模型的操作。
62.图5为本技术实施例提供的算法模型平台的架构示意图。如图5所示,第二服务器200可以包括接口层、数据层、特征层、模型层以及文件层。其中,接口层可以包括数据接口、参数接口以及监控接口。数据接口用于从第一服务器获取第一时序流量和第二时序流量,参数接口用于接收来自第一终端100的样本的筛选条件、模型配置参数以及数据筛选条件,监控接口用于在训练模型时,检测第二服务器200的内部运行状态。数据层包括数据解析模块和样本处理模块,其中,数据解析模块用于对采集的第一时序流量进行格式处理,以便能够输入模型进行训练,样本处理模块用于从第一时序流量中提取训练样本。特征层包括特
征逻辑管理模块、特征选择模块以及特征评估模块,其中,特征逻辑管理模块包括特征生成函数的逻辑代码;特征选择模块,用于从样本处理模块得到的训练样本,并加入模型;特征评估模块,用于评估每个训练样本中的每个特征在训练模型中的重要程度,以便业务人员了解模型及数据特点。模型层包括模型训练模块和模型测试模块。其中,模型训练模块包括模型训练时使用的软件代码(即网络框架文件),通过结合输入的训练样本和模型配置参数即可训练所需的模型;模型测试模块用于在模型训练完毕后,测试模型准确性、稳定性等指标。数据层包括数据管理模块。数据管理模块用于管理和存储输入的样本的筛选条件、模型配置参数、数据筛选条件、第一时序流量、以及第二时序流量等参数。
63.由于第二服务器200具有上述的架构,因此可以实现上述的训练模型的功能。
64.仍如图4所示,第二服务器200还可以包括线上服务器、数据服务器以及前端服务器。模型训练服务器可以将训练好的模型部署到线上服务器,数据分析模块可以将提取的待分析数据上传到数据服务器。数据服务器将待分析数据传到线上服务器,使得线上服务器根据部署的模型对待分析数据进行分析,并将分析结果发送至前端服务器。前端服务器可以将分析结果发送到第一终端100的显示模块显示,以供用户查阅。
65.示例性地,样本包括多个子样本集合。训练模型的过程可以为:当指示训练精度的信息为“普通”、根据指示训练目标的信息为“分类”时,第二服务器200根据训练精度的信息“普通”查找残差阈值,以及根据训练目标的信息“分类”查找模型文件。第二服务器200根据模型文件和残差阈值,生成待训练网络。第二服务器200将一个子样本集合输入待训练网络以训练模型,并输出训练结果。第二服务器200计算训练结果与设定的实际结果的实际残差。若实际残差大于残差阈值,则第二服务器200将下一个子样本集合输入待训练网络以训练模型,并输出新的训练结果。若实际残差小于或等于残差阈值,则停止训练,进而,得到分类模型。
66.如此,第二服务器200可以将上述的待分析数据输入到训练好的分类模型进行分类,得到分类结果。可以理解地,分类结果可以是第二时段中每个单位时长的第二时序流量的类别,也可以是整个第二时序流量的类别,在此不作限定。可见,分类结果即数据分析结果。
67.另外,上述的训练精度“普通”还可以被替换为“高”、或者“极高”,“高”、或者“极高”也分别对应不同的残差阈值。可以理解地,当训练精度“普通”被替换为“高”、或者“极高”时,得到的数据分析结果的可靠性也越高。
68.另外,可替换地,训练目标“分类”还可以替换为“预测”,如此,上述的模型为预测模型,数据分析结果为预测结果。例如,预测结果可以为2021.7.01-07.31的每天的点击量。可替换地,训练目标“分类”还可以替换为“异常检测”,如此,上述的模型为异常检测模型,数据分析结果为异常检测结果。例如,异常检测结果可以为“2021.6.18的点击量超过预设的阈值。”69.另外,第一终端100的第一界面301还包括第一控件303,第一终端100响应于对第一控件303的操作,向第二服务器200发送测试指令。其中,测试指令用于指示第二服务器200测试模型。
70.仍如图4所示,第一终端还可以包括数据测试模块,上述的模型训练平台还可以包括模型测试模块。第一终端100可以通过数据测试模块响应于对第一控件303的操作,向模
型测试模块发送测试指令。
71.以上述的测试样本与训练样本的占比为“0.1”为例,假设从第一时序流量中提取到100个样本,则90个样本用于作为模型训练的待训练样本,10个样本作为模型验证的测试样本(即测试样本是根据测试样本与训练样本的占比,从基于样本的筛选条件获取的样本中确定的)。以训练目标为“预测”、上述的模型为预测模型,数据分析结果为2021.7.01-07.31的每天的点击量为例,上述的模型测试模块响应于测试指令将10个测试样本输入到训练好的预测模型中,得到测试结果。
72.第一终端100接收来自第二服务器200的测试结果。其中,如图6所示,测试结果可以为预测结果和实际结果的对比图。当然地,测试结果还可以为测试结果与预测结果的差值(附图中未示意出),例如,平均百分比误差mape和wmape百分误差等,在此不作限定。第一终端100在第一界面301显示测试结果,以供用户查阅。
73.s207:第一终端100接收来自第二服务器200的数据分析结果,数据分析结果是第二服务器200根据模型和待分析数据的筛选条件得到的。
74.第一终端100可以在第一界面301显示数据分析结果,以供业务人员查阅。
75.需要说明的是,上述的图4中的第二服务器200包括模型训练服务器、线上模型服务器、数据服务器以及前端服务器为例说明的。可以替换地,上述的第二服务器200也可以是一个独立设置的服务器,在此不作限定。
76.可以理解地,上述s206-s207的过程可以归纳为:如图7所示,模型训练服务器获取样本、模型配置参数以及模型文件,并根据样本、模型配置参数以及模型文件,生成模型部署到线上服务器。数据服务器获取待分析数据上传到线上服务器。线上服务器根据模型对待分析数据进行分析,得到数据分析结果。线上服务器将数据分析结果上传到前端服务器,前端服务器将数据分析结果发送到第一终端100显示。
77.综上所述,该数据分析方法与装置,业务人员可以在第一终端输入样本的筛选条件、模型配置参数以及待分析数据的筛选条件,并发送到第二服务器。第二服务器可以根据样本的筛选条件自动提取训练样本,并将训练样本输入到根据模型配置参数构建的待训练网络中,自动训练模型。进而,第二服务器根据训练好的模型和待分析数据的筛选条件分析数据。如此,实现了由业务人员在终端侧直接控制第二服务器自动训练模型,以及根据训练好的模型分析数据。如此,无需开发人员介入,即可实现模型的训练和数据分析,节省了大量的时间成本和人力成本,效率高。
78.请参阅图8,本技术实施例还提供一种数据分析装置600,应用于第一终端100。需要说明的是,本技术实施例所提供的数据分析装置600,其基本原理及产生的技术效果和上述实施例相同,为简要描述,本技术实施例部分未提及之处,可参考上述的实施例中相应内容。如图8所示,本技术提供的数据分析装置600包括信息显示单元601、信息获取单元602、以及信息收发单元603。
79.信息显示单元601,用于显示第一界面301,第一界面301包括文本输入区域302。
80.信息获取单元602,用于接收用户在文本输入区域302输入的样本的筛选条件、模型配置参数以及待分析数据的筛选条件。
81.其中,样本的筛选条件包括用于指示第一时序流量的特征的流量类型参数,第一时序流量为第一时段内在第一服务器上运行的目标网页被第一终端100触发时产生的;待
分析数据的筛选条件包括用于指示第二时序流量的特征的流量类型参数,第二时序流量为第二时段内在第一服务器上运行的目标网页被第一终端100触发时产生的,模型配置参数用于配置待训练网络的训练方式和训练目标,第二时段与第一时段没有重叠。
82.其中,指示第一时序流量的特征的流量类型参数可以包括但不限于:第一时段内的每个单位时长对目标网页的总点击量、第一时段内的每个单位时长分别对目标网页的点击量的平均值,以及第一时段内的每个单位时长对目标网页的点击量的极差。
83.指示第二时序流量的特征的流量类型参数可以包括但不限于:第二时段内的每个单位时长对目标网页的总点击量、第二时段内的每个单位时长分别对目标网页的点击量的平均值,以及第二时段内的每个单位时长对目标网页的点击量的极差。
84.模型配置参数包括但不限于:用于指示训练精度的信息、测试样本与训练样本的比例、以及用于指示训练目标的信息。
85.信息收发单元603,用于向第二服务器200发送样本的筛选条件、模型配置参数以及数据筛选条件,用于第二服务器200根据样本的筛选条件、模型配置参数训练模型。
86.信息收发单元603,还用于接收来自第二服务器200的数据分析结果,数据分析结果是第二服务器200根据模型和待分析数据的筛选条件得到的。
87.在一种可能的实施方式中,第一终端100的第一界面301还包括第一控件303,信息收发单元603,还用于响应于第一控件303的操作,向第二服务器200发送测试指令。其中,测试指令用于指示第二服务器200测试模型。信息收发单元603,还用于接收来自第二服务器200的测试结果。信息显示单元601,还用于在第一界面301显示测试结果。
88.在一种可能的实施方式中,信息显示单元601,还用于在第一界面301显示数据分析结果。
89.图9是本技术实施例提供的电子设备的结构示意图。其中,电子设备可以为上述的第一终端。请参考图9,在硬件层面,该电子设备包括处理器,可选地,还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(random-access memory,ram),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。例如,该电子设备可以是主机。
90.处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是isa(industry standard architecture,工业标准体系结构)总线、pci(peripheral component interconnect,外设部件互连标准)总线或eisa(extended industry standard architecture,扩展工业标准结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
91.存储器,用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
92.处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成用于数据分析装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
93.显示第一界面301,第一界面301包括文本输入区域302;
94.接收用户在文本输入区域302输入的样本的筛选条件、模型配置参数以及待分析数据的筛选条件,样本的筛选条件包括用于指示第一时序流量的特征的流量类型参数,第一时序流量为第一时段内在第一服务器上运行的目标网页被第一终端触发时产生的;待分析数据的筛选条件包括用于指示第二时序流量的特征的流量类型参数,第二时序流量为第二时段内在第一服务器上运行的目标网页被第一终端触发时产生的,模型配置参数用于配置待训练网络的训练方式和训练目标,第二时段与第一时段没有重叠;
95.向第二服务器发送样本的筛选条件、模型配置参数以及数据筛选条件,用于第二服务器根据样本的筛选条件、模型配置参数训练模型;
96.接收来自第二服务器的数据分析结果,数据分析结果是第二服务器根据模型和待分析数据的筛选条件得到的。
97.上述如本技术图2所示实施例揭示的数据分析装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本技术中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本技术所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
98.该电子设备还可执行图2的方法,并实现数据分析装置在图2所示实施例的功能,本技术在此不再赘述。
99.当然,除了软件实现方式之外,本技术的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
100.本技术实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行图2所示实施例的方法。
101.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
102.本技术还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如本技术图2所示的数据分析方法。
103.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
104.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本技术的其它实施方案。本技术旨在涵盖本技术的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本技术的一般性原理并包括本技术未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本技术的真正范围和精神由下面的权利要求书指出。
105.应当理解的是,本技术并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本技术的范围仅由所附的权利要求书来限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献