一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

通过网站跟踪识别因特网服务提供商的机器学习分类器的制作方法

2022-02-20 05:13:00 来源:中国专利 TAG:

通过网站跟踪识别因特网服务提供商的机器学习分类器
1.相关申请的交叉引用
2.本技术要求于2019年4月25日提交的美国临时专利申请第62/838,782号的优先权,该美国临时专利申请的全部内容通过引用并入本文。
3.公开内容的背景
1.技术领域
4.本公开内容涉及用于商业智能、客户关系管理(crm)系统、营销自动化平台和网络分析系统的系统和方法。
2.

背景技术:

5.用于网络业务的当前系统——例如,如由crm系统、商业智能和网络分析系统使用的——想要用于区分网站上的业务类型(例如,人类业务与非人类业务)的解决方案。


技术实现要素:

6.期望能够准确地识别来自网站上的访问者客户端计算机活动的业务是因特网服务提供商(isp)还是非isp。通常依赖于已知isp或高知名商业(例如财富500强)的简单列表的方法和系统在识别客户端计算机网络业务的识别方面可能存在技术上的缺陷。这些方法产生许多误报(错误标记的isp)和漏报(错误标记的非isp)。它们也不利用来自访问者智能(vi)的网站上真实的、跟踪的网络业务数据。这些其他方法也无法使用本地公司名称识别全球业务。如本文中所描述的实施方式使用vi和机器智能来确定被跟踪实体是否是vi背景下的isp。
7.以下简要描述实施方式的一些方面的基本理解。其目的仅仅是以简化的形式呈现一些概念,作为稍后呈现的更详细的描述的序言。
8.本文中的描述是用于使用机器智能的计算机系统、方法和计算机程序产品的实施方式。
9.数据库、映射和分类器的布置提供了改进的潜在定位平台,该平台相比于当前的客户关系管理(crm)系统而言包括以下非限制性的优点。
10.在以下实施方式中,描述了被配置成执行用于识别网站上的isp业务的分析的系统及其过程。
11.因此,在实施方式中,本文中描述了一种方法和计算机系统以及针对由计算机系统执行的方法的计算机程序产品,该计算机系统包括一个或更多个处理器以及计算机可读存储介质,该计算机可读存储介质被编码有能够由处理器中的至少一个执行的指令,并且可操作地耦接至处理器中的至少一个,该方法包括:
12.获得网站数据业务内容,网站数据业务内容包括网站的ip地址数据;
13.将ip地址数据映射到商业实体标识符,以识别与网站数据业务数据相关联的商业实体;
14.获得与商业实体标识符相关联的每个商业实体的属性数据,以识别与映射到ip地址数据的商业实体相关联的商业属性;
15.根据网站数据业务内容和属性数据生成训练数据集,用于训练因特网服务提供商(isp)分类器以识别与所映射的网络业务数据相关联的isp;
16.将isp分类器应用于网站跟踪数据的数据库;以及
17.识别可归因于isp的网站的网站业务。
18.在实施方式中,该方法包括:
19.根据映射到商业实体标识符的网站业务数据获得ip地址的匹配接受率;以及
20.根据来自与商业实体标识符匹配的网站业务数据的ip地址生成训练数据集。
21.在实施方式中,该方法包括:用来自先前映射或匹配到其他商业实体的网站业务数据的先前识别的ip地址替换来自映射到商业实体标识符的网站业务数据的ip地址。
22.在实施方式中,该方法包括:生成用于训练isp分类器的模型;在训练数据集上对模型进行训练;确定经训练的模型是否准确地识别isp;以及在模型准确的情况下,将经训练的模型用作isp分类器。
23.在实施方式中,该方法包括:获得包括网站的ip地址数据的网站数据业务内容还包括:将跟踪代码对象放置在要跟踪的网站上;生成日志文件,日志文件识别由跟踪代码跟踪的所有ip和与ip相关联的cookie。
24.在实施方式中,网络业务数据包括针对每个ip地址的在时间窗口内访问网站的访问计数、独特访问者和索引客户计数。时间窗口可以包括选自以下的时间窗口:每周时间间隔、每两周间隔、每月间隔、每两月间隔和每季度间隔。与商业实体标识符相关联的每个商业实体的属性数据可以包括企业统计结构(firmographic)数据。企业统计结构属性数据可以包括年销售额、行业代码和员工计数。行业代码包括sic代码、naics代码或两者。分类器模型的特征集可以包括来自属性数据的企业统计结构数据和网络业务数据的特征,特征包括:naics、sic、独特访问者、访问计数、员工计数、年销售额和索引客户计数。
25.分类器模型可以包括选自以下的模型:决策树或梯度提升分类器。梯度提升分类器训练可以包括迭代梯度提升分类器约1000次迭代。
26.因此,如本文中所描述的实施方式提供了一种技术解决方案,该技术解决方案改进了依赖于主观人类判断和不太稳健的基于规则的机器识别的常规crm系统、商业智能系统和网络分析系统。
27.如本文中所描述的实施方式的示例性优点包括周期性地(例如:每月)运行并且使用最新的网络业务来重新分类isp的框架。该系统的实施方式通过提供围绕isp分类的可防御概率来提升vi的可信度。该系统还使用自动化方法、通过合并各种目标属性和特征来应用机器学习以对大型数据集进行分类。
28.如本文中所描述的系统相对于用于网络业务isp识别的其他系统和方法提供了明显的技术进步。可替选方法通常依赖于已知isp或高知名商业(例如财富500强)的简单列表。这些方法产生许多错误标记的非isp。它们也无法类推至已识别的商业的长尾。此外,它们不利用在网站上跟踪的真实网络业务数据的行为。本实施方式跟踪网站本身上的业务的行为,并使用该活动作为在确定与网络业务相关联的实体是否应被视为访问者智能背景下的isp时的信号。
附图说明
29.现在将参照附图仅通过示例的方式进一步描述实施方式。
30.图1是针对实施方式的逻辑架构的框图。
31.图2是示出根据实施方式的过程的流程图的图。
32.图3是示出根据实施方式的过程的流程图的图。
33.图4a至图4e示出了其中可以实践本实施方式的环境的实施方式。
34.图5示出了可以在诸如图3所示的系统中包括的网络计算机的实施方式。
35.图6示出了可以在诸如图3所示出的系统中包括的客户端计算机的实施方式。
36.图7示出了根据实施方式的示例图形用户界面。
具体实施方式
37.现在将在下文中参照附图更充分地描述各种实施方式,附图形成实施方式的一部分,并且通过图示的方式示出了可以实践本公开内容的具体实施方式。然而,实施方式可以以许多不同的形式来实施,并且不应当被解释为限于本文中阐述的实施方式。相反,提供这些实施方式使得本公开内容将是彻底的和完整的,并且将实施方式的范围充分地传达给本领域技术人员。除了其他事项之外,各种实施方式可以是方法、系统、介质或装置。因此,下面的详细描述不应被解释为限制性意义。
38.在整个说明书和权利要求书中,除非上下文另有明确规定,否则以下术语采用与本文中明确相关联的含义。术语“本文中”是指与当前申请相关联的说明书、权利要求和附图。如本文中使用的短语“在一个实施方式中”或“在实施方式中”不一定是指相同的实施方式,尽管可以指相同的实施方式。如下所述,在不脱离本公开内容的范围或精神的情况下,可以容易地组合本公开内容的各种实施方式。
39.此外,除非上下文另有明确规定,否则,如本文中所使用的,术语“或”是包含性的,并且等同于术语“和/或”。此外,在整个说明书中,“一”、“一个”和“该”的含义包括复数引用。“在......中”的含义包括“在......中”和“在......上”。
40.参照图1,该系统通常由附图标记100表示,并且示出了针对实施方式的逻辑架构和模块的框图。图2是示出根据实施方式的过程的流程图。在块202处,该系统被配置成摄取(ingest)网站的网络数据业务内容102的集合。该网络数据内容可以是被访问的网页内容(例如,产品页面、来自站点的任何网页)、ip地址、移动id和网络浏览器cookie。例如,在实施方式中,该系统可以被配置成包括身份解析和/或数据装载(onboarding)平台121或者与身份解析和/或数据装载平台121对接。例如,该系统可以执行身份解析或者与平台111、112、102、121(例如,诸如digital element
tm
、liveramp
tm
、neustar
tm
、acxiom
tm
等的平台)对接以访问和装载网络数据业务内容102,或者执行或获得用于与ip地址相关联的商业实体的身份解析数据。可以使用ip身份解析技术平台111和本领域已知的工具来完成身份解析,例如通过将cookie数据与ip地址进行匹配,同步cookie池等。
41.在实施方式中,将跟踪代码对象放置在要被跟踪的网站上。例如,可以将跟踪像素或javascript跟踪代码放置在网络服务器上。可以使用跟踪像素获取和分析以下数据:
42.·
使用的操作系统(提供有关使用移动装置的信息);
43.·
使用的网站或电子邮件的类型,例如在移动装置或台式装置上;
44.·
使用的客户端的类型,例如浏览器或邮件程序;
45.·
客户的屏幕分辨率;
46.·
阅读电子邮件或访问网站的时间;
47.·
会话期间网站上的活动(使用多个跟踪像素);
48.·
ip地址(提供有关因特网服务提供商和位置的信息);
49.·
识别由跟踪代码跟踪的所有ip和与ip相关联的cookie的日志文件。
50.因此,在实施方式中,该系统被配置成获得访问者智能(vi)数据105,例如数字元素文件、网络抓取器数据或其他装载工具。该系统被配置成聚合尤其包括访问网站上的内容的每个ip地址的访问计数、独特访问者和客户索引属性的网络业务数据。如本文中所描述,可以收集该数据以覆盖给定的时间窗口(例如:每周时间间隔、每两周间隔、每月间隔、每两月间隔和/或每季度间隔)。在实施方式中,可以汇总针对多个网站的vi 105网络业务数据以进行聚合跟踪和机器智能训练。
51.在块203处,该系统被配置成从商业实体企业统计结构数据库104a获得商业实体标识。在块204处,商业实体映射模块106被配置成映射网络业务数据内容102。在块204处,该系统被配置成将网络数据业务内容102映射到商业实体标识符,以识别访问每个网站的商业实体。
52.在块204处,商业实体平台20服务器可以包括商业实体身份解析模块103,该商业实体身份解析模块103将每一个网络业务ip地址与来自商业实体信息数据库104a的商业标识编号例如duns编号(在下文中简称为“duns”)匹配。在块205处,该系统可以被配置成确定成功匹配到商业标识符的ip地址的匹配率。稳健的商业信息数据库中的初始映射可以例如在10%至20%的匹配率(例如15%)。在块206处,该系统可以被配置成例如通过将来自映射到商业实体标识符的网站业务数据的ip地址替换或再映射(remapping)为来自映射或匹配至其他商业实体的网站业务数据的先前标识的ip地址来覆盖ip地址到商业标识符的匹配。
53.在实施方式中,该系统还可以被配置成对于给定的商业实体标识符,识别针对该给定的商业实体标识符的商业组织树中其他的独特商业实体标识符的数目。例如,对于给定的duns编号,该系统可以被配置成计算与该给定的duns编号相关的适当家族树表示所相关联的独特duns编号的数目。与给定的duns编号相关联的家族树表示可以包括:例如,普通加盟商;具有少数所有权(minority ownership)的duns;都在总部之下的具有高倾向成为下面的家族树成员的购买决策者的duns(例如由dun&bradstreet的决策hq平台所识别的duns);基于法律关系(少于50%所有权)具有共同总部、共同国内根源(domestic ultimate)或共同全球根源(global ultimate)的duns;基于对一组duns内使用的品牌的分析具有共同总部、共同国内根源或共同全球根源的duns;或者基于上述项目的组合具有共同总部、共同国内根源或共同全球根源的duns。在于2015年10月29日提交的并且题为“data communications system and method that maximize efficient usage of communications resources”的美国专利第10,152,503号中描述了用于链接给定的商业实体标识符、针对该给定的商业实体标识符的商业组织树中的其他的独特商业实体标识符的数目的示例性系统,该美国专利的全部内容通过引用并入本文。
54.在块207处,该系统还可以包括商业实体映射模块106,该商业实体映射模块106被配置成分析与商业实体标识符相关联的商业实体的网络业务内容数据并将其映射到与商
业实体标识符相关联的商业的属性数据,以生成映射数据107。在实施方式中,与商业实体标识符相关联的每个商业实体的属性数据包括企业统计结构数据。
55.在于2003年2月18日提交的题为“system and method for providing enhanced information”的美国专利第7,822,757号和于2010年9月28日提交的并且题为“data integration method and system”的美国专利第8,346,790号中描述了通过商业分析服务器从商业实体信息数据库进行的公司实体数据链接、为公司生成企业统计结构数据库并且进行评分以及数据集成的非限制性示例,上述两个美国专利中的每一个的全部内容通过引用并入本文。企业统计结构或其他属性数据(例如公司名称、地址、naics、sic、员工计数、年销售额、索引客户计数和排名/评估/风险评分)可以与拥有ip地址的实体相关联。
56.在块208处,该系统被配置成根据网站数据业务内容和属性数据生成训练数据109和测试数据集110的训练数据集108,用于训练因特网服务提供商(isp)分类器101以识别与所映射的网络业务数据107相关联的isp。训练数据109和测试数据110可以存储在训练数据库108中。
57.在实施方式中,可以从由商业实体映射模块106映射到商业实体标识符和商业实体属性数据的ip网络业务数据的完整数据集中获取随机选择的训练集。该完整ip数据集被分成训练集109和测试集110。例如,根据与商业标识符相关的超过100,000个ip地址的现有ip数据集104b,商业实体映射模块106将28,000个商业实体映射到vi 105ip地址以生成核心/映射数据集107。在映射数据集107中,约10,000至14,0000个记录与现存ip地址数据集104b交叠。来自映射数据集107的该交叠数据被用作训练集109,而映射数据集107的剩余非交叠数据(约12,000至18,000个记录)被用作测试集110。
58.在块209处,由模型训练器120使用训练数据集108来训练isp分类器模型。可以训练和使用监督分类模型例如梯度提升分类来确定映射到ip地址的商业标识符是isp业务还是非isp业务。在实施方式中,该模型是用于对每个商业实体标识符(例如:duns)进行分类的基于python的梯度提升分类器。
59.梯度提升根据弱学习器的集合创建强学习器。这种分类方法论以阶段方式构建模型,并且通过允许优化任意可微损失函数来类推这些阶段。主要目标是通过使g,均方误差最小化来“教导”预测形式y=f(x)的值的模型{f}。在梯度提升的每个阶段m(1《=m《=m)处,可以假设存在一些不完美的模型fm(在开始时,只能预测训练集中的均值y的非常弱的模型)。梯度提升算法通过构建添加估计器h的新模型来对fm进行改进,以提供更好的模型:fm 1(x)=fm(x) h(x)。为了找到h,梯度提升解决方案开始于以下观察:完美的h将暗示:
60.fm 1(x)=fm(x) h(x)=y
61.因此,梯度提升使h与残差y-fm(x)拟合。与其他提升变型中一样,每个{f(m 1)}试图校正其先前fm的误差。该思想到除平方误差以外的损失函数以及分类和排名问题的类推,源自以下观察:给定模型的残差y-f(x)是平方误差损失函数1/2(y-f(x))^2的负梯度(相对于f(x))。梯度提升是梯度下降算法,并且类推它需要“插入”不同的损失及其梯度。
62.有利地,发现在1000次迭代时或在1000次迭代之后,梯度提升模型基本上拟合数据(几乎完全)并且残差下降至零。发现梯度提升拟合数据并且产生与其他分类器模型相比更准确的isp标识,从而产生更稳健且技术上更准确的系统。
63.在块210处,该系统被配置成将isp分类器101应用于包括网站跟踪数据的vi的数
据库,并且识别是网站上的isp业务的业务以及哪些业务不是网站上的isp业务。在块210处,一旦isp分类器101模型被训练并确认准确运行,该系统然后可以在vi网络业务数据的完整映射集上运行isp分类器101,以识别isp和非isp。在块211处,数据然后可以被导出至用户界面30,或者用于如下所描述的报告。
64.图3是示出根据实施方式的用于提取vi数据和生成训练数据集208(块208)以及对isp分类器101进行训练(块209)的过程的流程图。在块302处,该系统摄取网络业务数据,提取日志事件,例如标识由放置在网站上的跟踪代码跟踪的所有ip和与ip相关联的cookie的访问者信息日志文件。在块303处,将网络业务数据与商业实体数据合并。例如,如本文中所描述的,在商业身份站点(例如,duns站点)上,网络业务数据的日志事件被添加并且与如本文中所描述的商业实体标识符文件进行映射。如在块303处所示,数据库可以包括文件,该文件包括按每个访问者的ip地址分组的网络访问者信息。在块304处,实现分类器模型,例如,如本文中所描述的基于python的梯度提升分类器。虽然可以采用决策树模型和逻辑回归模型,但是已经发现梯度提升分类器在训练时证明是最佳分类器,产生更准确的结果。还已经确定梯度提升分类器与需要更长时间的逻辑回归相比更快速地处理结果。因此,梯度提升分类器与其他分类器相比改进了系统延迟和准确度。
65.在实施方式中,模型输入来自商业实体企业统计结构数据库104a。在块305处,从合并的网络业务数据中提取训练数据的预测和训练集。例如,对于训练集108,主键可以是商业身份站点数据(duns),并且该集可以基于:vi日志、tri_biz_global_master、biz_ip、biz_ip_full、isp_core_set、isp_training_set、isp_duns_blacklist、isp_whitelist_ultduns和手动标记的记录(例如高达或超过3000个)。如本文中所描述的,属性可以是以下特征:访问量、访问者、naics代码(25)、sic代码(10)、客户比率、员工、收入。发现这些属性在训练用于isp标识的isp分类器101中是最佳的。
66.在块306处,训练集108被传递至模型训练209步骤以训练模型。在块307处,一旦模型被训练,该系统被配置成例如通过检查针对模型的召回、准确度和错误遗漏率(for)在块312处评估模型。下面给出了接受所训练的模型的示例性阈值。
67.针对百分比率的阈值
68.1.绿色

在7%以下
69.2.橙色

7%至10%
70.3.红色

在10%以上
71.针对召回的阈值
72.1.绿色

在85%以上
73.2.橙色

70%至85%
74.3.红色

在70%以下
75.针对for的阈值
76.1.绿色

for在7%以下
77.2.橙色

for7%至10%
78.3.红色

for在10%以上
79.如果阈值在适当的范围内,则在块311处,该模型被pickle并且用于isp预测的模型测试。被pickle的模型被加载至测试集110上并且应用于其上以获得结果。分类的结果基
于以下概率:
80.50%《概率:确定非isp
81.50%》概率:确定isp
82.如果isp预测通过,则系统分类器101被训练并且准备对在块210处完整映射的vi数据107进行isp分类。
83.如果在块307处isp训练模型评估未通过,则系统确定训练集108是否需要更多的训练记录。如果训练集108需要更多的训练记录,则在块310处,如本文中所描述的获得并处理另外的vi和/或商业属性数据,以进一步构建核心isp数据集107,在步骤305处从核心isp数据集107中提取训练集数据。然而,如果训练集108足以用于训练,则在块306处再次迭代模型直到训练阈值在适当的范围内。
84.下面给出isp分类的验证结果的示例。
85.状态:橙色
86.训练集的总大小:10649
87.预测集的总大小:558284
88.在训练集中isp与非isp的数目
[0089][0090]
表1针对测试集的混淆矩阵:
[0091]
列值tp_1532fp95tn_01392fn111正确1924错误206百分比例(错误*100/正确)10%召回灵敏度(tp*100/(tp fn))82%错误遗漏率for(fn*100/(fn tn))7%
[0092]
表2
[0093]
在块309处,测试训练的模型以进行评估。
[0094]
在实施方式中,可以采用以下模型混淆矩阵精度(tp/(tp fp))、召回(tp/(tp fn))、错误遗漏率(fn/(fn tn))和误报率(fp/(fp tn))来测试模型。
[0095]
在如表3所示的示例中,手动预测之后的每月混淆矩阵值如下:
[0096]
列值tp_15fp12
tn_0139fn1正确144错误13百分比率(错误*100/正确)9%召回灵敏度(tp*100/(tp fn)83%错误遗漏率for(fn*100/(fn tn))0%
[0097]
表3
[0098]
如表4所示,基于ip_duns和访问的前200个记录中isp和非isp的总计数为:
[0099]
预测的isp预测的非isp16436
[0100]
表4
[0101]
在表5和表6中示出了ip_de_ranges与ip_de_ranges_future之间的isp标志比较的示例:
[0102][0103][0104]
表5
[0105] 分类器基于规则
准确度92%

80%召回(tp/tp fn)95%

51%for(错误遗漏率)4%

25%
[0106]
表6
[0107]
如表7所示,如本文中所描述的实施方式展示了与基于规则的isp过滤相比显著改进的isp标识。
[0108]
下面是按照客户端提供的id(客户)的全局匹配率和客户匹配率。
[0109]
状态:橙色
[0110]
全局匹配率:30.0
[0111]
客户的匹配率
[0112]
[0113]
[0114]
[0115][0116]
表7
[0117]
如表8至表10所示,采用如本文中所描述的匹配来识别前部的isp和非isp的示例性结果。
[0118]
前20个isp列表
[0119]
[0120][0121]
表8
[0122]
前20个非isp列表
[0123][0124][0125]
表9
[0126]
响应duns id为空的前20个非isp
[0127][0128]
表10
[0129]
此外,分类器模型成功地识别了许多isp访问者,基于规则的方法将这些isp访问者识别为非isp,而手动方法无法识别这些isp访问者。例如,如表11至表12所示,系统新识别了作为先前和常规的方法无法识别的isp的us业务和全球业务:
[0130]
us业务
[0131]
[0132]
表11
[0133]
非us业务
[0134][0135]
表12
[0136]
通知
[0137]
由于系统分类器101对真实的网络业务数据进行处理并且直接影响结果,因此该系统还在阶段处采用自动通知门来保持分类器优化并进行跟踪。该系统被配置成在混淆矩阵或输出结果不准确时提供自动通知。
[0138]
在实施方式中,该系统在模型运行的每个级别处配置有超过10个通知门,包括:
[0139]
·
针对训练集发布总记录的通知;
[0140]
·
针对测量训练集的准确度的通知;
[0141]
·
针对训练集中测试集发布总记录的通知;
[0142]
·
在产生总isp之后关于vi的全局匹配率的通知;
[0143]
·
在产生总isp之后关于vi的客户匹配率的通知(“参考”)。在实施方式中,该匹配率是用于测量针对vi的产品性能的主要指标;
[0144]
·
在模型运行之前或在模型运行之后与前部的isp、非isp相关联的通知。
[0145]
返回至图2,在块210处,一旦模型被训练并确认准确运行,该系统然后可以在vi网络业务数据的完整映射集107上运行分类器,以识别isp和非isp。在实施方式中,可以采用基于规则的处理来对不能被分类器处理的数据例如不能映射到商业实体标识符的网络跟踪数据(例如:针对总访问者、独特访问者的不匹配数据)进行分类。在块211处,数据然后可以被导出至用户界面30,或用于如本文中所描述的报告。
[0146]
在另一实施方式中,分类器在与商业身份标识符匹配但未映射到vi的ip地址上运行。例如,在实施方式中,该系统被配置成从商业实体企业统计结构数据库104a获取映射到商业实体标识102的ip地址的数据库104b。该系统还被配置成映射与来自如本文中所描述的企业统计结构数据库104a的商业实体标识符相关联的每个商业实体的企业统计结构属性数据。还如本文中所描述的,属性可以包括以下特征:访问量、访问者、naics代码、sic代码、客户比率、员工和收入。发现这些属性在训练用于isp标识的isp分类器101中是最佳的。然而,进一步发现,在映射的、企业统计结构属性丰富的已识别ip地址的数据库上运行分类器,即使没有vi数据105属性,分类器也能够识别isp和非isp。例如,所有vi 105访问信息都
归零(访问量、访问者),但所有其他属性都被填满(naics代码、sic代码、客户比率、员工、收入),以便在没有vi的情况下在超过500,000个映射的、企业统计结构属性丰富的ip地址的数据库104b上运行分类器,这些ip地址映射到商业实体标识符。即使没有vi 105,基于其他剩余属性信息,分类器仍然能够对isp和非isp进行分类。因此,一旦模型被训练并确认准确运行,在实施方式中,该系统可以被配置成在映射数据107上运行分类器,其中网络跟踪数据不能被映射到商业实体标识符(例如:针对总访问者、独特访问者的不匹配数据),但是ip地址仍然可以与其他属性数据匹配并且利用其他属性数据在企业统计结构上被丰富。
[0147]
如上所述,可以收集数据以覆盖给定的时间窗口(例如:每周时间间隔、每两周间隔、每月间隔、每两月间隔和/或每季度间隔)。例如,在实施方式中,系统可以每个月如图2至图3中所示摄取和映射数据并且运行分类器101以识别isp和非isp网络业务。该系统还被配置成持续维护模型。例如,在实施方式中,对于该时段内在映射的vi数据上的分类器的后续周期性运行,该系统可以根据尚未在训练集108中的模型输出生成样本记录。例如,每个月运行的分类器产生输出分类输出。对于监督分类,可以手动审查和合并记录。然后可以将修改后的数据集附加至模型运行的下一个月周期并且更新模型的训练。
[0148]
尤其可以经由如图7所示的用户界面30来提供报告。
[0149]
如将理解的,在实施方式中,尽管在特定模块中示出了数据库和其中的数据,但是数据库和其中的数据可以在系统的部件和模块之间共享和访问,并且不需要位于特定部件中以用于访问以下数据:该数据用于如本文中所描述的语义方向值分析等等。本文中公开的逻辑架构和操作流程被示出为以示例性方式描述实施方式,而不限于特定架构,这是因为本领域技术人员可以在例如将本公开内容的教导实现到他们自己的系统中时修改架构设计。
[0150]
说明性操作环境
[0151]
图4a示出了其中可以实践本公开内容的实施方式的环境101的实施方式的部件。并非需要所有部件来实践本发明,并且可以在不脱离本公开内容的精神或范围的情况下对部件的布置和类型进行改变。如所示的,图4包括局域网(lan)/广域网(wan)网络11、无线网络18、客户端计算机12至客户端计算机16、数据分析服务器计算机10、商业实体分析服务器计算机20、网络业务对象源102n和其他数据源112n。
[0152]
下面结合图5更详细地描述客户端计算机12至16的至少一个实施方式。在一个实施方式中,客户端计算机12至16中的至少一些可以通过有线和/或无线网络例如网络11和/或18来操作。通常,客户端计算机12至16几乎可以包括能够通过网络进行通信以发送和接收信息,执行各种在线活动、离线动作等的任何计算机。在一个实施方式中,客户端计算机12至16中的一个或更多个可以被配置成在商业或其他实体中操作以为商业或其他实体执行各种服务。例如,客户端计算机12至16可以被配置成作为网络服务器或账户服务器来操作。然而,客户端计算机12至16不限于这些服务并且在其他实施方式中还可以用作例如终端用户计算节点。应当认识到,更多或更少的客户端计算机可以被包括在诸如本文中所描述的系统内,并且因此实施方式不受采用的客户端计算机的数目或类型的限制。
[0153]
可以作为客户端计算机12至16操作的计算机可以包括通常使用有线或无线通信介质连接的计算机,例如个人计算机、多处理器系统、基于微处理器的或可编程的电子装置、网络pc等。在一些实施方式中,客户端计算机12至16几乎可以包括能够连接至另一计算
装置并且接收信息的任何便携式个人计算机,例如膝上型计算机13、智能移动电话12和平板计算机15等。然而,便携式计算机不受此限制并且还可以包括其他便携式装置,例如蜂窝电话、射频(rf)装置、红外(ir)装置、个人数字助理(pda)、手持式计算机、可穿戴计算机、车载计算机以及组合前述装置中的一个或更多个装置的集成装置等。因此,客户端计算机12至16在能力和特征方面通常范围广泛。此外,客户端计算机12至16被配置成访问包括浏览器或其他基于网络的应用的各种计算应用。
[0154]
启用网络的客户端计算机可以包括被配置成接收和发送网页、基于网络的消息等的浏览器应用。浏览器应用可以被配置成采用几乎任何基于网络的语言(包括无线应用协议消息(wap)等)来接收和显示图形、文本、多媒体等。在一个实施方式中,浏览器应用能够采用手持式装置标记语言(hdml)、无线标记语言(wml)、wmlscript、javascript、javascript对象符号(json)、标准通用标记语言(sgml)、超文本标记语言(html)、可扩展标记语言(xml)等来显示和发送消息。在一个实施方式中,客户端计算机的用户可以采用浏览器应用来通过网络(在线)执行各种活动。然而,另一应用也可以用于执行各种在线活动。
[0155]
客户端计算机12至16还可以包括至少一个其他客户端应用,该至少一个其他客户端应用被配置成与另一计算机接收和/或发送内容。客户端应用可以包括发送和/或接收内容的能力等。客户端应用还可以提供标识自身的信息,包括类型、能力、名称等。在一个实施方式中,客户端计算机12至16可以通过包括因特网协议(ip)地址、电话号码、移动标识号(min)、电子序列号(esn)或其他装置标识符的各种机制中的任意一种来唯一地标识它们自己。可以在其他客户端计算机、数据分析服务器计算机10、商业实体分析服务器计算机20或其他计算机之间发送的网络分组等中提供这样的信息。
[0156]
客户端计算机12至16还可以被配置成包括客户端应用,该客户端应用使得终端用户能够登录到可以由其他计算机(例如数据分析服务器计算机10、商业实体分析服务器计算机20、网络业务对象源102n和其他数据源112n等)管理的终端用户账户。在一个非限制性示例中,这样的终端用户账户可以被配置成使得终端用户能够管理一个或更多个在线活动,在一个非限制性示例中,一个或更多个在线活动包括搜索活动、社交网络活动、浏览各种网站、与其他用户进行通信等。然而,也可以在不登录到终端用户账户中的情况下执行参与这样的在线活动。
[0157]
无线网络18被配置成将客户端计算机14至16及其部件与网络11耦接。无线网络18可以包括各种无线子网络中的任何无线子网络,无线子网络可以进一步覆盖独立的ad-hoc网络等,以为客户端计算机14至16提供面向基础设施的连接。这样的子网络可以包括网状网络、无线lan(wlan)网络、蜂窝网络等。在一个实施方式中,系统可以包括多于一个的无线网络。
[0158]
无线网络18还可以包括通过无线电链路等连接的终端、网关、路由器等的自主系统。这些连接器可以被配置成自由且随机地移动并且任意地组织它们自己,使得无线网络18的拓扑可以快速地改变。
[0159]
无线网络18还可以采用多种接入技术,包括用于蜂窝系统的第二代(2g)、第三代(3g)、第四代(4g)、第五代(5g)无线电接入、wlan、无线路由器(wr)网格等。诸如2g、3g、4g、5g以及未来接入网络的接入技术可以实现用于移动装置(例如具有不同程度的移动性的客户端计算机14至16)的广域覆盖。在一个非限制性示例中,无线网络18可以通过无线电网络
接入例如全球移动通信系统(gsm)、通用分组无线电服务(gprs)、提升型数据gsm环境(edge)、码分多址(cdma)、时分多址(tdma)、宽带码分多址(wcdma)、高速下行链路分组接入(hsdpa)、长期演进(lte)等来实现无线电连接。实质上,无线网络18几乎可以包括任何无线通信机制,通过该无线通信机制,信息可以在客户端计算机14至16与另一计算机、网络等之间传播。
[0160]
网络11被配置成通过无线网络18将网络计算机与其他计算机和/或计算机装置(包括数据分析服务器计算机10、商业实体分析服务器计算机20、网络业务对象源102n和其他数据源、客户端计算机12、13和客户端计算机14至16)进行耦接。网络11能够采用任何形式的计算机可读介质,用于将信息从一个电子装置传送至另一电子装置。此外,网络11除了可以包括局域网(lan)、广域网(wan)、诸如通过通用串行总线(usb)端口、其他形式的计算机可读介质的直接连接、或其任意组合之外,还可以包括因特网。在一组互连的lan上(包括基于不同架构和协议的lan),路由器充当lan之间的链路,使得消息能够从一个发送至另一个。此外,lan中的通信链路通常包括双绞线或同轴电缆,而网络之间的通信链路可以利用模拟电话线、包括t1、t2、t3和t4以及/或者其他载波机制(包括例如e-载波)的全部或部分专用数字线、综合服务数字网络(isdn)、数字用户线(dsl)、包括卫星链路的无线链路或本领域技术人员已知的其他通信链路。此外,通信链路还可以采用各种数字信令技术中的任意技术,包括但不限于例如ds-0、ds-1、ds-2、ds-3、ds-4、oc-3、oc-12、oc-48等。此外,远程计算机和其他相关电子装置可以经由调制解调器和临时电话链路远程连接至lan或wan。在一个实施方式中,网络11可以被配置成传输因特网协议(ip)的信息。实质上,网络11包括信息可以通过其而在计算装置之间传播的任何通信方法。
[0161]
此外,通信介质通常包含计算机可读指令、数据结构、程序模块或其他传输机制并且包括任何信息传递介质。作为示例,通信介质包括有线介质和无线介质,有线介质例如双绞线、同轴电缆、光纤、波导和其他有线介质,无线介质例如声学、射频、红外和其他无线介质。
[0162]
下面结合图4更详细地描述可以用作数据分析服务器计算机10或商业实体分析服务器计算机20的服务器计算机的一个实施方式。简言之,服务器计算机几乎包括能够托管如本文中所描述的模块的任何网络计算机。可以被布置成作为服务器计算机操作的计算机包括各种网络计算机,包括但不限于台式计算机、多处理器系统、网络pc、服务器计算机、网络设备等。
[0163]
尽管图4a将数据分析服务器计算机10或商业实体分析服务器计算机20中的每一个示出为单个计算机,但是本公开内容不限于此。例如,服务器计算机的一个或更多个功能可以在一个或更多个不同的网络计算机上分布。此外,计算机服务器不限于特定配置。因此,在一个实施方式中,服务器计算机可以包含多个网络计算机。在另一实施方式中,服务器计算机可以包含使用主/从方法操作的多个网络计算机,其中服务器计算机的多个网络计算机之一可操作为管理和/或以其他方式协调其他网络计算机的操作。在其他实施方式中,服务器计算机可以作为被布置成集群架构、对等架构和/或甚至在云架构中的多个网络计算机来操作。因此,本公开内容不应被解释为限于单个环境,并且还设想了其他配置和架构。
[0164]
尽管单独示出,但是数据分析服务器计算机10和商业实体分析服务器计算机20可
以用作单个网络计算机或计算机平台、单独的网络计算机、网络计算机的集群等。在一些实施方式中,数据分析服务器计算机10和商务实体分析服务器计算机20中的任一个或者两者可以被启用,以传递内容、响应用户与内容的交互、跟踪用户与内容的交互、更新小组件和小组件控制器等。此外,分别描述了数据分析服务器计算机10和商业实体分析服务器计算机20,并且将理解的是,这些服务器由其他平台托管或者可以被配置成在其他平台上操作。
[0165]
如本文中所描述的,系统10、过程和算法的实施方式可以被配置成在诸如亚马逊网络服务(aws)或微软的网络服务平台主机上运行。云计算架构被配置成用于对可配置计算资源(例如网络、网络带宽、服务器、处理、存储器、存储、应用、虚拟机和服务)的共享池进行方便、按需网络访问。云计算机平台可以被配置成允许平台提供商单方面地根据需要自动地供应计算能力,例如服务器时间和网络存储,而不需要与服务的提供商进行人交互。此外,云计算可通过网络获得,并且通过促进由异构的瘦客户端或厚客户端平台(例如,移动电话、膝上型电脑和pda)使用的标准机制来访问。在云计算架构中,平台的计算资源可以被池化以使用多租户模型来服务多个消费者、合作伙伴或其他第三方用户,其中不同的物理资源和虚拟资源根据需求被动态地分配和重新分配。还配置了云计算架构,使得平台资源可以快速且弹性地供应(在一些情况下是自动地)以快速向外扩展,并且快速释放以快速向内扩展。
[0166]
云计算系统可以被配置有系统以通过在适合于服务的类型(例如,存储、处理、带宽和活动用户账户)的某种抽象级别上利用计量能力来自动控制和优化资源使用。可以监测、控制和报告资源使用。如本文中所描述的,在实施方式中,系统10有利地由具有创新算法和数据库结构的平台提供商配置。
[0167]
云计算架构包括多个服务和平台配置。
[0168]
软件即服务(saas)被配置成允许平台提供商使用在云基础设施上运行的提供商的应用。可以通过诸如网络浏览器(例如,基于网络的电子邮件)的瘦客户端接口从各种客户端装置访问应用。消费者通常不管理或控制包括网络、服务器、操作系统、存储、或甚至个别应用能力的底层云基础设施,可能的例外是有限的用户专用应用配置设置。
[0169]
平台即服务(paas)被配置成允许平台提供商将使用由提供商支持的编程语言和工具创建的消费者创建或获取的应用部署到云基础设施上。消费者不管理或控制包括网络、服务器、操作系统或存储的底层云基础设施,但可以具有对部署的应用的控制以及可能对应用托管环境配置的控制。
[0170]
基础设施即服务(iaas)被配置成允许平台提供商供应处理、存储、网络以及其中消费者能够部署和运行任意软件的其他基本计算资源,所述任意软件可以包括操作系统和应用。消费者不管理或控制底层云基础设施,但具有对操作系统、存储、部署的应用的控制,以及可能对选择网络部件(例如,主机防火墙)的有限控制。
[0171]
云计算架构可以作为私有云计算架构、社区云计算架构或公共云计算架构提供。云计算架构也可以被配置为包括两个或更多个云平台(私有、社区或公共)——这些云平台保留独特的实体,但是通过实现数据和应用可移植性的标准化或专有技术(例如,用于云之间的负载平衡的云爆发)绑定在一起——的混合云计算架构。
[0172]
云计算环境是面向服务的,其焦点在于无状态、低耦合、模块性和语义互操作性。云计算的核心是包括互连节点的网络的基础设施。
[0173]
现在参照图4b,描绘了说明性云计算环境450。如所示的,云计算环境450包括一个或更多个云计算节点455,利用云计算节点455,由云消费者使用本地计算装置,诸如例如个人数字助理(pda)或蜂窝电话13、台式计算机14、膝上型计算机12、传感器数据源15、网络业务数据源102n和集成机器数据源17和/或其他计算机系统或装置数据源112n。节点455可以相互通信。它们可以被物理地或虚拟地分组(未示出)在一个或更多个网络,例如如本文中所描述的私有云、社区云、公共云或混合云、或其组合中。云计算环境450被配置成提供基础设施、平台和/或软件作为服务,云消费者不需要为其维护本地计算装置上的资源。应当理解,图4b中所示的计算装置的类型仅旨在说明,并且计算节点455和云计算环境450可以通过任何类型的网络和/或网络可寻址连接(例如,使用网络浏览器)与任何类型的计算机化装置通信。
[0174]
现在参考图4c,示出了由云计算环境450(图4b)提供的一组功能抽象层。图4c中所示的部件、层和功能是说明性的,并且如本文中所描述的实施方式不限于此。如所描绘的,提供了以下层和相应的功能:
[0175]
硬件和软件层460可以包括硬件和软件部件。硬件部件的示例包括例如:主机461;服务器462;服务器463;刀片式服务器464;存储装置465;以及网络和网络部件466。在一些实施方式中,软件部件包括网络应用服务器软件467和数据库软件468。
[0176]
虚拟化层470提供抽象层,从该抽象层可以提供虚拟实体的以下示例:虚拟服务器471;虚拟存储装置472;包括虚拟专用网络的虚拟网络473;虚拟应用和操作系统474;以及虚拟客户端475。
[0177]
在一个示例中,管理层480可以提供以下描述的功能。资源供应481提供用于在云计算环境内执行任务的计算资源和其他资源的动态采购。计量和定价482提供了在云计算环境内利用资源时的成本跟踪,以及对这些资源的消耗的帐单或发票。在一个示例中,这些资源可以包括应用软件许可证。安全性为云消费者和任务提供身份验证,以及为数据和其他资源提供保护。用户门户483为消费者和系统管理员提供对云计算环境的访问。服务级别管理484提供云计算资源分配和管理,使得满足所需的服务级别。服务级别协议(sla)规划和履行485提供对云计算资源的预安排和采购,根据sla预期对云计算资源的未来需求。
[0178]
工作负载层490提供了可以针对其来利用云计算环境的功能的示例。可以由该层提供的工作负载和功能的示例包括映射491;输入事件处理492,数据流处理493;身份解析494;数据分析处理495;以及数据传递496。
[0179]
图4d示出了针对实施方式的逻辑架构。该系统可以构建在示例性平台上,例如亚马逊网络服务平台,但也可以采用用于支持应用内容传递、社交网络和网络基础设施的其他平台。如图4d所示,如本文中所描述的,可以经由云前端412向客户端计算机提供传递通道层410。前端网络服务器层420可以构建在弹性云(ec2)架构422上并且可以提供前端接口,例如诸如构建在angular js 424或其他js模块上的接口。后端层430可以通过网络套接可操作地连接至前端架构层420,并且可以构建在s3架构432上并且包括用于网络规模数据存储和检索的数据桶和对象433,并且数据库层440例如可以包括关系数据库结构442层架构上的数据库444。一个或更多个第三方系统445可以集成或可操作地连接至架构450。
[0180]
本领域普通技术人员将理解的是,系统的架构是非限制性示例,其说明了各种实施方式中的至少之一的至少一部分。因此,在不脱离本文中描述的创新的范围的情况下,可
以不同地采用和/或布置更多或更少的部件。然而,系统至少充分公开了本文中要求保护的创新。
[0181]
图4e表示根据各种实施方式中的至少一个在云计算环境中用于访问者智能分析的系统的逻辑架构流程400。
[0182]
在块402处,请求通过弹性负载平衡器(elb)421进入系统,并且在块403处被路由至访问者智能云基础设施vici自动缩放集群应用434。
[0183]
在块404处,vici应用434轮询s3服务器432用于外部配置并且将提取转换加载(etl)过程和应用434日志以常规的节奏推送至s3服务器432。
[0184]
在块405处,vici应用针对如本文中所描述的ip、duns和cookie数据查询dynamo数据库444内的若干表。
[0185]
在块406处,etl过程开始于java轮询代理(jpa)426。jpa426针对要消耗的etl日志轮询s3服务器432。在块407处,当新的访问者智能文件准备好处理时,jpa426向lambda处理代理(lpa)429发送sns通知。lpa429运行在转换数据以进行加载处理的aws lambda上运行的java代码。
[0186]
在块408处,lpa429将转换后的数据发送至被配置成用于数据分析的数据流应用,例如kinesis firehose,其将数据流传输至云数据仓库440,例如redshift数据库442仓库,其被配置成使用标准sq在数据仓库442和数据湖上支持查询拍字节的结构化和半结构化数据。
[0187]
在块409处,客户自定义属性cca427接口允许客户端用户为vici匹配响应供应第一方数据。cca规则从用户收集并且通过被配置成按需启动和拆除的emr集群434过滤以摄取至dynamo数据库444中。在块410处,种子ipr和duns(sid)应用428将新的每月ip与duns和duns查找数据集播种至用于vici的dynamo数据库444中。这按需创建emrvici集群434以有效地播种数据。
[0188]
在块411处,sigmoid数据提取(sde)脚本424提取每小时vi数据以发送至第三方接口进行交互式报告。特别地,在块412处,数据经由pgp被加密并且被推送至s3服务器432数据桶433以供消耗。
[0189]
在块413处,jpa应用为订户发布简单队列服务(sqs)425消息。这些消息包含工作人员针对客户客户端用户执行每日数据提取的元数据。在块414处,工作人员针对要对其采取行动的工作轮询sqs 425。然后,在块415处,工作人员然后从redshift数据库442接收针对启用他们的每日数据导出的客户客户端用户的sql卸载的指令。
[0190]
在块416处,然后将数据从数据库442卸载至s3服务器432。在块417处,sftp服务器具有包括针对客户端用户的每日卸载数据的s3服务器432安装。在块418处,客户端用户可以使用elb接口连接至sftp主机以获取他们的每日文件。
[0191]
在块419处,日志聚合器代理las主机具有在调度脚本(例如cron)上运行的shell脚本,以针对内部团队执行从redshift数据库442的自定义卸载。在块420处,卸载然后存储在s3服务器432中以供消耗。
[0192]
尽管本公开内容描述了云计算平台上的实施方式,但是如本文中所描述的实施方式的实现方式不限于云计算环境。
[0193]
说明性网络计算机
[0194]
图5示出了根据本公开内容的一个实施方式的网络计算机21的一个实施方式。网络计算机21可以包括比示出的部件更多或更少的部件。然而,示出的部件足以公开用于实践本发明的说明性实施方式。网络计算机21可以被配置成作为服务器、客户端、对等端、主机或任何其他计算机来操作。网络计算机21可以表示例如图4的数据分析服务器计算机10和/或商业实体分析服务器计算机20以及/或者其他网络计算机。
[0195]
网络计算机21包括处理器22、处理器可读存储介质23、网络接口单元25、输入/输出接口27、硬盘驱动器29、视频显示适配器26以及存储器24,它们所有都经由总线28彼此通信。在一些实施方式中,处理器22可以包括一个或更多个中央处理单元。
[0196]
如图5所示,网络计算机21还可以经由网络接口单元25与因特网或一些其他通信网络进行通信,网络接口单元25被构造为与包括tcp/ip协议的各种通信协议一起使用。网络接口单元25有时被称为收发器、收发装置或网络接口卡(nic)。
[0197]
网络计算机21还包括用于与诸如键盘的外部装置或图5中未示出的其他输入或输出装置通信的输入/输出接口27。输入/输出接口27可以利用一种或更多种通信技术例如usb、红外、蓝牙
tm
等。
[0198]
存储器24通常包括随机存取存储器(ram)54、只读存储器(rom)55以及诸如硬盘驱动器29、磁带驱动器、光盘驱动器和/或软盘驱动器的一个或更多个永久大容量存储装置。存储器24存储用于控制网络计算机21的操作的操作系统32。可以采用任何通用操作系统。还提供基本输入/输出系统(bios)42,用于控制网络计算机21的低级操作。
[0199]
尽管单独示出,但是存储器24可以包括处理器可读存储介质23。处理器可读存储介质23可以被称为计算机可读介质、计算机可读存储介质和/或处理器可读存储装置以及/或者包括计算机可读介质、计算机可读存储介质和/或处理器可读存储装置。处理器可读存储介质23可以包括以任何方法或技术实现的用于存储诸如计算机可读指令、数据结构、程序模块或其他数据的信息的易失性介质、非易失性介质、可移除介质和不可移除介质。处理器可读存储介质的示例包括ram、rom、eeprom、闪存或其他存储技术、cd-rom、数字通用盘(dvd)或其他光学存储装置、磁盒、磁带、磁盘存储装置或其他磁存储装置或者可以用于存储期望的信息并且可以由计算机访问的任何其他介质。
[0200]
存储器24还包括一个或更多个数据存储装置33,其中,网络计算机21可以利用数据存储装置33来存储应用35和/或其他数据等等。例如,还可以采用数据存储装置33来存储描述网络计算机21的各种能力的信息。然后可以基于各种事件中的任何一个来将信息提供给另一计算机,包括在通信期间作为报头的一部分发送、根据请求发送等。数据存储装置33还可以用于存储消息、网页内容等。至少一部分信息也可以存储在网络计算机21的另一部件上,该部件包括但不限于网络计算机21内的处理器可读存储介质23、硬盘驱动器29或其他计算机可读存储介质(未示出)。
[0201]
数据存储装置33可以包括数据库、文本、电子表格、文件夹、文件等,其可以被配置成维护和存储用户账户标识符、用户简档、电子邮件地址、im地址和/或其他网络地址等等。
[0202]
在各种实施方式中的至少一个中,数据存储装置33可以包括数据库,例如训练数据库108、映射/核心数据数据库107、商业实体数据库104a、isp规则数据库118、isp白名单116、isp黑名单114以及可以包含根据如本文中所描述的网络分析和网络活动指标而确定的信息的其他数据库,例如独特访问(日期-时间戳、ip地址)和独特访问者(不同的cookie、
不同的ip地址)。
[0203]
数据存储装置33还可以包括程序代码、数据、算法等,以供处理器例如处理器22使用以执行和进行动作。在一个实施方式中,数据存储装置33中的至少一些也可以存储在网络计算机21的另一部件上,该部件包括但不限于处理器可读存储介质23、硬盘驱动器29等。
[0204]
应用35可以包括可以加载至大容量存储器24中并在操作系统32上运行的计算机可执行指令。应用程序的示例可以包括代码转换器、调度程序、日历、数据库程序、词处理程序、超文本传输协议(http)程序、可定制的用户接口程序、ipsec应用、加密程序、安全程序、sms消息服务器、im消息服务器、电子邮件服务器、账户管理器等。应用35还可以包括网站服务器36、isp分类器101、用于网络业务数据内容102的访问者智能或网络抓取模块105、商业实体身份解析模块103、商业实体映射模块106、模型训练器模块120和报告生成器37。
[0205]
网站服务器36可以表示被配置成通过网络向另一计算机提供内容(包括消息)的各种信息和服务中的任何信息和服务。因此,网站服务器36可以包括例如网络服务器、文件传输协议(ftp)服务器、数据库服务器、内容服务器等。网站服务器36可以使用各种格式中的任何格式来通过网络提供包括消息的内容,格式包括但不限于wap、hdml、wml、sgml、html、xml、压缩html(chtml)、可扩展html(xhtml)等。
[0206]
网站服务器36、isp分类器101、用于网络业务数据内容102的访问者智能或网络抓取模块105、商业实体身份解析模块103、商业实体映射模块106、模型训练器模块120和报告生成器37可以在图4的数据分析服务器计算机10和/或商业实体分析服务器计算机20上操作,或者可以在图4的数据分析服务器计算机10和/或商业实体分析服务器计算机20上托管和操作。报告生成器37可以采用与结合图1至图2描述的内容类似的过程或过程的一部分来执行其动作中的至少一些动作。
[0207]
报告生成器37可以被布置和配置成基于与以上参照用户界面30控件所描述的内容类似的用户过滤器和控件来确定和/或生成报告。此外,报告生成器37可以被配置成以下述形式输出定制的报告:以出版软件应用的形式,其中该软件应用以方便阅读的形式准备并输出列表,或者以适合于由其他软件产品自动输入和处理的格式输出相同的信息,例如针对出版程序(诸如latex)的纯文本。在各种实施方式中的至少一个中,报告生成器37可以在图4的数据分析服务器计算机10和/或商业实体分析服务器计算机20上操作,或者在图4的数据分析服务器计算机10和/或商业实体分析服务器计算机20上托管和操作。报告生成器37可以采用与结合图1至图3描述的内容类似的过程或过程的一部分来执行其动作中的至少一些动作。可以采用报告生成器以针对如图7所示的接口输出报告。
[0208]
说明性客户端计算机
[0209]
参照图6,客户端计算机50可以包括比图4中所示的部件更多或更少的部件。然而,示出的部件足以公开用于实践本文所描述的发明的说明性实施方式。
[0210]
客户端计算机50可以表示例如图4的客户端计算机12至16中至少之一的一个实施方式。
[0211]
如附图中所示,客户端计算机50包括经由总线51与大容量存储器24通信的处理器52。在一些实施方式中,处理器52包括一个或更多个中央处理单元(cpu)。客户端计算机50还包括电源65、一个或更多个网络接口68、音频接口69、显示器70、键区71、照明器72、视频接口73、输入/输出接口74、触觉接口75以及全球定位系统(gps)接收器67。
[0212]
电源65向客户端计算机50提供电力。可再充电或不可再充电的电池可以用于提供电力。电力还可以由外部电力源例如交流(ac)适配器或对电池进行补充和/或再充电的供电对接支座来提供。
[0213]
客户端计算机50可以可选地与基站(未示出)通信,或者直接与另一计算机通信。网络接口68包括用于将客户端计算机50耦接至一个或更多个网络的电路,并且被构造成用于与一种或更多种通信协议和技术一起使用,通信协议和技术包括但不限于gsm、cdma、tdma、gprs、edge、wcdma、hsdpa、lte、用户数据报协议(udp)、传输控制协议/因特网协议(tcp/ip)、短消息服务(sms)、wap、超宽带(uwb)、ieee 802.16全球微波接入互操作性(wimax)、会话启动协议/实时传输协议(sip/rtp)或各种其他无线通信协议中的任一种。网络接口68有时被称为收发器、收发装置或网络接口卡(nic)。
[0214]
音频接口69被布置成产生和接收音频信号例如人声的声音。例如,音频接口69可以耦接至扬声器和麦克风(未示出)以实现与其他的电信通信并且/或者生成一些动作的音频确认。
[0215]
显示器70可以是液晶显示器(lcd)、气体等离子体、发光二极管(led)、有机led或与计算机一起使用的任何其他类型的显示器。显示器70还可以包括被布置成从对象(诸如触控笔或人手的手指)接收输入的触敏屏幕。
[0216]
键区71可以包括被布置成从用户接收输入的任何输入装置。例如,键区71可以包括按钮数字拨盘或键盘。键区71还可以包括与选择和发送图像相关联的命令按钮。照明器72可以提供状态指示并且/或者提供光。照明器72可以在特定时间段内或响应于事件而保持激活。例如,当照明器72激活时,它可以在客户端计算机通电时从背后照亮键区71上的按钮并且保持亮着。此外,当特定动作(例如拨打另一客户端计算机)被执行时,照明器72可以以各种模式从背后照亮这些按钮。照明器72还可以使位于客户端计算机的透明或半透明外壳内的光源响应于动作而照亮。
[0217]
视频接口73被布置成捕获视频图像例如静止照片、视频片段、红外视频等。例如,视频接口73可以耦接至数码摄像机、网络摄像机等。视频接口73可以包括镜头、图像传感器和其他电子产品。图像传感器可以包括互补金属氧化物半导体(cmos)集成电路、电荷耦合器件(ccd)或用于感测光的任何其他集成电路。
[0218]
客户端计算机50还包括输入/输出接口74,其用于与诸如耳机的外部装置或图4中未示出的其他输入或输出装置通信。输入/输出接口74可以利用一种或更多种通信技术例如usb、红外、蓝牙
tm
等。
[0219]
触觉接口75被布置成向客户端计算机50的用户提供触觉反馈。例如,当计算计算机的另一用户正在呼叫时,触觉接口75可以用于以特定的方式使客户端计算机50振动。在一些实施方式中,触觉接口75是可选的。
[0220]
客户端计算机50还可以包括gps收发器67,以确定客户端计算机50在地球表面上的物理坐标。在一些实施方式中,gps收发器67是可选的。gps收发器67通常将位置输出为纬度值和经度值。然而,gps收发器67还可以采用其他地理定位机制,包括但不限于三角法测量、辅助gps(agps)、提升型观测时间差(e-otd)、小区标识符(ci)、服务区域标识符(sai)、提升型定时提前(eta)、基站子系统(bss)等,以进一步确定客户端计算机50在地球表面上的物理位置。应当理解,在不同状况下,gps收发器67可以确定针对客户端计算机50的毫米
内的物理位置。在其他情况下,所确定的物理位置可以不太精确,例如在米或显著更大的距离内。然而,在一个实施方式中,客户端计算机50可以通过其他部件来提供可以用于确定计算机的物理位置的其他信息,包括例如媒体访问控制(mac)地址、ip地址等。
[0221]
大容量存储器24包括随机存取存储器(ram)54、只读存储器(rom)55以及其他存储装置。大容量存储器24示出了用于存储诸如计算机可读指令、数据结构、程序模块或其他数据的信息的计算机可读存储介质(装置)的示例。大容量存储器24存储用于控制客户端计算机50的低级操作的基本输入/输出系统(bios)57。大容量存储器24还存储用于控制客户端计算机50的操作的操作系统56。将理解的是,该部件可以包括诸如unix或linux
tm
版本的通用操作系统或者诸如微软公司的windows
tm os、苹果公司的ios
tm
、谷歌公司的android
tm
或操作系统的专用客户端通信操作系统。操作系统可以包括java虚拟机模块或者与java虚拟机模块对接,该java虚拟机模块能够经由java应用程序控制硬件部件以及/或者操作系统的操作。
[0222]
大容量存储器24还包括一个或更多个数据存储装置58,其中,客户端计算机50可以利用该数据存储装置58来存储应用60和/或其他数据等等。例如,还可以采用数据存储装置58来存储描述客户端计算机50的各种能力的信息。然后,可以基于各种事件中的任何一个来将信息提供给另一计算机,包括在通信期间作为报头的一部分发送、根据请求发送等。数据存储装置58还可以用于存储包括地址簿、好友列表、别名、用户简档信息等的社交网络信息。此外,数据存储装置58还可以存储消息、网页内容或各种用户生成的内容中的任何内容。至少一部分信息也可以存储在客户端计算机50的另一部件上,该部件包括但不限于客户端计算机50内的处理器可读存储介质66、磁盘驱动器或其他计算机可读存储装置(未示出)。
[0223]
处理器可读存储介质66可以包括以任何方法或技术实现的用于存储诸如计算机可读指令或处理器可读指令、数据结构、程序模块或其他数据的信息的易失性介质、非易失性介质、可移除介质和不可移除介质。计算机可读存储介质的示例包括ram、rom、电可擦除可编程只读存储器(eeprom)、闪存或其他存储器技术、光盘只读存储器(cd-rom)、数字通用盘(dvd)或其他光学存储装置、磁盒、磁带、磁盘存储装置或其他磁存储装置,或者可以用于存储期望的信息并且可以由计算机访问的任何其他物理介质。处理器可读存储介质66在本文中还被称为计算机可读存储介质和/或计算机可读存储装置。
[0224]
应用60可以包括计算机可执行指令,该计算机可执行指令在由客户端计算机50执行时发送、接收并且/或者以其他方式处理网络数据。网络数据包括但不限于消息(例如,sms、多媒体消息服务(mms)、即时消息(im)、电子邮件和/或其他消息)、音频、视频,并且使得能够实现与另一客户端计算机50的另一用户的电信通信。
[0225]
应用60可以包括例如浏览器61和其他应用62。其他应用62包括但不限于日历、搜索程序、电子邮件客户端、im应用、sms应用、因特网协议语音(voip)应用、联系人管理器、任务管理器、代码转换器、数据库程序、词处理程序、安全应用、电子表格程序、游戏、搜索程序等。
[0226]
浏览器61几乎可以包括被配置成采用几乎任何基于网络的语言来接收和显示图形、文本、多媒体、消息等的任何应用。在一个实施方式中,浏览器应用采用hdml、wml、wmlscript、javascript、json、sgml、html、xml等来显示和发送消息。然而,可以采用各种其
他基于网络的编程语言中的任何编程语言。在一个实施方式中,浏览器61使得客户端计算机50的用户能够与诸如图4的数据分析服务器计算机10、商业实体分析服务器计算机20、网络业务对象源102n和其他数据源112n的另一网络计算机通信,并与之对接,使得用户可以操作如本文中所描述的用户界面30。
[0227]
应用60还可以包括小组件(widget)控制器63和一个或更多个小组件64。小组件64可以是由数据分析服务器计算机10、商业实体分析服务器计算机20、网络业务对象源102n和其他数据源112n提供给客户端计算机的内容的集合。图4的数据分析服务器计算机10、商业实体分析服务器计算机20、网络业务对象源102n和其他数据源112n。小组件控制器63和小组件64可以作为本机客户端计算机应用来运行,或者小部件控制器63和小组件64可以作为基于网络浏览器的应用在浏览器61中运行。此外,小组件控制器63和小组件64可以被布置成作为本机应用或网络浏览器应用或其组合运行。在一个实施方式中,浏览器61采用小组件控制器63和小组件64以使得客户端计算机50的用户能够与诸如图4的数据分析服务器计算机10、商业实体分析服务器计算机20、网络业务对象源102n和其他数据源112n的其他网络计算机通信,并与之对接,使得用户可以操作如本文中所描述的用户界面30。
[0228]
说明性图形用户界面
[0229]
参照图7,在各种实施方式中的至少一个中,在不脱离本公开内容的精神和/或范围的情况下,可以采用除下面描述的用户界面30之外的用户界面。这样的用户界面可以具有以各种方式布置的更多或更少的用户界面元素。在一些实施方式中,可以使用网页、移动应用、电子邮件、pdf文档、文本消息等生成用户界面。
[0230]
现在更详细地描述用户界面单元30。如图7所示,界面30尤其可以被配置成用于针对isp标识的vi报告。
[0231]
在实施方式中,该系统可以被配置成提供基于日志的每日报告,该报告示出了基于商业标识符(duns)——展示基于非人类业务并且进而可以用于进一步的电子邮件定位、crm和重新定位——的受众。在实施方式中,该系统可以被配置成提供智能,以了解客户端在他们的活动下通过识别非人类受众已经发起的现有活动的表现和roi。此外,该信息可以用于有效地了解个人对网站上的哪些产品或服务感兴趣,并且使用这些见解来确定重定向的广告的内容。此外,该系统可以被配置成识别网站上的可能指示恶意或不期望的网络业务的可疑非人类活动。
[0232]
已经使用适合于个人计算机的仪表板的示例描述了用户界面30,因为出于说明的目的这是一种可取的形式。具有仪表板格式的类似图形用户界面也可以作为移动app来提供,例如用于android或iphone操作系统的移动app,其中术语“移动app”主要是指能够在智能手机或平板电脑装置或其他客户端计算机上运行的应用软件的模块。也可以提供其他类型的用户界面。可替选的用户界面类型是应用编程接口(api),应用编程接口(api)是用户界面的类型,其适合于以下开发人员:所述开发人员希望将本文中所描述的系统与第三方软件应用集成,例如以适合于被集成的第三方应用软件的灵活方式合并输出。另一用户界面类型是报告编写软件应用,该报告编写软件应用基于与上面参照仪表板所描述的内容类似的用户过滤器和控件输出定制的报告。
[0233]
关于流程图图示已经描述了本公开内容的某些方面的操作。在各种实施方式中的至少一个中,结合图1至图7描述的过程可以由单个网络计算机实现以及/或者在单个网络
计算机上执行。在其他实施方式中,这些过程或这些过程的部分可以由多个网络计算机实现以及/或者在多个网络计算机上执行。同样,在各种实施方式中的至少一个中,过程或过程的部分可以在诸如客户端计算机50的一个或更多个客户端计算机上操作。然而,实施方式不限于此,并且可以使用网络计算机、客户端计算机、虚拟机等的各种组合。此外,在各种实施方式中的至少一个中,结合流程图图示所描述的过程可以在具有例如本文中所描述的逻辑架构的系统中操作。
[0234]
将理解的是,本文中所描述的流程图图示的每个块以及流程图图示中的块的组合可以由计算机程序指令实现。可以将这些程序指令提供给处理器以产生机器,使得在处理器上执行的指令创建用于实现在一个流程图块或多个流程图块中指定的动作的手段。计算机程序指令可以由处理器执行,以使得由处理器执行一系列操作步骤以产生计算机实现的过程,使得指令在处理器上执行以提供用于实现在一个流程图块或多个流程图块中指定的动作的步骤。计算机程序指令还可以使流程图的块中示出的操作步骤中的至少一些操作步骤被并行地执行。此外,一些步骤也可以在多个处理器上执行,例如可能出现在多处理器计算机系统或者甚至一组多个计算机系统中。此外,在不脱离本公开内容的范围或精神的情况下,流程图图示中的一个或更多个块或块的组合也可以与其他块或块的组合同时执行,或者甚至以不同于示出的顺序执行。
[0235]
因此,流程图图示的块支持用于执行指定动作的组合、用于执行指定动作的步骤的组合以及用于执行指定动作的程序指令手段。还将理解,流程图图示的每个块以及流程图图示中的块的组合可以由执行指定动作或步骤的基于专用硬件的系统、或者专用硬件和计算机指令的组合实现。前述示例不应被解释为限制和/或穷举,而是作为用于示出本公开内容的各种实施方式中的至少一个的实现方式的说明用例。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献