一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

广告投放选品方法及其相应的装置、设备、介质与流程

2021-11-24 21:57:00 来源:中国专利 TAG:


1.本技术实施例涉及电商信息技术领域,尤其涉及一种广告投放选品方法及其相应的装置、设备、介质。


背景技术:

2.电子商务平台常需向其消费者用户或商家用户推荐商品,以便活跃电商交易,为此需要能够针对其平台内的商品对象进行选择,确定出具有销售潜力的适于广告投放的商品,向各方用户推荐,从而促进商品的终端销售或配置上架。
3.处于起步阶段的电商平台,其广告数据较为稀疏,如何从占大多数的、未曾投放过广告的商品中,选取可能会产生较好收益的商品组成广告候选商品集,由于缺乏海量历史广告数据的参考,其筛选技术便成为一个难题。
4.即使是成熟运营的电商平台,对于一些新上线的品类或具体商品,依然存在广告数据稀疏的现象,因此,同理也会因为历史广告数据不足而难以选取出适于广告投放的商品对象。
5.电商领域内,有过诸多关于为商品对象确定选品策略的技术性探索,例如cn110659940a号专利申请公开一种广告选品的方法,该方法结合广告的站内归因数据与历史像素数据,评估广告的真实收益,筛选出适合广告的商品。可以看出,该方法仍然需要依赖丰富的站内广告数据,而且需要采用多个过滤规则,过于依赖人工来设置阈值,维护成本较高,鲁棒性不高。
6.由此可见,现有技术缺乏为电商平台的广告投放的选品实现冷启动的技术方案,为本技术的探索预留了发展空间。


技术实现要素:

7.本技术的目的针对现有技术中存在的至少部分不足而提供一种广告投放选品方法及其相应的装置、计算机设备及存储介质。
8.为解决上述技术问题,本技术采用的一个技术方案是:
9.本技术提供一种广告投放选品方法,其包括如下步骤:
10.获取候选商品对象的商品图片的图像特征作为待比图像特征;
11.从被比特征库中筛选出与待比图像特征相匹配的被比图像特征,每个被比图像特征对应提取自社交媒体网站用户发布的帖文中的一张展示配图;
12.构造分类数据集,该分类数据集包含所述相匹配的被比图像特征相对应的帖文的互动信息,以及表征待比图像特征与所述相匹配的被比图像特征之间的匹配程度的相似指数;
13.根据所述分类数据集对所述候选商品对象进行分类判决,判决该候选商品对象是否为广告投放的选中商品。
14.具体化的实施例中,获取候选商品对象的商品图片的图像特征作为待比图像特
征,包括如下步骤:
15.获取所述的候选商品对象;
16.调用审核接口对该候选商品对象的商品信息实施校验,以确认其为符合预设规范的候选商品对象;
17.获取通过所述校验的候选商品对象的商品图片;
18.调用预训练至收敛状态的图像特征提取器从所述商品图片中提取出图像特征作为所述待比图像特征。
19.具体化的实施例中,从被比特征库中筛选出与待比图像特征相匹配的被比图像特征,包括如下步骤:
20.获取归一化为行向量的待比图像特征;
21.调用被比特征库对应的特征矩阵,该特征矩阵包括多个向量,每个向量用于描述一个被比图像特征;
22.计算所述行向量与所述特征矩阵之间的相似度,以获得所述待比图像特征与被比特征库中各个被比图像特征之间的相似度;
23.筛选出与待比图像特征之间相似度超过预设阈值的前若干个被比图像特征作为所述相匹配的被比图像特征。
24.具体化的实施例中,构造分类数据集,包括如下步骤:
25.根据所述相匹配的被比图像特征确定其展示配图所在的帖文的互动信息,从中提取出表征该帖文的互动活跃程度的量化数据项;
26.选取待比图像特征与所述相匹配的被比特征图像中至少之一的相似度计算确定相似指数,用于表征待比图像特征与所述被比图像特征之间的匹配程度;
27.将所有量化数据项及所述相似指数组合为分类数据集。
28.进一步的实施例中,根据所述相匹配的被比图像特征确定其展示配图所在的帖文的互动信息,从中提取出表征该帖文的互动活跃程度的量化数据项,包括如下步骤:
29.根据所述相匹配的被比图像特征的索引标识确定其对应的展示配图所在的帖文;
30.获取所述帖文的相关联的互动信息,所述互动信息包含表征该帖文的互动活跃程度的量化数据项,量化数据项为发布时间、浏览量、点赞量、评论数量中的任意一种或任意多种;
31.从所述互动信息中提取出一个或多个所述的量化数据项。
32.较佳的实施例中,构造分类数据集,还包括如下前置执行的步骤:
33.获取所述候选商品对象的商品销售信息,从中提取出表征该商品对象的交易信息的量化数据项,量化数据项为销售价格、上架天数、交易评分中任意一项或任意多项。
34.具体化的实施例中,根据所述分类数据集对所述候选商品对象进行分类判决,判决该候选商品对象是否为广告投放的选中商品,包括如下步骤:
35.将所述分类数据集转换为归一化的特征向量;
36.调用预训练至收敛的分类器对所述特征向量进行二分类判决;
37.将二分类的分类判决结果为正向结果的候选商品对象判决为广告投放所需的选中商品,将其添加到商品对象推荐集中。
38.扩展的实施例中,本技术的广告投放选品方法还包括为将用于实施所述的分类判
决的分类器训练至收敛状态而迭代执行的如下具体步骤:
39.调用作为训练样本的商品对象的广告投放历史数据进行判断,判断该商品对象的样本类型为正样本或负样本;
40.提取该训练样本的商品图片的图像特征及商品销售信息中表征该商品对象的交易信息的量化数据项;
41.根据提取出的图像特征从被比特征库中筛选出相匹配的被比图像特征,确定表征待比图像特征与所述被比图像特征之间的匹配程度的相似指数;
42.根据相匹配的被比图像特征确定其帖文的互动信息,提取出表征该帖文的互动活跃程度的量化数据项;
43.调用分类器根据由所有所述量化数据项及所述相似指数构成的分类数据集对训练样本进行分类判决,利用该训练样本的样本类型作为训练标签,修正该分类器的学习参数。
44.扩展的实施例中,本技术的广告投放选品方法还包括如下用于构造所述的被比特征库的步骤:
45.调用数据接口抓取所述社交媒体网站中部分特定用户所发布的帖文存入帖文数据库,提取出其中的展示配图及互动信息;
46.提取出帖文中的所述展示配图中的图像特征;
47.将所述展示配图的图像特征作为被比图像特征,构造出被比特征库;
48.建立被比图像特征在被比特征库中的索引标识到其处于所述帖文数据库中的帖文的映射关系。
49.进一步的实施例中,本技术的广告投放选品方法还包括如下步骤:
50.响应定时触发任务,调用数据接口抓取用于存储所述帖文的帖文数据库中各帖文的互动信息,对应更新该帖文数据库。
51.为解决上述技术问题,本技术采用的另一技术方案是:
52.本技术提供的一种广告投放选品装置,其包括待比获取模块、匹配执行模块、数据构造模块以及分类判决模块,其中:所述待比获取模块,用于获取候选商品对象的商品图片的图像特征作为待比图像特征;所述匹配执行模块,用于从被比特征库中筛选出与待比图像特征相匹配的被比图像特征,每个被比图像特征对应提取自社交媒体网站用户发布的帖文中的一张展示配图;所述数据构造模块,用于构造分类数据集,该分类数据集包含所述相匹配的被比图像特征相对应的帖文的互动信息,以及表征待比图像特征与所述相匹配的被比图像特征之间的匹配程度的相似指数;所述分类判决模块,用于根据所述分类数据集对所述候选商品对象进行分类判决,判决该候选商品对象是否为广告投放的选中商品。
53.为解决上述技术问题,本技术还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行所述广告投放选品方法的步骤。
54.为解决上述技术问题本技术实施例还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行所述广告投放选品方法的步骤。
55.与现有技术相比,本技术具有如下优点:本技术以社交媒体网站用户发布的帖文
的展示配图及互动信息为决策参考,在信息特征的层面,将候选商品对象的图像特征与展示配图的被比图像特征进行对比,先确定出与候选商品对象相匹配的展示配图,然后根据其中最相似的一个或多个展示配图获取其相对应的帖文中的互动信息,将互动信息所表征的活跃程度作为候选商品对象是否适于广告投放的决策依据,以此为广告选品提供技术性解决方案,由于整个过程不仅可以借助帖文来参考商品的受欢迎程度,又可以减少甚至彻底免除对候选商品对象的历史广告数据的信赖,因此,可以为在商品对象中选择广告投放的选品而提供冷启动的解决方案,该方案克服了候选商品对象的历史广告数据稀疏的缺点,无需利用海量的训练数据,无需依赖过多的人工干预,方便高效实现且实现成本低廉可预期,解决了电商广告选品现存的技术痛点。
附图说明
56.本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
57.图1为本技术的广告投放选品方法的典型实施例的流程示意图;
58.图2为本技术的广告投放选品方法确定待比图像特征过程的流程示意图;
59.图3为本技术的广告投放选品方法筛选被比图像特征过程的流程示意图;
60.图4为本技术的广告投放选品方法构造分类数据集的一种流程示意图;
61.图5为本技术的广告投放选品方法提取互动信息的过程的流程示意图;
62.图6为本技术的广告投放选品方法构造分类数据集的另一流程示意图;
63.图7为本技术的广告投放选品方法的分类判决过程的流程示意图;
64.图8为本技术的广告投放选品方法所采用的分类器的训练流程示意图;
65.图9为本技术的广告投放选品方法构造被比特征库的流程示意图;
66.图10为本技术的广告投放选品方法另一实施例的流程示意图;
67.图11为本技术的广告投放选品装置的基本结构示意图;
68.图12为本技术一个实施例的计算机设备的基本结构框图。
具体实施方式
69.下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本技术,而不能解释为对本技术的限制。
70.本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本技术中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
71.本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本技术所属领域中的普通技术人员的一般理解相同的意义。还应该
理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
72.本技术领域技术人员可以理解,这里所使用的“客户端”、“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,进行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他诸如个人计算机、平板电脑之类的通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;pcs(personal communications service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;pda(personal digital assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或gps(global positioning system,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“客户端”、“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“客户端”、“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是pda、mid(mobile internet device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
73.本技术所称的“服务器”、“客户端”、“服务节点”等名称所指向的硬件,本质上是具备个人计算机等效能力的电子设备,为具有中央处理器(包括运算器和控制器)、存储器、输入设备以及输出设备等冯诺依曼原理所揭示的必要构件的硬件装置,计算机程序存储于其存储器中,中央处理器将存储在外存中的程序调入内存中运行,执行程序中的指令,与输入输出设备交互,借此完成特定的功能。
74.需要指出的是,本技术所称的“服务器”这一概念,同理也可扩展到适用于服务器机群的情况。依据本领域技术人员所理解的网络部署原理,所述各服务器应是逻辑上的划分,在物理空间上,这些服务器既可以是互相独立但可通过接口调用的,也可以是集成到一台物理计算机或一套计算机机群的。本领域技术人员应当理解这一变通,不应以此约束本技术的网络部署方式的实施方式。
75.本技术部分技术方案可部署在云端服务器,其可以与业务上相关的服务器实现数据通信连接以协调在线服务,还可与其他相关服务器构成逻辑上相关联的服务机群,来为相关的终端设备例如智能手机、个人计算机、第三方服务器等提供服务。所述的智能手机和个人计算机均可通过公知的网络接入方式接入互联网,与本技术的服务器建立数据通信链路,以便访问和使用所述服务器所提供的服务。
76.对于服务器而言,一般通过提供在线服务的服务引擎开放相应的程序接口供各种终端设备进行远程调用,本技术中适于部署于服务器的相关技术方案,便可以此种方式实现于服务器中。
77.本技术所称的计算机程序,即应用程序,以计算机程序语言开发而成,安装于计算机设备中,包括服务器、终端设备等,用于实现本技术所限定的相关功能,除非特别指定,否则与其所采用的开发语言无关。
78.本领域技术人员对此应当知晓:本技术的各种方法,虽然基于相同的概念而进行描述而使其彼此间呈现共通性,但是,除非特别说明,否则这些方法都是可以独立执行的。同理,对于本技术所揭示的各个实施例而言,均基于同一发明构思而提出,因此,对于相同表述的概念,以及尽管概念表述不同但仅是为了方便而适当变换的概念,应被等同理解。
79.本技术即将揭示的各个实施例,除非明文指出彼此之间的相互排斥关系,否则,各个实施例所涉的相关技术特征可以交叉结合而灵活构造出新的实施例,只要这种结合不背离本技术的创造精神且可满足现有技术中的需求或解决现有技术中的某方面的不足即可。对此变通,本领域技术人员应当知晓。
80.请参阅图1所示本技术的广告投放选品方法在其典型实施例中的基本流程示意图,本技术提供的一种广告投放选品方法,被编程为应用程序运行于计算机设备中,其包括如下步骤:
81.步骤s1100、获取候选商品对象的商品图片的图像特征作为待比图像特征:
82.所述候选商品对象,一般是从电商平台内按照某种意愿或者定制策略预选出的商品对象,一般需符合当地法律法规政策要求、属于目标品类、库存充足等,可由本领域技术人员预先确定。
83.为了获得候选商品对象的图像特征,可以调用经预训练至收敛状态的图像特征提取器来实现,所述的图像特征提取器可为本领域技术人员熟知的用于提取图片中的深层特征的深度学习模型,通常已被训练至收敛状态。例如,基于残差网络的resnet50及其升级版本resnet100等,或者其他各种由本领域人员所熟知或即将获知的适于从图片中提取出深层特征的深度学习模型均可用做本技术的图像特征提取器。
84.一些实施例中,考虑到候选商品图片可能存在一些背景信息需要去除,在进行图像特征提取之前,可以先借助诸如yolo之类的神经网络模型来实现对候选商品图片中的商品对象的精确提取,去除掉相关背景,对此,本领域技术人员自然也应当知晓。
85.利用所述的图像特征提取器将所述的候选商品对象提取出来之后,便获得了商品图片相对应的图像特征,在本技术中即构成所述的待比图像特征。
86.部分实施例中,为了便于后续为待比图像特征计算与被比特征库中各个被比图像特征的相似度,可以在本步骤中先将待比图像特征归一化为一个高维的行向量。当然,在其他实施例中,也可在后续进行所述的归一化,并不局限于在本步骤中执行。
87.步骤s1200、从被比特征库中筛选出与待比图像特征相匹配的被比图像特征,每个被比图像特征对应提取自社交媒体网站用户发布的帖文中的一张展示配图:
88.电子商务平台可以集成由平台方自行部署的服务于其平台用户的社交媒体网站,从而可以从内部获取所述的帖文,当然,所述的社交媒体网站也可以是其他第三方所部署的。
89.所述的社交媒体网站,包括提供微博、朋友圈、论坛等各种社交互动形式的服务的网站类型,其数据通常是网络用户可访问的,因此借助数据授权访问方式可以获取其具体帖文的具体数据。所述的帖文的具体数据,通常包括正文、评论、展示配图以及互动信息。所述展示配图数量可有可无、可多可少,本技术主要关注包含展示配图的帖文。所述互动信息通常包括发布时间、浏览量、点赞量、评论数量以及其他类似性质的信息等。
90.本技术所调用的社交媒体网站中的帖文,通常是经过优选的,主要目的在于获取
特定用户或者特定内容的帖文,例如,某些时尚博主用户长期发布服装产品的动态信息,故可参考其所发布的帖文来考察其所发布的服装产品的受欢迎程度;又如,对于非特定的具有高访问流量的帖文,其帖文也有可能包含某种商品的展示配图,也具有一定的参考价值。一般而言,出于考察商品受欢迎程度的考虑,本技术建议重点参考时尚博主之类的特定用户的帖文。
91.所述的被比特征库,是利用一个或多个社交媒体网站的帖文中的图片资源预构建出来的,这些图片资源一般是与候选商品图片属于相同商品类别的帖文中的展示配图,可以通过自动或人工预选获得。例如,借助yolo之类的神经网络模型对所获取的每个帖文中的每张展示配图进行商品对象定位之后,采用图像特征提取器提取出其中的商品对象的图像特征,将该图像特征输入至预训练至收敛状态的分类器中对该展示配图进行类别判断,确定其所属的商品类别是否属于构建被比特征库所需的商品类别,当属于所需的商品类别时,便可用于构建所述的被比特征库,进而可以对该帖文的相关具体数据进行缓存,存入帖文数据库中,以备后续调用。
92.所述的被比特征库,通常包括多个被目为目标商品类别的展示配图相对应的被比图像特征,可以理解,每个被比图像特征提取自一张所述的展示配图,每个被比图像特征可以借助本技术所用的图像特征提取器从其相应的展示配图中提取而得。为便于索引和后续的相似度的计算,优选的,可将图像特征提取器提取出来的图像特征进行归一化为高维的行向量,然后添加到被比特征库中,由此,被比特征库实际以特征矩阵的形式实现存储。在此基础上,特征矩阵中的行坐标实际上便构成了一个被比图像特征相应的索引标识。
93.为便于索引检索之用,可以利用所述被比图像特征的索引标识,建立起其与其对应的展示配图所在的帖文之间的映射关系,以便后续通过以该索引标识进行检索,来获取该帖文中的展示配图、互动信息等,对此,本领域技术人员可灵活实现。推荐的一种实施例中,预构建有用于缓存所述帖文的帖文数据库,该帖文数据库可以通过定时任务进行日常更新,这种情况下,如需获取帖文的互动信息,只需利用被比图像特征相应的索引标识从帖文数据库中查询获取即可;另一可选的实施例中,为了确保互动信息是最新的,也可查询帖文数据库获取帖文相对应的公网访问地址,通过该访问地址即时获取相应的互动信息。
94.另一种变通的实施例中,可以在所述的帖文数据库中存储各个展示配图的被比图像特征,而在需要进行相似度计算时,才将各个被比图像特征提取出来构造出所述的被比特征库。合并了被比图像特征的帖文数据库中,每张展示配图对应的帖文数据占用该数据库中的一条数据记录,使该展示配图的被比图像特征构成该数据记录的一个字段数据,由此而省去独立标注索引标识的麻烦。由此可以看出,数据被比特征库、帖文数据库内各种数据之间的关系,存在对应映射关系,但其数据库实现形式则可由本领域技术人员灵活处理,只要不影响本技术的顺利调用即可。
95.以上简要给出所述被比特征库的实现原理,后续将通过个别实施例进一步揭示该被比特征库的具体实施过程,此处暂且不表。总而言之,所述的被比特征库一经构建完毕,便可在本技术中被调用。
96.当需要为一个待比图像特征查找出与之相匹配的被比图像特征时,可以应用欧式距离、余弦相似度等公知算法,以待比图像特征的行向量与的被比特征库所表示的特征矩阵进行相似度计算,例如本技术中,将待比图像特征的行向量与特征矩阵的转置矩阵进行
矩阵相乘,由此便可获得一个相似度矩阵,其中存储了所述待比图像特征与被比特征库中的各个被比图像特征之间的相似度,也即存储了候选商品对象的商品图片与被比特征库所指向的各个展示配图之间的相似度。根据相似度矩阵中的相似度数据进行排序之后,选取其中的相似度最大的若干个被比图像特征作为所述的相匹配的被比图像特征即可。至于所选取的相匹配的被比图像特征的数量,可以由本领域技术人员灵活确定,本实施例中假定每次匹配选取三个相似度最大的被比图像特征,以便通过综合多个被比图像特征的相似度来获得更为均衡的参考信息。当然,如为简化计算,也可仅仅选出具有最高相似度的被比图像特征作为所述的相匹配的被比图像特征。
97.可以理解,确定了与待比图像特征相匹配的被比图像特征,也就确定了这些被比图像特征所指向的帖文,进而可以调用帖文的具体数据,例如前述帖文数据库中的帖文的具体数据。
98.需要指出的是,一些相似度检索工具可以被本技术所引用,例如,第三方工具faiss:facebook ai similarity search,faiss是facebook ai研究团队开源的针对聚类和相似性搜索的算法库,它包含一种在任意大小的向量集合中搜索相似向量的新算法,还包含用于评估和参数调整的支持代码。faiss是用c 编写的,带有python/numpy的完整封装,并使用gpu来获得更高的内存带宽和计算吞吐量,因此方便引用和接入,其封装并提供的两种索引和搜索方式faiss.indexflatl2(欧式距离)、faiss.indexflatip(内积),均可实现在本技术的被比特征库中搜索出相匹配的被比图像特征,并获得相应的相似度数据。同理,本技术的被比特征库也可利用faiss提供的索引构建接口来实现。因此,本领域技术人员可灵活选用,而省去自行开发相关代码的麻烦,提升程序开发效率。
99.步骤s1300、构造分类数据集,该分类数据集包含所述相匹配的被比图像特征相对应的帖文的互动信息,以及表征待比图像特征与所述相匹配的被比图像特征之间的匹配程度的相似指数:
100.所述分类数据集,顾名思义,用于作为对所述候选商品对象进行分类以确定其是否构成本技术的选品的依据,本领域技术人员可以通过考察分类数据集的数据所表征的意义,灵活适用各种判定条件或者采集经预训练的基于深度学习的分类器对分类数据集中的数据进行判决,得出候选商品对象是否构成本技术的选品的结论。
101.本实施例中,所述的分类数据集主要包括两类数据,一是基于相匹配的被比图像特征确定的帖文中的互动信息提取出来的量化数据,二是基于相匹配的被比图像特征确定的相似指数,而在本技术的其他扩展的实施例中,还可以进一步包括基于候选商品对象自身的商品销售信息所提取的量化数据,视乎分类器的判断逻辑灵活确定,对此,后续将另行说明。
102.分类数据集中的相似指数是根据待比图像特征与其相匹配的被比图像特征的相似度来综合确定的。本实施例中,如前所述,为待比图像特征筛选出了三个被比图像特征,因此对应获得三个相似度数据,为了使相似指数具有一定的拟合能力,取该三个相似度的均值作为所述的相似指数。而在其他简化的实施例中,如果仅匹配出一个具有最高相似度的被比图像特征,则可将所述的最高相似度直接确定为所述的相似指数。其他实施例,也可对不同的相匹配的被比图像特征所对应的相似度分别关联不同权重,进行线性融合。诸如此类,本领域技术人员应当灵活变通。
103.分类数据集中的互动信息,是根据与待比图像特征具有相匹配的被比图像特征所对应的帖文中的互动信息来确定的,主要是依据所述互动信息中的量化数据项来确定。本实施例中,推荐选取与待比图像特征具有最高相似度的被比图像特征所对应的帖文中的互动信息的量化数据项,因该被比图像特征所对应的展示配图与候选商品对象的商品图片彼此在内容上最相似,故更具代表性。互动信息中的量化数据项,如前所述,包括发布时间、浏览量、点赞量、评论数量等,本技术中可取其中任意之一或任意多项,由本领域技术人员根据实际情况灵活选取即可。可以理解,所述的发布时间代表帖文的时效性,所述浏览量代表帖文的曝光程度,所述的点赞量代表帖文的被认可度,所述的评论数量也代表着博主用户与评论用户之间的讨论的激烈程度,这些量化数据项由于是与帖文中的展示配图关联对应的,因此,对所述的展示配图而言,这些量化数据项具有表征该展示配图的受欢迎程度的意义。
104.构造出所述的分类数据集之后,便可在该分类数据集的基础上,对候选商品对象是否为本技术广告投放的选品做出判决。
105.步骤s1400、根据所述分类数据集对所述候选商品对象进行分类判决,判决该候选商品对象是否为广告投放的选中商品:
106.如前所述,分类数据集至少包含了表示与候选商品对象的商品图片相似的展示配图的受欢迎程度的量化数据以及该商品图片与相匹配的被比图像特征对应的被比图片之间的相似指数,在此基础上,本领域技术人员可以根据分类数据集中的各个数据的特点灵活设计各种分类算法,来判决候选商品对象是否构成本技术广告投放的选品。
107.本技术可采用的分类算法,除了经典机器学习算法,还可基于规则匹配来实施,也可基于深度学习模型所构造的分类器来实施。
108.基于规则匹配来构造所述的分类算法时,本领域技术人员可以根据先验知识,对应分类数据集中的各个量化数据项及所述的相似指数来设计各个经验阈值,然后将分类数据集中的各项数据与各个经验阈值做比较,当满足预设的判决条件时,即视为构成本技术的广告投放所需的选品。必要时,可以运用更为复杂的逻辑运算来构造算法的表达式,以便实现对分类数据集中各项具体数据的判决结果的有机融合,对此,本领域技术人员根据此处的启示,相信可以灵活设计相关基于规则匹配的分类算法来实施之。
109.基于深度学习的深度学习模型来实现的分类器,需预先被训练至收敛状态,可以采用二分类器或多分类器来实现,后续将通过个别实施例来介绍这种分类器的训练过程,使其习得依据本技术的分类数据集进行选品决策的能力,以便服务于本技术,此处暂且不表。
110.本领域技术人员可选的分类器的模型,包括但不限于逻辑斯特回归分类器(logistic)、朴素贝叶斯、决策树等,均为简单的分类器模型,可供实施时参考。
111.根据所述分类数据集对所述候选商品对象进行分类判决之后,若分类判决结果显示对应的分类是适于广告投放的选品相对应的分类,则可将所述的候选商品对象确定为相应的选品,从而完成本技术对候选商品对象是否构成广告投放所需的选品的判决,后续可将所述的选品推荐给相应的商户或者消费者用户,起到广告投放的效果。
112.本技术以社交媒体网站用户发布的帖文的展示配图及互动信息为决策参考,在信息特征的层面,将候选商品对象的图像特征与展示配图的被比图像特征进行对比,先确定
出与候选商品对象相匹配的展示配图,然后根据其中最相似的一个或多个展示配图获取其相对应的帖文中的互动信息,将互动信息所表征的活跃程度作为候选商品对象是否适于广告投放的决策依据,以此为广告选品提供技术性解决方案,由于整个过程不仅可以借助帖文来参考商品的受欢迎程度,又可以减少甚至彻底免除对候选商品对象的历史广告数据的信赖,因此,可以为在商品对象中选择广告投放的选品而提供冷启动的解决方案,该方案克服了候选商品对象的历史广告数据稀疏的缺点,无需利用海量的训练数据,无需依赖过多的人工干预,方便高效实现且实现成本低廉可预期,解决了电商广告选品现存的技术痛点。
113.请参阅图2,具体化的实施例中,所述步骤s1100、获取候选商品对象的商品图片的图像特征作为待比图像特征,包括如下步骤:
114.步骤s1110、获取所述的候选商品对象:
115.电子商务平台在选取广告投放所需的候选商品对象之初,通常先从其商品库中筛选出一个候选集,该候选集中存放多个所述的候选商品对象,后续利用本技术实现的技术方案逐一对各个候选商品对象进行分类判决,以达到广告投放选品的目的。
116.通常,候选集主要用于存放历史广告数据稀疏或者缺乏的候选商品对象,例如商户刚刚上传的新品,或者从未投放过广告的商品等。而且,考虑到同类商品的判决存在共性的特点,一个候选集通常是电商平台中规划为同一品类的商品,以便后续利用针对同一类商品的分类算法进行分类判决。
117.步骤s1120、调用审核接口对该候选商品对象的商品信息实施校验,以确认其为符合预设规范的候选商品对象:
118.考虑到候选商品对象存在各种特点,为了确保本技术技术方案取得高效的分类效果,可以预先设计审核接口对候选商品对象的商品信息实施校验。由此,当从候选集中调出一个候选商品对象时,获取其相对应的商品信息进行校验。
119.对候选商品对象的商品信息进行校验时,可以从以下各个方面任意一项或任意多项入手实施校验:
120.一是考察商品信息中的描述内容是否能通过相关政策要求的审核,例如其中的关键字是否属于违规禁用词,只有通过违规检测的候选商品对象才能继续后续步骤;
121.二是考察候选商品对象的商品信息中的品类信息是否被归类为预设的商品类别,由于本技术的分类算法通常适应不同商品类别的特点而设计,因此,提前对候选商品对象的类别信息进行鉴别,可以过滤掉不适合本技术的分类算法处理的候选商品对象,避免计算机的无效工作;
122.三是考察候选商品对象的库存余量是否超过预设阈值,根据库存余量是否充足而决定其是否有必要进行广告投放。一个实施例中,本技术的技术方案所实现的程序接口提供给商户进行调用,商户提交所述的候选商品对象,此处便对其候选商品对象的库存余量进行校验,如果库存余量低于预设阈值,则其实没有投放广告的必要性,即使投放了广告,也可能因库存不足而导致广告投放低效,因此,对此类候选商品对象,可在此处予以过滤。
123.除以上各项校验之外,本领域技术人员还可根据实际情况选取其中数据项对候选商品对象的商品信息进行校验,最终确保被本技术进行后续处理的候选商品对象是符合平台目标的有效的候选商品对象。
124.步骤s1130、获取通过所述校验的候选商品对象的商品图片:
125.所述候选商品对象表现在程序层面可以是一个商品sku
(stock keeping unit)
或spu
(standard product unit)
,因此,可以根据其sku或spu去进一步获取其商品图片。如商品图片有多张,一般识别出其关键的一张,例如被商户设置为起摘要作用的商品图片。
126.步骤s1140、调用预训练至收敛状态的图像特征提取器从所述商品图片中提取出图像特征作为所述待比图像特征:
127.如前所述,本技术可以采用诸如yolo之类的经预训练的图像特征提取器来直接从所述的商品图片中提取出相应的图像特征,作为本技术所需的待比图像特征。为了便于后续进行相似度计算,可以在本步骤中将所述的待比图像特征进行归一化,将其归一化为高维的行向量。由于所述被比特征库中的被比图像特征通常由同一图像特征提取器提取出,故所述被比图像特征一般也被同样归一化为相同尺度的高维行向量。
128.本实施例对通过对候选商品对象进行预置审核然后调用图像特征提取器对其商品图片进行图像特征提取,获得待比图像特征,实现对候选商品对象的规范性过滤,进一步提升后续分类判决的有效性,提升了广告选品的成功率。
129.请参阅图3,具体化的实施例中,所述步骤s1200、从被比特征库中筛选出与待比图像特征相匹配的被比图像特征,包括如下步骤:
130.步骤s1210、获取归一化为行向量的待比图像特征:
131.如前文各实施例所述,待比图像特征比归一分为行向量,若在先未经归一化,则可在本步骤中处理亦可。
132.步骤s1220、调用被比特征库对应的特征矩阵,该特征矩阵包括多个向量,每个向量用于描述一个被比图像特征:
133.如前所述,可以利用本技术揭示的各种实施方式来构建所述的被比特征库,所述被比特征库本质上体现为一个特征矩阵,该特征矩阵由多个行向量构成,每个行向量描述着一个展示配图的被比图像特征,由此,可知,特征矩阵为n*m的结构,其中n为被比图像特征的总数,即展示配图的总数,而m为图像特征提取器提取出来的图像特征被归一化而成的高维行向量的维数。
134.步骤s1230、计算所述行向量与所述特征矩阵之间的相似度,以获得所述待比图像特征与被比特征库中各个被比图像特征之间的相似度:
135.本实施例中,可以自行实现算法来实现所述待比图像特征的行向量与所述被比特征库的特征矩阵之间的相似度计算。具体而言,先将所述的特征矩阵进行转置获得其转置矩阵,然后,将所述行向量与该转置矩阵进行矩阵相乘,便获得相似度矩阵,由此便得到所述待比图像特征与各个被比图像特征之间的相似度。
136.同理,本技术的其他实施例中,也可采用faiss中的两个精确搜索接口任意之一来实现相似度计算。
137.步骤s1240、筛选出与待比图像特征之间相似度超过预设阈值的前若干个被比图像特征作为所述相匹配的被比图像特征:
138.相似度矩阵中的相似度大小是无序的,因此,需对其进行排序,例如由大至小的排序,然后选出其中的前若干个相似度所对应的被比图像特征,作为与所述待比图像特征相匹配的被比图像特征。此处所筛选出的被比图像特征的数量,仍设为三个。
139.需要注意的是,为了确保所选取出的被比图像特征与待比图像特征之间的相似度
有效,可以根据先验知识灵活设置一个预设阈值,确保所筛选出的相似度均超过这一预设阈值,从而,确保所筛选出的被比图像特征所指向的展示配图与待比图像特征所对应的商品图片之间尽可能的相似。当然,如果超过预设阈值的相似度的数量不足额定数量如上述的三个,也可退而求其次,选取更低相似度的被比图像特征来凑足,或者仅用有限的一个或两个被比图像特征也可。对此,本领域技术人员可灵活处理。
140.本实施例通过揭示实现相似度计算的具体方式,来为与待比图像特征相匹配的被比图像特征的筛选提供具体解决方案,可以看出,基于向量与矩阵之间进行相似度计算,计算量少,而计算效率高,被比特征库的体量越大,本实施例越能体现其优势,特别是将本技术的技术方案用于电商平台中为多商户提供并发服务时,本实施例在运算效率方面体现出的优点将更为明显。
141.请参阅图4,具体化的实施例中,所述步骤s1300、构造分类数据集,包括如下步骤:
142.步骤s1310、根据所述相匹配的被比图像特征确定其展示配图所在的帖文的互动信息,从中提取出表征该帖文的互动活跃程度的量化数据项:
143.在确定出与所述相匹配的被比图像特征之后,实际上便确定了这些被比图像特征对象所对应的展示配图所在的帖文。如前文所述,所述帖文缓存于帖文数据库中,该帖文数据库中各个帖文的互动信息可以每日更新,因此,从帖文数据库中可以获取所述被比图像特征相对应的帖文的互动信息。
144.本实施例中,由于在被比特征库中存在各个被比图像特征的索引标识,例如其在特征矩阵中的行坐标,且该索引标识如前文各实施例所述与帖文数据库中的帖文存在映射关系,因此,可以通过该索引标识在帖文数据库中查找到被比图像特征相应的帖文的互动信息。在所述互动信息可以动态获取的实施例中,也可通过该索引标识查找出相应的帖文的公网访问地址,实时获取该访问地址所指向的帖文的互动信息。无论如何,均可获得与所述相匹配的被比图像特征相对应的互动信息。
145.如前所述,所述互动信息中的量化数据项,优选如前所述的发布时间、浏览量、点赞量、评论数量等,本实施例中,主要选取发布时间、点赞量、评论数量即可,这些量化数据项足以表征相应的帖文的互动活跃程度。
146.本实施例中,考虑到与待比图像特征最相似的被比图像特征更具关联性,因此,可只获取所述的与待比图像特征具有最高相似度的被比图像特征所对应的帖文中的互动信息,从其中提取出相关量化数据项用于构造分类数据集。
147.步骤s1320、选取待比图像特征与所述相匹配的被比特征图像中至少之一的相似度计算确定相似指数,用于表征待比图像特征与所述被比图像特征之间的匹配程度:
148.本实施例中设为待比图像特征筛选出三个所述的被比图像特征,与此同时也获得了三个相似度数据,为了使该相似度数据具有综合表达能力,因此,对该三个相似度数据进行求取均值,作为相似指数,实现数据拟合。该相似指数表征了待比图像特征与筛选出的相匹配的多个被比图像特征之间的综合相似度,也即待比图像特征与筛选出的相匹配的所述被比图像特征之间的匹配程度。适应其他实施例中,例如,如果只筛选出一个具有最高相似度的被比图像特征,则此时可将所述的最高相似度确定为所述的相似指数。
149.步骤s1330、将所有量化数据项及所述相似指数组合为分类数据集:
150.如前所述,依照本技术的分类算法所需,相应地为其构造出其分类数据集,本实施
例由于未考虑候选商品对象的商品销售信息中的量化数据项,因此,所述分类数据集中,仅包含与待比图像特征之间具有最高相似度的被比图像特征所对应的展示配图所在的帖文的互动信息中的量化数据,以及所述的相似指数,构造出所述的分类数据集,然后以该分类数据集提交给本技术的分类算法进行分类判决即可。
151.本实施例中,分类数据集无需依赖候选商品对象的商品销售信息中的量化数据项,仅包括相匹配的被比图像特征所对应的互动信息中的量化数据项,及所述的相似指数,因此,完全借助社交媒体网站中的帖文的互动信息来为候选商品对象的选品判决提供参考信息,使其与历史广告数据解耦,使得实现相关的分类算法时,能够适用于所有的候选商品对象,包括:新上架的商品、没有投放过广告的商品、投放过广告的商品,能降低策略实现成本和维护成本,取得更优的总体效益。
152.请参阅图5,进一步的实施例中,所述步骤s1310、根据所述相匹配的被比图像特征确定其展示配图所在的帖文的互动信息,从中提取出表征该帖文的互动活跃程度的量化数据项,包括如下步骤:
153.步骤s1311、根据所述相匹配的被比图像特征的索引标识确定其对应的展示配图所在的帖文:
154.如前所述的各实施例中,本技术的一种处理方式是为其所获取的社交媒体网站的帖文构建了一个帖文数据库,其中预存储有帖文相关的各种数据,包括正文、评论、展示配图(一般下载到本地并以索引指代)、互动信息等,并且,被比图像特征的在特征矩阵中的索引标识与帖文数据库中相对应的帖文之间存在映射关系,因此,可以根据所述相匹配的被比图像特征的索引标识来检索出其对应的展示配图据的帖文。由于帖文数据库可以定时更新,因此,其互动信息相对是较新的数据。可以理解,由于在本技术的部分实施例中,构造分类数据集所需的互动信息主要是与待比图像特征具有最高相似度的被比图像特征的互动信息,因此,这种情况下,通常也只相应查找到该具有最高相似度的被比图像特征的帖文即可。
155.步骤s1312、获取所述帖文的相关联的互动信息,所述互动信息包含表征该帖文的互动活跃程度的量化数据项,量化数据项为发布时间、浏览量、点赞量、评论数量中的任意一种或任意多种:
156.从帖文数据库中确定出与待比图像特征具有最高相似度的被比图像特征的帖文后,便可获取其相关联,即其拥有的互动信息。
157.步骤s1313、从所述互动信息中提取出一个或多个所述的量化数据项:
158.对于获取到的互动信息,根据本技术的分类算法的需要,从中提取出表征该帖文的互动活跃程度的各项量化数据,如前述的发布时间、点赞量、评论数量等。通常此类数据都是数值型数据,以方便运算和算法实现。
159.本实施例适应本技术中预构建有帖文数据库的情况而能够及时从帖文数据库中获取互动信息,避免通过公网实时获取帖文的互动信息时出现不可触达访问的情况,确保本技术的技术方案得以顺利执行,提高了本技术的技术方案执行的可靠性。
160.请参阅图6,较佳的实施例中,所述步骤s1300、构造分类数据集,还包括如下前置执行的步骤:
161.步骤s1309、获取所述候选商品对象的商品销售信息,从中提取出表征该商品对象
的交易信息的量化数据项,量化数据项为销售价格、上架天数、交易评分中任意一项或任意多项:
162.如前所述,适应本技术的分类算法的具体实现原理,也可在构造所述分类数据集时一并提供商品销售信息相关的量化数据项。具体而言,如果分类算法依赖于商品销售信息进行分类判决,包括需要在实施规则匹配时比较或者需要在实施深度语义学习模型训练时采用,则此处也对应提供商品销售信息中相应的各个量化数据项。对此,本实施例中,可进一步根据候选商品对象的sku或spu去获取其相关联的商品销售信息,以便进行其中量化数据项的提取。
163.当需要在分类数据集中加入候选商品对象的商品销售信息中的量化数据项时,此处所称的量化数据项主要包括诸如商品定价、上架天数、交易评分以及其他类似项等中的任意一项或任意多项,所述商品定价代表该商品对象的竞争力,所述上架天数代表该商品对象的时效性,所述交易评分代表该商品对象的已购买用户对该商品对象的量化评价指数,因此,也具有表征该候选商品对象的受欢迎程度的意义。对这些量化数据项的选用,主要视分类算法的实现原理对应选定,可由本领域技术人员根据各个量化数据项所分别代表的意义来确定其中的任意一项或者任意多项,以及灵活扩增其他具有同类意义的量化数据项。
164.可以看出,商品销售信息中的量化数据项,也是优先选取数值型数据,以便提高实现和运行效率。
165.本实施例通过向分类数据集中添加商品销售信息中的量化数据项,与分类算法的分类判决条件实现适配,来实现对分类判决的依据的强化,使得本技术进一步可以利用更为丰富的信息来对候选商品对象是否适合构成广告投放的选品做出更为准确的判决,实现依据候选商品对象本身的商品销售信息以及与其相似的帖文的互动信息来做广告投放选品的综合判决,增强了本技术的技术方案的精准选品能力。
166.请参阅图7,具体化的实施例中,所述步骤s1400、根据所述分类数据集对所述候选商品对象进行分类判决,判决该候选商品对象是否为广告投放的选中商品,包括如下步骤:
167.步骤s1410、将所述分类数据集转换为归一化的特征向量:
168.本实施例中,本技术采用logistic二分类器,在将该分类器预训练至收敛状态后,用于本技术中进行分类判决。
169.可以理解,对于所述的分类器而言,当所述分类数据集被输入时,无论该分类数据集按照前述何一实施例组织,均会被归一化为一个统一的特征向量,以便在此基础上进行分类判决。
170.步骤s1420、调用预训练至收敛的分类器对所述特征向量进行二分类判决:
171.由于所述分类器已经预训练至收敛状态,因此具有本技术所需的分类判决能力,于是,其将利用所述由分类数据集转换而成的特征向量进行运算,计算该特征向量对应于各个分类的概率值,其中概率值最大者的分类若表征是合格选品,则该候选商品对象便构成本技术广告投放所需的选品,否则便不构成所述的选品。
172.可以理解,由于本技术只需对选品与否做出判决,因此,本实施例中选用一个二分类器即可,由此,一个候选商品对象被分类而得结果,只有正向结果与负向结果两个分类结果,其中正向结果是指构成选品,负向结果是指构成非选品,如此更为高效明确。
173.至于本技术所采用的分类器的训练过程,本领域技术人员可以灵活实施,后文将通过个别实施例来推荐一种训练方式,此处暂且不表。
174.步骤s1430、将二分类的分类判决结果为正向结果的候选商品对象判决为广告投放所需的选中商品,将其添加到商品对象推荐集中:
175.分类判决结果为正向结果的候选商品对象,自然而然地,被判决为广告投放所需的选中商品,本技术可以构造一个商品对象推荐集,将选中的商品添加到该商品对象推荐集中,以备后用。后续需要进行广告投放时,从该商品对象推荐集中调用各个选品直接进行广告投放,推荐给相关用户或接口即可。
176.本实施例进一步简化本技术的实现,采用二分类器便实现了对候选商品对象的选品判决,实现简便,运行高效,又借助分类数据集充分参考了各方信息价值,因此,以较低成本实现了较高的广告投放选品效率。
177.请参阅图8,扩展的实施例中,本技术的广告投放选品方法还包括为将用于实施所述的分类判决的分类器训练至收敛状态而迭代执行的如下具体步骤:
178.步骤s2100、调用作为训练样本的商品对象的广告投放历史数据进行判断,判断该商品对象的样本类型为正样本或负样本:
179.以本技术的分类器采用二分类器为例,该分类器基于logistic算法,需经预先训练。
180.预备一个训练样本库,其中所包含的训练样本,即为各个商品对象,具体因考虑到将在分类数据集中包含候选商品对象的商品销售信息中的量化数据项进行分类判决,因此,此处的分类器示例,也将借助其商品销售信息进行训练。
181.为了体现出分类判决对于广告前景的预测能力,可以优选一些具有优质的广告投放历史数据的商品对象作为正样本,将余者视为负样本。所述的广告投放历史数据,可以选取商品对象的订单量、roas(广告支出回报率)、成交金额中的一个或综合多个,或者引入其他类似的数据等。根据优选的广告投放历史数据,判断一个商品对象相应的数据是否达到预设阈值,当达到预设阈值时,便将其判定为正样本,而未达到预设阈值的商品对象则为负样本。例如,以roas为例,当roas>=2时,判定为正样本;当roas<2时,判定为负样本。
182.步骤s2200、提取该训练样本的商品图片的图像特征及商品销售信息中表征该商品对象的交易信息的量化数据项:
183.为了使本实施例的分类器习得依据商品销售信息中的量化数据项进行选品分类判决的能力,对于作为训练样本的商品对象的商品图片,在利用本技术的图像特征提取器提取出其图像特征之后,还需进一步获取该商品对象的商品销售信息中的表征该商品对象的交易信息的量化数据项,此处关于量化数据项的具体类型的选取,可参阅前述各实施例,由本领域技术人员灵活选取。
184.步骤s2300、根据提取出的图像特征从被比特征库中筛选出相匹配的被比图像特征,确定表征待比图像特征与所述被比图像特征之间的匹配程度的相似指数:
185.基于本技术如前所述的过程,可以理解,在训练阶段,同理可将作为训练样本的商品图片中提取出的图像特征,与被比特征库中的各个被比图像特征进行相似度计算,然后筛选出与之相匹配的被比图像特征,确定其中具有最高相似度的被比图像特征,利用一个或多个相似度排序靠前的被比图像特征的相似度的均值确定出其相似指数。
186.步骤s2400、根据相匹配的被比图像特征确定其帖文的互动信息,提取出表征该帖文的互动活跃程度的量化数据项:
187.由于本实施例中只需用到与训练样本的图像特征具有最高相似度的被比图像特征的互动信息,因此,根据所述具有最高相似度的被比图像特征的索引标识查找到帖文数据库中的互动信息,然后从中提取出本领域技术人员根据本技术的揭示所确定的相关量化数据项即可。
188.步骤s2500、调用分类器根据由所有所述量化数据项及所述相似指数构成的分类数据集对训练样本进行分类判决,利用该训练样本的样本类型作为训练标签,修正该分类器的学习参数:
189.在先获得训练样本相对应的商品销售信息中的量化数据项、与训练样本具有最高相似度的被比图像特征所对应的互动信息中的量化数据项,以及所述的相似指数,利用这些数据便可构造出分类器所需的分类数据集,然后将这一分类数据集输入分类器供其进行分类判决,便可获得相应的二分类判决结果。
190.本技术的logistic分类器训练过程简单,其所引用的参考信息主要来自社交媒体网站中的帖文,无需过度依赖历史广告投放数据,使得分类器不依赖海量训练样本便可习得对商品对象的广告投放选品的分类判决能力,训练成本低,训练成果高效。
191.请参阅图9,扩展的实施例中,本技术的广告投放选品方法还包括如下用于构造所述的被比特征库的步骤:
192.步骤s3100、调用数据接口抓取所述社交媒体网站中部分特定用户所发布的帖文存入帖文数据库,提取出其中的展示配图及互动信息:
193.本技术为了便于实现对所述帖文的缓存,为本技术的分类判决提供趋势判断参考信息,提升本技术执行分类判决时的响应速率,因此在本实施例中,通过调用数据接口抓取一个或多个社交媒体网站中部分特定用户所发布的帖文。
194.所述的特定用户,可以是本领域技术人员为实现本技术的目的所预先识别出来的特定用户,例如,对于服装类商品而言,特定用户可以是一些时尚博主;对于汽车类商品而言,特定用户可以是一些汽车博主,以此类推。
195.当利用数据接口获得所述特征用户所发布的帖文之后,便可将其进行格式化存入帖文数据库中。可以理解,所述帖文数据库一般是按数据库结构进行存储的,因此,对于所述帖文中的各种数据,特别是其中的展示配图、互动信息等,可优先提取出以便在帖文数据库中进行结构化存储,以便后续调用时体现更高的访问效率。
196.步骤s3200、提取出帖文中的所述展示配图中的图像特征:
197.帖文中的展示配图,其原图一般以文件存储在本地,帖文数据库一般仅存储其在本地的获取地址,除此之外,适应本技术的需要,还需借助本技术的图像特征提取器提取出所述展示配图的图像特征,该图像特征一般被归一化为高维行向量。如前所述,该图像特征既可以与帖文关联性存储于帖文数据库中,也可另建映射关系数据库实现这种关联性存储。
198.步骤s3300、将所述展示配图的图像特征作为被比图像特征,构造出被比特征库:
199.为了便于本技术进行分类判决时高效调用,可以先构造一个空的特征矩阵,然后将所提取出的每个展示配图的图像特征,陆续添加到该特征矩阵中,最终便构造出本技术
的被比特征库,该被比特征库存储了本技术的各个展示配图的图像特征,每个图像特征即所述的被比图像特征,均为具有归一化尺度的向量。
200.步骤s3400、建立被比图像特征在被比特征库中的索引标识到其处于所述帖文数据库中的帖文的映射关系:
201.适应被比特征库专用于存储各个被比图像特征这一现实,为了方便依据被比图像特征倒查其对应的帖文,因此,需要建立起被比图像特征到所述帖文数据库中的对应的帖文之间的映射,因此,可以将被比图像特征在被比特征库中的索引标识存储到帖文数据库中相应帖文的字段中,建立两者之间的映射关系。由于被比图像特征的索引标识可以在本技术计算相似度的过程中被一一对应传递,因此,可以理解,最终可以利用该索引标识来实现对帖文的对应倒查,故可利用本技术与待比图像特征相匹配的被比图像特征来倒查到相应的帖文,然后从该帖文中获取到相应的互动信息,进而提取出其中的量化数据项。
202.本实施例进一步揭示了被比特征库的构建过程,丰富了本技术的分类判决所需的参考信息,可以看出,本实施例由于借助了社交媒体网站的公开资源来提取本技术的广告投放选品做分类判决所需的参考信息,其实现成本较低,却行之有效,由于各类特定用户往往引领着潮流,代表着趋势,据此参考信息对候选商品对象做出的广告投放趋势判决,有其合理性和有效性。
203.请参阅图10,进一步的实施例中,本技术的广告投放选品方法还包括如下步骤:
204.步骤s1500、响应定时触发任务,调用数据接口抓取用于存储所述帖文的帖文数据库中各帖文的互动信息,对应更新该帖文数据库:
205.适应本技术中构建有帖文数据库的实施例,为了确保帖文数据库中帖文的互动信息能够代表最新现实动态,且又避免向社交媒体网站实时获取数据,因此,本实施例利用数据解耦机制,配置一个定时触发任务,定时触发对帖文数据库内帖文数据的更新。
206.所述的定时触发任务,可以配置为按周、按日或者按时来触发,一旦触发一个定时任务,本技术便调用数据接口重新抓取帖文数据库中各个帖文的最新动态信息,主要是各帖文中的互动信息,然后对应更新帖文数据库中相应的内容即可。所述帖文在其源头社交媒体网站中的数据,除了互动信息之外,其余部分一般并不会产生变动,因此,重新爬取帖文时,一般无需考虑互动信息之外的更新。可以理解,为了方便重新爬取帖文,可在帖文数据库中关联各帖文存储帖文相对应的源头访问地址。
207.由本实施例可以看出,所述帖文在定时任务的控制下,被有规律地更新,因此,其互动信息一般保持对现实动态的反映能力,但是由于其预先被存入帖文数据库中,又使得本技术的技术方案在实施时,无需动态实时向源头社交媒体网站获取帖文的互动信息,避免因为帖文无法触及访问而造成本技术的技术方案无法完整执行,实现了数据解耦,确保本技术技术方案执行时的安全性和可靠性。
208.请参阅图11,本技术实施例还提供一种广告投放选品装置,其包括待比获取模块1100、匹配执行模块1200、数据构造模块1300以及分类判决模块1400,其中:所述待比获取模块1100,用于获取候选商品对象的商品图片的图像特征作为待比图像特征;所述匹配执行模块1200,用于从被比特征库中筛选出与待比图像特征相匹配的被比图像特征,每个被比图像特征对应提取自社交媒体网站用户发布的帖文中的一张展示配图;所述数据构造模块1300,用于构造分类数据集,该分类数据集包含所述相匹配的被比图像特征相对应的帖
文的互动信息,以及表征待比图像特征与所述相匹配的被比图像特征之间的匹配程度的相似指数;所述分类判决模块1400,用于根据所述分类数据集对所述候选商品对象进行分类判决,判决该候选商品对象是否为广告投放的选中商品。
209.具体化的实施例中,所述待比获取模块1100包括:商品获取子模块,用于获取所述的候选商品对象;商品校验子模块,用于调用审核接口对该候选商品对象的商品信息实施校验,以确认其为符合预设规范的候选商品对象;图片获取子模块,用于获取通过所述校验的候选商品对象的商品图片;特征提取子模块,用于调用预训练至收敛状态的图像特征提取器从所述商品图片中提取出图像特征作为所述待比图像特征。
210.具体化的实施例中,所述匹配执行模块1200包括:待比归一子模块,用于获取归一化为行向量的待比图像特征;被比调用子模块,用于调用被比特征库对应的特征矩阵,该特征矩阵包括多个向量,每个向量用于描述一个被比图像特征;相似计算子模块,用于计算所述行向量与所述特征矩阵之间的相似度,以获得所述待比图像特征与被比特征库中各个被比图像特征之间的相似度;匹配筛选子模块,用于筛选出与待比图像特征之间相似度超过预设阈值的前若干个被比图像特征作为所述相匹配的被比图像特征。
211.具体化的实施例中,所述数据构造模块1300包括:互动提取子模块,用于根据所述相匹配的被比图像特征确定其展示配图所在的帖文的互动信息,从中提取出表征该帖文的互动活跃程度的量化数据项;指数确定子模块,用于选取待比图像特征与所述相匹配的被比特征图像中至少之一的相似度计算确定相似指数,用于表征待比图像特征与所述被比图像特征之间的匹配程度;集合构造子模块,用于将所有量化数据项及所述相似指数组合为分类数据集。
212.进一步的实施例中,互动提取子模块包括:帖文确定孙模块,用于根据所述相匹配的被比图像特征的索引标识确定其对应的展示配图所在的帖文;动态获取孙模块,用于获取所述帖文的相关联的互动信息,所述互动信息包含表征该帖文的互动活跃程度的量化数据项,量化数据项为发布时间、浏览量、点赞量、评论数量中的任意一种或任意多种;互动量化孙模块,用于从所述互动信息中提取出一个或多个所述的量化数据项。
213.较佳的实施例中,所述数据构造模块1300还包括:交易量化子模块,用于获取所述候选商品对象的商品销售信息,从中提取出表征该商品对象的交易信息的量化数据项,量化数据项为销售价格、上架天数、交易评分中任意一项或任意多项。
214.具体化的实施例中,所述分类判决模块1400包括:向量转换子模块,用于将所述分类数据集转换为归一化的特征向量;分类执行子模块,用于调用预训练至收敛的分类器对所述特征向量进行二分类判决;选品执行子模块,用于将二分类的分类判决结果为正向结果的候选商品对象判决为广告投放所需的选中商品,将其添加到商品对象推荐集中。
215.扩展的实施例中,本技术的广告投放选品装置还包括为将用于实施所述的分类判决的分类器训练至收敛状态而迭代执行的如下模块:训练时样本分类模块,用于调用作为训练样本的商品对象的广告投放历史数据进行判断,判断该商品对象的样本类型为正样本或负样本;训练时交易量化模块,用于提取该训练样本的商品图片的图像特征及商品销售信息中表征该商品对象的交易信息的量化数据项;训练时特征匹配模块,用于根据提取出的图像特征从被比特征库中筛选出相匹配的被比图像特征,确定表征待比图像特征与所述被比图像特征之间的匹配程度的相似指数;训练时动态量化模块,用于根据相匹配的被比
图像特征确定其帖文的互动信息,提取出表征该帖文的互动活跃程度的量化数据项;训练时分类判决模块,用于调用分类器根据由所有所述量化数据项及所述相似指数构成的分类数据集对训练样本进行分类判决,利用该训练样本的样本类型作为训练标签,修正该分类器的学习参数。
216.扩展的实施例中,本技术的广告投放选品装置还包括如下用于构造所述的被比特征库的模块:数据抓取模块,用于调用数据接口抓取所述社交媒体网站中部分特定用户所发布的帖文存入帖文数据库,提取出其中的展示配图及互动信息;特征处理模块,用于提取出帖文中的所述展示配图中的图像特征;图库构造模块,用于将所述展示配图的图像特征作为被比图像特征,构造出被比特征库;映射确立模块,用于建立被比图像特征在被比特征库中的索引标识到其处于所述帖文数据库中的帖文的映射关系。
217.进一步的实施例中,本技术的广告投放选品装置还包括定时更新模块,用于响应定时触发任务,调用数据接口抓取用于存储所述帖文的帖文数据库中各帖文的互动信息,对应更新该帖文数据库。
218.本技术实施例还提供计算机设备。具体请参阅图12,图12为本实施例计算机设备基本结构框图。
219.如图12所示,计算机设备的内部结构示意图。该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种广告投放选品方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种广告投放选品方法。该计算机设备的网络接口用于与终端连接通信。可以理解,图12中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
220.本实施方式中处理器用于执行图11中各个模块/子模块的具体功能,存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。本实施方式中的存储器存储有广告投放选品装置中执行所有子模块所需的程序代码及数据,服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
221.本技术还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例的广告投放选品方法的步骤。
222.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(read

only memory,rom)等非易失性存储介质,或随机存储记忆体(random access memory,ram)等。
223.综上所述,本技术利用社交媒体网站的帖文为商品对象的广告投放选品提供参考信息,使得选品过程中无需过度依赖广告投放历史数据,而能实现对适于广告投放的商品
对象进行有效的选品,本技术的分类判决过程实现成本低,运行高效。
224.本技术领域技术人员可以理解,本技术中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本技术中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本技术中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
225.以上所述仅是本技术的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献