一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种反推商品推广笔记所购买竞价词的方法与流程

2021-10-24 10:46:00 来源:中国专利 TAG:数据处理 竞价 购买 推广 笔记


1.本发明涉及数据处理技术领域,尤其是一种反推商品推广笔记所购买竞价词的方法。


背景技术:

2.随着电子商务平台在中国兴起后,网购消费在人们生活中的重要性不断提高,网购已成消费者消费重要渠道。淘宝,抖音、快手、西瓜视频、小红书等平台,由于其转化率高,营销效果好,逐渐成为电商平台、内容平台的新增长动力,加速了消费转化,为商家带来了更高的流量。
3.目前,小红书app作为基于用户各类真实产品测评的讨论社区,广受大众欢迎;它的这一特质吸引了许多品牌方进入该社区,并以在小红书笔记中投放商业广告的形式来获取大众的关注。随着这种商业模式逐渐成熟,小红书平台向品牌方提供了竞价词的服务,品牌方可以通过竞价热门关键词(购买竞价词),提高商品展示在用户相应搜索界面的排名,从而获得更高的流量及收益;具体地,品牌方购买一个或者多个竞价词后,小红书平台根据该笔记购买的竞价词,给出一系列与竞价词相关的备选词(又称相关竞价词),形成备选词表,在广告投放期间,用户搜索备选词表中的任意备选词,该笔记都能被关联并优先展示在搜索结果界面中。然而,对于品牌方而言,在庞大的词库与浩繁的汉字组合中寻找一个用语精准切合消费者心理、吸引众多流量的竞价词需要耗费巨大的精力,本专利通过对热门笔记进行反推,推算出该热门笔记最有可能实际购买的一个或多个竞价词,从而为品牌方购买竞价词给出建议,或为其在平台上的竞价营销提供数据参考,或者帮助品牌方了解竞品的动向或者平台推广品牌及品类趋势。


技术实现要素:

4.本发明的目的在于针对现有技术的情况,提供一种反推商品推广笔记所购买竞价词的方法,该方法反推得到的竞价词与笔记相关性最高,且用词更为精准、自然,能够贴合产品卖点以及消费者的需求和心理。
5.为了实现上述目的,本发明采用以下技术方案:
6.一种反推商品推广笔记所购买竞价词的方法,其包括以下步骤:
7.1)采集具有商品推广信息的笔记、与该笔记相关的品牌信息以及关联该笔记的备选词表;
8.2)判断备选词表是否为空,若是,则输出反推竞价词表为空,若否,则判断品牌信息是否异常;
9.3)当品牌信息没有异常时,对备选词表中所有备选词进行n

gram字符串拆解,其中,n大于等于2且n为整数,删除只出现一次的字符串后,得到字符串表;判断字符串表是否为空,若是,则输出反推竞价词表为空,若否,则执行步骤4);
10.4)从字符串表中提取有效高频短语,得到有效高频短语词表;判断有效高频短语
词表是否为空,若是,则输出反推竞价词表为空,若否,则执行步骤5);
11.5)初始化备选词表,删除包含其他品牌信息的备选词,之后判断备选词表是否为空,若是,输出反推竞价词表为空,若否,则执行步骤6);
12.6)根据有效高频短语词表中有效高频短语计算备选词表中所有备选词的得分和差异度,筛选出有效备选词,得到有效备选词表;判断有效备选词表是否为空,若是,则输出反推竞价词表为空,若否,则执行步骤7);
13.7)删除有效备选词表中已被其余备选词包含的备选词,取得分最高的前五个备选词作为反推得到的最有可能被实际购买的竞价词,输出反推竞价词,并存入反推竞价词表;
14.8)根据反推竞价词表对初始的备选词表中所有备选词进行分类,输出分类得到的备选词及对应分类,同时输出该笔记及相关品牌信息。
15.作为优选,步骤2)中判断品牌信息是否异常的方法,包括以下步骤:
16.2.1)判断品牌信息是否为空,若是,则执行步骤2.2),若否,则执行步骤2.3);
17.2.2)设置品牌为编号0,表示排异所有品牌;
18.2.3)判断品牌信息是否非常规编码,若是,则判断品牌信息能否转换为常规编码,若能,将品牌信息转换为常规编码,若不能,将品牌信息设定为空,并执行步骤2.2)。
19.作为优选,步骤3)中对备选词表中所有备选词进行n

gram字符串拆解的方法为:将备选词表中所有备选词统一大写,以固定长度n遍历备选词得到一系列短语。
20.作为优选,步骤4)中从字符串表中提取有效高频短语的方法,包括以下步骤:
21.4.1)根据初始的备选词数据量设定高频比例;
22.4.2)将字符串表按词频递减排序,并按高频比例筛选出高频短语,存入高频短语词表;
23.4.3)删除高频短语词表中已被其余短语包含的高频短语;
24.4.4)删除高频短语词表中包含其他品牌信息的高频短语,得到有效高频短语,存入有效高频短语词表。
25.作为优选,步骤4.1)根据初始的备选词数据量设定高频比例的方法为:判断备选词数量是否超过n个,若是,则设定高频比例为25%,若否,则设定高频比例为75%;其中n为自然数。较佳地,n等于100。
26.作为优选,步骤4.3)中删除高频短语词表中已被其余短语包含的高频短语的方法,包括以下步骤:
27.4.3.1)判断高频短语词表是否为空,若是,则返回空列表,若否,则执行步骤4.3.2);
28.4.3.2)新建ac自动机遍历添加高频短语词表中的高频短语,存入数据结构中;
29.4.3.3)判断是否遍历高频短语词表直至取完,若否,则执行步骤4.3.4),若是,则执行步骤4.3.5);
30.4.3.4)调用ac自动机遍历各个高频短语,判断各个高频短语是否包含除本身之外列表中的高频短语,若是,则将包含的高频短语记录至待删除列表中;
31.4.3.5)将去重后的待删除列表中的高频短语从高频短语词表中删除,返回高频短语词表。
32.作为优选,步骤4.4)中删除高频短语词表中包含其他品牌信息的高频短语的方
法,包括以下步骤:
33.4.4.1)新建ac自动机遍历添加预设品牌库中的品牌信息,存入数据结构中;其中,品牌信息包括品牌名和品牌编号;
34.4.4.2)判断是否遍历高频短语直至取完,若是,则返回有效高频短语词表,若否,则执行步骤4.4.3);
35.4.4.3)调用ac自动机遍历各个高频短语,判断高频短语中是否检测到品牌信息,若否,则执行步骤4.4.4),若是,则执行步骤4.4.5);
36.4.4.4)保留该高频短语;
37.4.4.5)判断检测到的品牌信息是否与该笔记相关的品牌信息一致,若否,则从高频短语词表中删除该高频短语词,若是,则执行步骤4.4.4)。
38.作为优选,步骤5)中初始化备选词表,删除包含其他品牌信息的备选词的方法,包括以下步骤:
39.5.1)判断是否遍历备选词直至取完,若是,则返回备选词表,若否,则执行步骤5.2);
40.5.2)调用遍历预设品牌库的ac自动机遍历各个备选词,判断备选词中是否检测到品牌信息,若否,则执行步骤5.3),若是,则执行步骤5.4);
41.5.3)保留该备选词;
42.5.4)判断检测到的品牌信息是否与该笔记相关的品牌信息一致,若否,则从备选词表中删除该备选词,若是,则执行步骤5.3)。
43.作为优选,步骤6)中根据有效高频短语计算备选词的得分的方法,包括以下步骤:
44.6.1.1)根据词频计算高频短语分值score
i
=count
i
/∑count
i
,其中,i为自然数,判断是否遍历备选词表直至取完,若是,则记录得分大于0的备选词及对应得分,若否,则执行步骤6.1.2);
45.6.1.2)判断是否遍历高频短语及对应分值直至取完,若是,则记录备选词的累计得分,若否,则执行步骤6.1.3);
46.6.1.3)判断备选词中是否含有该高频短语,若是,则累加高频短语对应分值。
47.作为优选,步骤6)中根据有效高频短语计算备选词的差异度err=diff(w,list)/w的方法,包括以下步骤:
48.6.2.1)新建ac自动机遍历添加高频短语及对应长度,判断是否遍历备选词表直至取完,若是,则差异度=剩余长度/备选词原长度,若否,则执行步骤6.2.2);
49.6.2.2)调用ac自动机遍历各个备选词,判断各个备选词是否包含大于一个的高频短语,若否,则剩余长度=备选词原长度

所包含的一个高频短语的长度,若是,则执行步骤6.2.3);
50.6.2.3)判断该备选词包含高频短语的位置是否存在重叠,若否,则执行步骤6.2.4),若是,去除重叠对象中长度较短的高频短语,之后执行步骤6.2.4);
51.6.2.4)剩余长度=备选词原长度

所包含的多个高频短语的长度。
52.作为优选,步骤6)中根据得分和差异度筛选有效备选词的方法,包括以下步骤:
53.6.3.1)根据现有的备选词数据量设定高频比例。
54.6.3.2)按差异度递增排序,并按高频比例筛选现有的备选词;
55.6.3.3)按得分递减排序,并按高频比例筛选剩余的备选词,存入有效备选词表;
56.6.3.4)判断有效备选词表是否为空,若是,则返回空列表,若否,则执行步骤6.3.5);
57.6.3.5)对有效备选词表中相同得分的备选词,只保留差异度最小者,返回有效备选词表。
58.作为优选,步骤7)中删除有效备选词表中已被其余备选词包含的备选词的方法,包括以下步骤:
59.7.1)ac自动机遍历添加有效备选词表中的备选词,判断是否遍历备选词直至取完,若是,则执行步骤7.2),若否,则执行步骤7.3);
60.7.2)将去重后的待删除列表中的词从输入词表中删除,返回有效备选词表;
61.7.3)调用ac自动机遍历该备选词,判断该备选词是否包含除本身之外列表中的备选词,若是,则将包含的备选词记录到待删除列表中。
62.作为优选,步骤8)中根据反推竞价词表对初始的备选词表中所有备选词进行分类的方法,其包括以下步骤:
63.8.1)将反推竞价词表中的反推竞价词进行编号,根据相关性计算备选词在各反推竞价词维度上的得分,并遍历所有备选词直至取完,判断最高得分是否为0,若是,则执行步骤8.2),若否,则执行步骤8.5);
64.8.2)调用遍历预设品牌库的ac自动机遍历备选词,判断备选词中是否检测到品牌名,若是,则执行步骤8.3),若否,则执行步骤8.4);
65.8.3)判断备选词中检测到的品牌名是否与该笔记相关的品牌信息一致,若是,则将该备选词的分类设为“品牌其他相关产品”,若否,则执行步骤8.4);
66.8.4)将该备选词的分类设为“其他”;
67.8.5)调用遍历预设品牌库的ac自动机遍历备选词,判断备选词中是否检测到品牌名,若是,则执行步骤8.6),若否,则执行步骤8.7);
68.8.6)判断备选词中检测到的品牌名是否与该笔记相关的品牌信息一致,若否,则执行步骤8.4),若是,则执行步骤8.7);
69.8.7)将该备选词的分类设为最高得分维度对应的竞价词。
70.作为优选,步骤8.1)中根据相关性计算备选词在各反推竞价词维度上的得分的方法,其包括以下步骤:
71.8.1.1)判断是否遍历反推竞价词直至取完,若是,则返回备选词在各竞价词维度上的得分,若否,则执行步骤8.1.2);
72.8.1.2)对各反推竞价词进行n

gram字符串拆解,新建ac自动机遍历添加拆解后的字符串及对应长度,遍历所有备选词直至取完;
73.8.1.3)调用ac自动机遍历各个备选词,判断各个备选词是否包含反推竞价词的子字符串,若是,则为该备选词在当前竞价词维度累计子字符串的长度作为得分。
74.进一步,步骤8)根据反推竞价词表对初始的备选词表中所有备选词进行分类,之后去除与分类所含商品有异的备选词,再输出分类得到的备选词及对应分类,同时输出该笔记及相关品牌信息。
75.作为优选,去除与分类所含商品有异的备选词的方法,其包括以下步骤:
76.9.1)判断是否遍历备选词及其分类结果直至取完,若是,则返回备选词及对应分类,若否,则执行步骤9.2);
77.9.2)判断备选词分类结果是否为某一反推竞价词,若是,则执行步骤9.3);
78.9.3)提取备选词及其分类的商品信息,判断提取两者是否都不为空,若是,则判断两者是否存在交集,若不存在交集,则将该备选词的分类更改为“其他”。
79.作为优选,步骤9.3)中提取备选词及其分类的商品信息的方法,其包括以下步骤:
80.9.3.1)ac自动机遍历添加预设商品库中的商品名及商品编号,存入商品信息列表;
81.9.3.2)判断ac自动机是否将商品信息列表遍历备选词直至取完,若是,则返回识别到的商品编号,若否,则执行步骤9.3.3);
82.9.3.3)调用ac自动机遍历备选词,判断备选词中是否检测到商品名,若是,则返回识别到的商品编号,若否,则返回空列表。
83.本发明采用以上技术方案,通过采集诸如小红书平台上热门笔记,该笔记相关的品牌信息以及平台给出的关联该笔记的备选词表(又称相关竞价词表),找出其中频繁出现的信息,通过计算备选词与这些核心信息的关联度(越大越好)和差异度(越小越好),推算出其中最有可能被实际购买的一个或多个竞价词,从而为品牌方购买竞价词给出建议,或为其在平台上的竞价营销提供数据参考,或者帮助品牌方了解竞品的动向或者平台推广品牌及品类趋势。
附图说明
84.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
85.图1为本发明反推商品推广笔记所购买竞价词的方法的流程框图;
86.图2为本发明步骤2)判断品牌信息是否异常的方法的流程框图;
87.图3为本发明步骤4)从字符串表中提取有效高频短语的方法的流程框图;
88.图4为本发明步骤4.3)删除高频短语词表中已被其余短语包含的高频短语的方法的流程框图;
89.图5为本发明步骤4.4)删除高频短语词表中包含其他品牌信息的高频短语的方法的流程框图;
90.图6为本发明步骤5)初始化备选词表,删除包含其他品牌信息的备选词的方法的流程框图;
91.图7为本发明步骤6)根据有效高频短语计算备选词的得分的方法的流程框图;
92.图8为本发明步骤6)根据有效高频短语计算备选词的差异度的方法的流程框图;
93.图9为本发明步骤6)根据得分和差异度筛选有效备选词的方法的流程框图;
94.图10为本发明步骤7)删除有效备选词表中已被其余备选词包含的备选词的方法的流程框图;
95.图11为本发明步骤8)根据反推竞价词表对初始的备选词表中所有备选词进行分
类的方法的流程框图;
96.图12为本发明步骤8.1)根据相关性计算备选词在各反推竞价词维度上的得分的方法的流程框图;
97.图13为本发明去除与分类所含商品有异的备选词的方法的流程框图。
具体实施方式
98.为了使本发明的目的、技术方案及优点更加简洁明了,本发明将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
99.如图1

13之一所示,本发明反推商品推广笔记所购买竞价词的方法,其包括以下步骤:
100.1)采集具有商品推广信息的笔记、与该笔记相关的品牌信息以及关联该笔记的备选词表;
101.2)判断备选词表是否为空,若是,则输出反推竞价词表为空,若否,则判断品牌信息是否异常;
102.3)当品牌信息没有异常时,对备选词表中所有备选词进行n

gram字符串拆解,其中,n大于等于2且n为整数,删除只出现一次的字符串后,得到字符串表;判断字符串表是否为空,若是,则输出反推竞价词表为空,若否,则执行步骤4);
103.4)从字符串表中提取有效高频短语,得到有效高频短语词表;判断有效高频短语词表是否为空,若是,则输出反推竞价词表为空,若否,则执行步骤5);
104.5)初始化备选词表,删除包含其他品牌信息的备选词,之后判断备选词表是否为空,若是,输出反推竞价词表为空,若否,则执行步骤6);
105.6)根据有效高频短语词表中有效高频短语计算备选词表中所有备选词的得分和差异度,筛选出有效备选词,得到有效备选词表;判断有效备选词表是否为空,若是,则输出反推竞价词表为空,若否,则执行步骤7);
106.7)删除有效备选词表中已被其余备选词包含的备选词,取得分最高的前五个备选词作为反推得到的最有可能被实际购买的竞价词,输出反推竞价词,并存入反推竞价词表;
107.8)根据反推竞价词表对初始的备选词表中所有备选词进行分类,输出分类得到的备选词及对应分类,同时输出该笔记及相关品牌信息。
108.如图2所示,作为优选,步骤2)中判断品牌信息是否异常的方法,包括以下步骤:
109.2.1)判断品牌信息是否为空,若是,则执行步骤2.2),若否,则执行步骤2.3);
110.2.2)设置品牌为编号0,表示排异所有品牌;
111.2.3)判断品牌信息是否非常规编码,若是,则判断品牌信息能否转换为常规编码,若能,将品牌信息转换为常规编码,若不能,将品牌信息设定为空,并执行步骤2.2)。
112.作为优选,步骤3)中对备选词表中所有备选词进行n

gram字符串拆解的方法为:将备选词表中所有备选词统一大写,以固定长度n遍历备选词得到一系列短语。
113.如图3所示,作为优选,步骤4)中从字符串表中提取有效高频短语的方法,包括以
下步骤:
114.4.1)根据初始的备选词数据量设定高频比例;
115.4.2)将字符串表按词频递减排序,并按高频比例筛选出高频短语,存入高频短语词表;
116.4.3)删除高频短语词表中已被其余短语包含的高频短语;
117.4.4)删除高频短语词表中包含其他品牌信息的高频短语,得到有效高频短语,存入有效高频短语词表。
118.作为优选,步骤4.1)根据初始的备选词数据量设定高频比例的方法为:判断备选词数量是否超过n个,若是,则设定高频比例为25%,若否,则设定高频比例为75%;其中n为自然数。较佳地,n等于100。
119.如图4所示,作为优选,步骤4.3)中删除高频短语词表中已被其余短语包含的高频短语的方法,包括以下步骤:
120.4.3.1)判断高频短语词表是否为空,若是,则返回空列表,若否,则执行步骤4.3.2);
121.4.3.2)新建ac自动机遍历添加高频短语词表中的高频短语,存入数据结构中;
122.4.3.3)判断是否遍历高频短语词表直至取完,若否,则执行步骤4.3.4),若是,则执行步骤4.3.5);
123.4.3.4)调用ac自动机遍历各个高频短语,判断各个高频短语是否包含除本身之外列表中的高频短语,若是,则将包含的高频短语记录至待删除列表中;
124.4.3.5)将去重后的待删除列表中的高频短语从高频短语词表中删除,返回高频短语词表。
125.如图5所示,作为优选,步骤4.4)中删除高频短语词表中包含其他品牌信息的高频短语的方法,包括以下步骤:
126.4.4.1)新建ac自动机遍历添加预设品牌库中的品牌信息,存入数据结构中;其中,品牌信息包括品牌名和品牌编号;
127.4.4.2)判断是否遍历高频短语直至取完,若是,则返回有效高频短语词表,若否,则执行步骤4.4.3);
128.4.4.3)调用ac自动机遍历各个高频短语,判断高频短语中是否检测到品牌信息,若否,则执行步骤4.4.4),若是,则执行步骤4.4.5);
129.4.4.4)保留该高频短语;
130.4.4.5)判断检测到的品牌信息是否与该笔记相关的品牌信息一致,若否,则从高频短语词表中删除该高频短语词,若是,则执行步骤4.4.4)。
131.如图6所示,作为优选,步骤5)中初始化备选词表,删除包含其他品牌信息的备选词的方法,包括以下步骤:
132.5.1)判断是否遍历备选词直至取完,若是,则返回备选词表,若否,则执行步骤5.2);
133.5.2)调用遍历预设品牌库的ac自动机遍历各个备选词,判断备选词中是否检测到品牌信息,若否,则执行步骤5.3),若是,则执行步骤5.4);
134.5.3)保留该备选词;
135.5.4)判断检测到的品牌信息是否与该笔记相关的品牌信息一致,若否,则从备选词表中删除该备选词,若是,则执行步骤5.3)。
136.如图7所示,作为优选,步骤6)中根据有效高频短语计算备选词的得分的方法,包括以下步骤:
137.6.1.1)根据词频计算高频短语分值score
i
=count
i
/∑count
i
,其中,i为自然数,判断是否遍历备选词表直至取完,若是,则记录得分大于0的备选词及对应得分,若否,则执行步骤6.1.2);
138.6.1.2)判断是否遍历高频短语及对应分值直至取完,若是,则记录备选词的累计得分,若否,则执行步骤6.1.3);
139.6.1.3)判断备选词中是否含有该高频短语,若是,则累加高频短语对应分值。
140.如图8所示,作为优选,步骤6)中根据有效高频短语计算备选词的差异度err=diff(w,list)/w的方法,包括以下步骤:
141.6.2.1)新建ac自动机遍历添加高频短语及对应长度,判断是否遍历备选词表直至取完,若是,则差异度=剩余长度/备选词原长度,若否,则执行步骤6.2.2);
142.6.2.2)调用ac自动机遍历各个备选词,判断各个备选词是否包含大于一个的高频短语,若否,则剩余长度=备选词原长度

所包含的一个高频短语的长度,若是,则执行步骤6.2.3);
143.6.2.3)判断该备选词包含高频短语的位置是否存在重叠,若否,则执行步骤6.2.4),若是,去除重叠对象中长度较短的高频短语,之后执行步骤6.2.4);
144.6.2.4)剩余长度=备选词原长度

所包含的多个高频短语的长度。
145.如图9所示,作为优选,步骤6)中根据得分和差异度筛选有效备选词的方法,包括以下步骤:
146.6.3.1)根据现有的备选词数据量设定高频比例。
147.6.3.2)按差异度递增排序,并按高频比例筛选现有的备选词;
148.6.3.3)按得分递减排序,并按高频比例筛选剩余的备选词,存入有效备选词表;
149.6.3.4)判断有效备选词表是否为空,若是,则返回空列表,若否,则执行步骤6.3.5);
150.6.3.5)对有效备选词表中相同得分的备选词,只保留差异度最小者,返回有效备选词表。
151.如图10所示,作为优选,步骤7)中删除有效备选词表中已被其余备选词包含的备选词的方法,包括以下步骤:
152.7.1)新建ac自动机遍历添加有效备选词表中的备选词,判断是否遍历备选词直至取完,若是,则执行步骤7.2),若否,则执行步骤7.3);
153.7.2)将去重后的待删除列表中的词从输入词表中删除,返回有效备选词表;
154.7.3)调用ac自动机遍历各个备选词,判断该备选词是否包含除本身之外列表中的备选词,若是,则将包含的备选词记录到待删除列表中。
155.如图11所示,作为优选,步骤8)中根据反推竞价词表对初始的备选词表中所有备选词进行分类的方法,其包括以下步骤:
156.8.1)将反推竞价词表中的反推竞价词进行编号,根据相关性计算备选词在各反推
竞价词维度上的得分,并遍历所有备选词直至取完,判断最高得分是否为0,若是,则执行步骤8.2),若否,则执行步骤8.5);
157.8.2)调用遍历预设品牌库的ac自动机遍历备选词,判断备选词中是否检测到品牌名,若是,则执行步骤8.3),若否,则执行步骤8.4);
158.8.3)判断备选词中检测到的品牌名是否与该笔记相关的品牌信息一致,若是,则将该备选词的分类设为“品牌其他相关产品”,若否,则执行步骤8.4);
159.8.4)将该备选词的分类设为“其他”;
160.8.5)调用遍历预设品牌库的ac自动机遍历备选词,判断备选词中是否检测到品牌名,若是,则执行步骤8.6),若否,则执行步骤8.7);
161.8.6)判断备选词中检测到的品牌名是否与该笔记相关的品牌信息一致,若否,则执行步骤8.4),若是,则执行步骤8.7);
162.8.7)将该备选词的分类设为最高得分维度对应的竞价词。
163.如图12所示,作为优选,步骤8.1)中根据相关性计算备选词在各反推竞价词维度上的得分的方法,其包括以下步骤:
164.8.1.1)判断是否遍历反推竞价词直至取完,若是,则返回备选词在各竞价词维度上的得分,若否,则执行步骤8.1.2);
165.8.1.2)对各反推竞价词进行n

gram字符串拆解,新建ac自动机遍历添加拆解后的字符串及对应长度,遍历所有备选词直至取完;
166.8.1.3)调用ac自动机遍历各个备选词,判断各个备选词是否包含反推竞价词的子字符串,若是,则为该备选词在当前竞价词维度累计子字符串的长度作为得分。
167.进一步,步骤8)根据反推竞价词表对初始的备选词表中所有备选词进行分类,之后去除与分类所含商品有异的备选词,再输出分类得到的备选词及对应分类,同时输出该笔记及相关品牌信息。
168.如图13所示,作为优选,去除与分类所含商品有异的备选词的方法,其包括以下步骤:
169.9.1)判断是否遍历备选词及其分类结果直至取完,若是,则返回备选词及对应分类,若否,则执行步骤9.2);
170.9.2)判断备选词分类结果是否为某一反推竞价词,若是,则执行步骤9.3);
171.9.3)提取备选词及其分类的商品信息,判断提取两者是否都不为空,若是,则判断两者是否存在交集,若不存在交集,则将该备选词的分类更改为“其他”。
172.作为优选,步骤9.3)中提取备选词及其分类的商品信息的方法,其包括以下步骤:
173.9.3.1)新建ac自动机遍历添加预设商品库中的商品名及商品编号,存入数据结构中;
174.9.3.2)判断是否遍历备选词直至取完,若是,则返回识别到的商品编号,若否,则执行步骤9.3.3);
175.9.3.3)调用ac自动机遍历各个备选词,判断备选词中是否检测到商品名,若是,则返回识别到的商品编号,若否,则返回空列表。
176.本发明采用以上技术方案,通过采集诸如小红书平台上热门笔记,该笔记相关的品牌信息以及平台给出的关联该笔记的备选词表(又称相关竞价词表),找出其中频繁出现
的信息,通过计算备选词与这些核心信息的关联度(越大越好)和差异度(越小越好),推算出其中最有可能被实际购买的一个或多个竞价词,从而为品牌方购买竞价词给出建议,或为其在平台上的竞价营销提供数据参考,或者帮助品牌方了解竞品的动向或者平台推广品牌及品类趋势。
177.为了方便理解,现对本发明涉及的笔记、品牌、竞价词、备选词等词语进行语义解释,解释如下(该解释不能理解为是对本发明保护范围的限定):
178.品牌:指品牌名(如:兰蔻)或品牌别名(如:lancome)。
179.品牌库:预先收集并持续补充品牌及相关信息的数据库。
180.品牌编号/品牌编码:指品牌在品牌库中的编号,具有一一对应的性质。
181.竞价词:电商平台上与商品相关的、常被买家搜索的关键词或短语,如“dior999”、“雅诗兰黛小棕瓶”、“平价保湿面霜”、“宽松大码”,广告方可通过竞价热门关键词以提高产品展示在用户相应搜索界面的排名,从而获得更高的流量及收益。
182.品类:指商品的分类,同时具有概括性和区分度,如“面霜”。
183.商品库:预先收集并持续补充商品及其分类、别名等其他信息的数据库。
184.笔记:指小红书平台上的博文,以文本、图片、视频等形式展示。此专利主要针对商业化笔记,即包含商品推广的目的性图文或视频。同样地,笔记通过数据采集技术实时收集,后通过品牌识别等技术将笔记的品牌及其他信息储存于数据库中,并给予唯一识别编号。
185.笔记编号:指笔记在数据库中一一对应的编号。
186.相关竞价词表/备选词表:小红书平台根据笔记购买的竞价词给出的一系列相关的词,在广告投放期间搜索这些词,该笔记都能被关联并展示。这些词将被实时采集进数据库并关联上笔记编号。对于本专利而言,这些词将作为备选词被输入算法。
187.n

gram:自然语言处理领域术语,指一个字符串的所有长度为n的子字符串。例如:“雅诗兰黛小棕瓶”的3

gram集合为:{“雅诗兰”,“诗兰黛”,“兰黛小”,“黛小棕”,“小棕瓶”}。进行n

gram(n>=2)拆解即找出一个字符串中所有长度大于等于2的子字符串,是一种囊括更全面信息的词切割法。
188.本发明能够根据诸如小红书平台给出的笔记对应的相关竞价词表,找出其中频繁出现的信息,通过计算备选词与这些核心信息的关联度(越大越好)和差异度(越小越好),推算出其中最有可能被实际购买的一个或多个竞价词。
189.为了方便理解,本发明简述一个具体实施例:
190.小红书平台给出某篇兰蔻投放的笔记和以下备选词表(即,相关竞价词列表):“眼霜推荐”、“娇韵诗双萃精华”、“雅诗兰黛眼霜”、“去细纹眼霜”、“眼霜黑眼圈细纹”、“抗皱紧致精华”、“眼霜眼精华顺序”、“淡化细纹眼霜”、“兰蔻眼霜敏感肌”、“兰蔻菁纯眼霜
”……
等三千余词。
191.本发明可以推算出该笔记的高频短语(即核心信息)有:“眼霜”、“精华”、“细纹”、“兰蔻”等。此时,含核心信息的备选词如“眼霜推荐”(含“眼霜”)将会得到一定分数,但含更多核心信息的词如“兰蔻眼霜精华”(含“兰蔻”、“眼霜”、“精华”)得到的分数更高;在此基础上,除核心信息外的信息越少(如“兰蔻眼霜精华”不含除核心信息外的多余信息)则会被算法推出。值得一提的是,本发明还能够严格监控品牌、品类等的一致性,确保推演结果的逻
辑性。因此,反推该笔记购买的竞价词可能为:“细纹眼霜推荐”、“兰蔻眼霜精华”等。这意味着算法认为这些短语包含最多的核心信息——即与笔记相关性最高,且用词更为精准、自然——贴合产品卖点以及消费者的需求和心理。
192.本发明还可以根据推算出的竞价词,通过对比词条的相似程度,计算平台给出的其他相关竞价词与推算出的竞价词的关联度,从而进行关联分类。如上述的:
193.将“眼霜推荐”、“去细纹眼霜”、“眼霜黑眼圈细纹”、“淡化细纹眼霜”归类至“细纹眼霜推荐”;
194.而将“抗皱紧致精华”、“眼霜眼精华顺序”、“兰蔻眼霜敏感肌”、“兰蔻菁纯眼霜”归类至“兰蔻菁纯眼霜”。
195.这一步骤能够充分利用小红书平台给出的信息并归纳整理,使之更具针对性。
196.以上所述为本发明的较佳具体实施例,应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验所做的均等变化、修改、替换和变型,皆应在由权利要求书所确定的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜