一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种电商平台销售商品品牌形成品牌池的方法与流程

2021-10-20 00:53:00 来源:中国专利 TAG:品牌 数据挖掘 方法 销售 分析


1.本发明涉及大数据挖掘和分析处理领域,具体提供一种电商平台销售商品品牌形成品牌池的方法。


背景技术:

2.品牌是商家与消费者快速建立信任的有益桥梁,所以品牌的分析是分析目前的消费零售市场不可或缺的一部分。数据爆炸的时代,各种各样的品牌如雨后春竹般涌现,面对形形色色的品牌,大数据行业进行品牌分析则需要对电商平台的品牌进行整理与规范化。而品牌不似商标一般规整,不同商家,不同平台对于同一品牌的叫法不一。不同行业,不同厂家存在品牌重名问题;品牌没有统一的规范化处理办法,使得大数据行业对于品牌销售情况的统计与归纳变的非常困难。
3.针对以上问题,需要对品牌进行规范化处理,建立品牌池,解决治理杂乱无章的品牌,形成统一规范化品牌,从而有利于品牌的进一步统计与分析。


技术实现要素:

4.本发明是针对上述现有技术的不足,提供一种实用性强的电商平台销售商品品牌形成品牌池的方法。
5.本发明解决其技术问题所采用的技术方案是:
6.一种电商平台销售商品品牌形成品牌池的方法,将电商平台的商品公开信息进行爬虫获取后,将商品的品牌信息整理提取,结合商品及分词技术,可以将名称相近的品牌加以区分,同一品牌进行统一编码,并形成映射关系;
7.不同品牌进行不同编码加以区分,从而形成完整的品牌池。
8.进一步的,具体的步骤如下:
9.s1、获取电商平台销售商品及商品品牌信息;
10.s2、选取每个平台每个品牌销售额靠前的若干商品;
11.s3、对商品利用分词技术进行分词,将商品名称拆解成若干关键词;
12.s4、统计各个关键词的出现频率,选取出现频率较高的若干关键词作为品牌的代表词;
13.s5、将相似品牌按照匹配程度进行判断;
14.s6、区分后,对同一品牌进行统一编码;
15.s7、对品牌进行以上处理,形成规范化的品牌池。
16.作为优选,在步骤s1中,电商平台品牌信息中仅研究包含品牌名称和品牌id的情况。
17.进一步的,在步骤s4中,对关键词进行统计之前,要去除关键词的脏数据,包括标点符号、数字和语气助词。
18.进一步的,在步骤s5中,首先,当匹配程度为两个品牌选取的关键词有一半以上相
同时,即认为是同一个品牌,然后,再通过品牌商品所属行业加以辅助进行进一步的判断。
19.进一步的,在步骤s5中,首先,当匹配程度为两个品牌选取的关键词有三分之一以上相同时,即认为品牌有较大可能为同一品牌,然后,再通过品牌商品所属行业加以辅助进行进一步的判断。
20.进一步的,在步骤s5中,首先,当匹配程度为两个品牌选取的关键词有三分之一以下相同时,即认为不属于同一品牌,然后,再通过品牌商品所属行业加以辅助进行进一步的判断。
21.进一步的,在步骤s6中,根据匹配程度加以区分后,形成带有映射关系的品牌池是指对同一品牌进行统一编码,形成该编码与平台id、平台名称、平台内品牌名称的对应,并规范化中文英文名称。
22.进一步的,所述的品牌池指各个电商平台的品牌整合,形成一个带有与各个电商平台、电商平台命名的品牌、电商平台命名的品牌id关联的品牌池;
23.可以根据品牌池将所爬取的商品按照品牌进行归纳整理,从而从品牌的维度进行统计分析。
24.本发明的一种电商平台销售商品品牌形成品牌池的方法和现有技术相比,具有以下突出的有益效果:
25.本发明将各个电商平台上所涉及商品的品牌进行规范化整理,形成品牌池,后续若对品牌在各大电商平台销售额情况进行大数据统计时可以统一与整理,方便快捷。
附图说明
26.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
27.附图1是一种电商平台销售商品品牌形成品牌池的方法的流程示意图。
具体实施方式
28.为了使本技术领域的人员更好的理解本发明的方案,下面结合具体的实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例都属于本发明保护的范围。
29.下面给出一个最佳实施例:
30.如图1所示,本实施例中的一种电商平台销售商品品牌形成品牌池的方法,将电商平台的商品公开信息进行爬虫获取后,将商品的品牌信息整理提取,结合商品及分词技术,可以将名称相近的品牌加以区分,同一品牌进行统一编码,并形成映射关系;不同品牌进行不同编码加以区分,从而形成完整的品牌池。
31.具体步骤如下:
32.s1、获取电商平台销售商品及商品品牌信息,其中有的电商平台品牌信息包含品牌名称和品牌id,有的电商平台品牌信息只包含品牌名称,此处仅研究包含品牌名称和品
牌id的情况。
33.s2、选取每个平台每个品牌销售额靠前的若干商品,此实施例中选取10个。
34.s3、对商品利用分词技术进行分词,将商品名称拆解成若干关键词。
35.s4、对关键词去除脏数据,包括去除标点符号、数字和语气组词等,再统计各个关键词的出现频率,选取出现频率较高的若干关键词作为品牌的代表词,此处选取10个。
36.s5、将品牌id不同,名称类似,如英文名称一致、中文名称一致或者品牌名称一致的品牌进行代表词比较,按照匹配程度对品牌进行判断。
37.匹配程度大于5,即两个品牌10个关键词有5个即以上相同,即认为是同一个品牌,再通过品牌商品所属行业加以辅助判断;
38.匹配程度在3到5之间,即两个品牌10个关键词有3~5个关键词相同,即认为是同一个品牌,再通过品牌商品所属行业加以辅助判断;
39.匹配程度小于3,即两个品牌10个关键词有3个或者3个以下关键词相同,即认为不属于同一品牌,再通过品牌商品所属行业加以辅助判断。
40.s6、区分后,对同一品牌进行统一编码;
41.s7、对品牌进行以上处理,形成规范化的品牌池。形成该编码与平台id、平台名称、平台内品牌名称的对应,并规范化中文英文名称:例如可表示为英文名称/中文名称,对不同品牌进行不同编码,记录各自的对应关系。
42.其中,品牌池是指将各个电商平台的品牌整合,形成一个带有与各个电商平台、电商平台命名的品牌、电商平台命名的品牌id关联的品牌池。
43.可以根据品牌池,快速的将所爬取的商品按照品牌进行归纳整理,从而可以从品牌的维度进行统计分析,例如品牌的市场影响力、各个行业的代表品牌、品牌的新兴规律等分析。
44.上述具体的实施方式仅是本发明具体的个案,本发明的专利保护范围包括但不限于上述具体的实施方式,任何符合本发明的一种电商平台销售商品品牌形成品牌池的方法权利要求书的且任何所述技术领域普通技术人员对其做出的适当变化或者替换,皆应落入本发明的专利保护范围。
45.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜