一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

商品的匹配方法、装置及电子设备与流程

2021-12-14 21:23:00 来源:中国专利 TAG:


1.本技术涉及计算机应用技术领域,尤其涉及一种商品的匹配方法、装置及电子设备。


背景技术:

2.在电商标题匹配中,通常是计算商品标题之间的整体相似度,并根据商品标题之间的整体相似度确定两个商品标题是否匹配。但是,由于商品标题中的所有文本都参与了相似度计算,无法过滤掉与商品属性无关的文本信息,从而导致商品标题匹配的准确性较低。


技术实现要素:

3.本技术提出的商品的匹配方法、装置、电子设备及存储介质,用于解决相关技术中,通过根据商品标题之间的整体相似度进行商品标题匹配的方法,由于商品标题中的所有文本都参与了相似度计算,无法过滤掉与商品属性无关的文本信息,从而导致商品标题匹配的准确性较低的问题。
4.本技术一方面实施例提出的商品的匹配方法,包括:获取第一商品对应的第一描述信息;对所述第一描述信息进行识别,以确定所述第一商品的多维特征;根据商品库中各个商品的各维特征分别与所述第一商品的各维特征间的第一匹配度,从所述商品库中获取多个候选商品;根据所述第一商品的各维特征与每个所述候选商品的对应维特征间的第一匹配度及各维对应的权重,确定所述第一商品分别与每个候选商品的第二匹配度;根据所述第一商品分别与每个候选商品的第二匹配度,从所述各候选商品中提取与所述第一商品匹配的商品。
5.本技术另一方面实施例提出的商品的匹配装置,包括:第一获取模块,用于获取第一商品对应的第一描述信息;第一确定模块,用于对所述第一描述信息进行识别,以确定所述第一商品的多维特征;第二获取模块,用于根据商品库中各个商品的各维特征分别与所述第一商品的各维特征间的第一匹配度,从所述商品库中获取多个候选商品;第二确定模块,用于根据所述第一商品的各维特征与每个所述候选商品的对应维特征间的第一匹配度及各维对应的权重,确定所述第一商品分别与每个候选商品的第二匹配度;提取模块,用于根据所述第一商品分别与每个候选商品的第二匹配度,从所述各候选商品中提取与所述第一商品匹配的商品。
6.本技术再一方面实施例提出的电子设备,其包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如前所述的商品的匹配方法。
7.本技术又一方面实施例提出的计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如前所述的商品的匹配方法。
8.本技术实施例提供的商品的匹配方法、装置、电子设备及计算机可读存储介质,通
过从第一商品对应的第一描述信息中提取第一商品的多维特征,并根据商品库中各个商品的各维特征分别与第一商品的各维特征间的第一匹配度,从商品库中获取多个候选商品,进而根据第一商品的各维特征与每个候选商品的对应维特征间的第一匹配度及各维对应的权重,确定第一商品分别与每个候选商品的第二匹配度,以根据第一商品分别与每个候选商品的第二匹配度,从各候选商品中提取与第一商品匹配的商品。由此,通过从第一商品对应的第一描述信息中提取与第一商品的商品属性相关的多维特征,并建立包括大量商品及其对应的各维特征的商品库,以通过与商品属性相关的多维特征匹配,从商品库中提取与第一商品匹配的商品,从而通过从商品的描述信息中提取与商品属性相关的关键特征进行匹配,过滤掉了描述信息中与商品属性无关的无用文本信息,提升了商品匹配的准确性。
9.本技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
附图说明
10.本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
11.图1为本技术实施例所提供的一种商品的匹配方法的流程示意图;
12.图2为本技术实施例所提供的另一种商品的匹配方法的流程示意图;
13.图3为本技术实施例所提供的再一种商品的匹配方法的流程示意图;
14.图4为本技术实施例所提供的又一种商品的匹配方法的流程示意图;
15.图5为本技术实施例提供的一种商品的匹配装置的结构示意图;
16.图6为本技术实施例提供的电子设备的结构示意图。
具体实施方式
17.下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的要素。下面通过参考附图描述的实施例是示例性的,旨在用于解释本技术,而不能理解为对本技术的限制。
18.本技术实施例针对相关技术中,通过根据商品标题之间的整体相似度进行商品标题匹配的方法,由于商品标题中的所有文本都参与了相似度计算,无法过滤掉与商品属性无关的文本信息,从而导致商品标题匹配的准确性较低的问题,提出一种商品的匹配方法。
19.本技术实施例提供的商品的匹配方法,通过从第一商品对应的第一描述信息中提取第一商品的多维特征,并根据商品库中各个商品的各维特征分别与第一商品的各维特征间的第一匹配度,从商品库中获取多个候选商品,进而根据第一商品的各维特征与每个候选商品的对应维特征间的第一匹配度及各维对应的权重,确定第一商品分别与每个候选商品的第二匹配度,以根据第一商品分别与每个候选商品的第二匹配度,从各候选商品中提取与第一商品匹配的商品。由此,通过从第一商品对应的第一描述信息中提取与第一商品的商品属性相关的多维特征,并建立包括大量商品及其对应的各维特征的商品库,以通过与商品属性相关的多维特征匹配,从商品库中提取与第一商品匹配的商品,从而通过从商品的描述信息中提取与商品属性相关的关键特征进行匹配,过滤掉了描述信息中与商品属性无关的无用文本信息,提升了商品匹配的准确性。
20.下面参考附图对本技术提供的商品的匹配方法、装置、电子设备、存储介质及计算机程序进行详细描述。
21.图1为本技术实施例所提供的一种商品的匹配方法的流程示意图。
22.如图1所示,该商品的匹配方法,包括以下步骤:
23.步骤101,获取第一商品对应的第一描述信息。
24.需要说明的是,本技术实施例的商品的匹配方法可以由本技术实施例的商品的匹配装置执行。本技术实施例的商品的匹配装置可以配置在任意电子设备中,以执行本技术实施例的商品的匹配方法。
25.举例来说,本技术实施例的商品的匹配装置可以配置在任意电商服务对应的服务器中,以在应用程序需要对商品进行匹配时,可以向服务器发送商品匹配请求,以使服务器向应用程序返回商品匹配结果。
26.其中,第一商品,是指当前需要确定与其匹配的商品的商品。
27.其中,第一描述信息,可以是指第一商品对应的商品标题、商品简介等对第一商品进行描述的信息,本技术实施例对此不做限定。
28.在本技术实施例中,服务器可以在获取到商品匹配请求时,对商品匹配请求进行解析处理,以确定商品匹配请求中包括的第一商品对应的第一描述信息。其中,商品匹配请求可以是用户通过客户端发送给服务器的,也可以是服务器根据预先配置的规则自动触发的,本技术实施例对此不做限定。
29.举例来说,客户端的用户可以在需要搜索商品是,在客户端的搜索框中输入第一商品对应的第一描述信息,客户端可以在执行搜索后根据第一商品对应的第一描述信息生成商品匹配请求并发送至服务器。从而,服务器可以对获取到的商品匹配请求进行解析处理,获取到第一商品对应的第一描述信息。比如,第一商品对应的第一描述信息可以为“【现货当天发】华为mate9手机摩卡金全网通4gb 32gb”。
30.步骤102,对第一描述信息进行识别,以确定第一商品的多维特征。
31.其中,第一商品的多维特征,可以包括类别、品牌、型号及性能描述中的至少两项。
32.在本技术实施例中,可以预先设置对第一描述信息进行识别的规则,以及需要提取的第一商品的多维特征。比如,第一商品的多维特征可以为类别、品牌两项特征;也可以为类别、品牌、型号、性能描述四项特征。
33.需要说明的是,实际使用时,可以根据实际需要及具体的应用场景,对第一识别信息进行特征提取的规则,以及需要提取的第一商品的多维特征,本技术实施例对此不做限定。以下以多维特征为类别、品牌、型号、性能描述为例,进行具体说明。
34.作为一种可能的实现方式,可以利用预先训练的分类模型对第一商品对应的第一描述信息进行识别,以确定第一商品所属的类别。
35.进一步的,由于商品的种类很多且存在很多相似的商品类别,(如耳机/耳麦、蓝牙耳机、手机耳机)因此,为了提升商品类别识别的准确性,可以训练可以对商品进行多级分类的分类模型,即可以将相似的商品类别进行聚类,并对聚类后的商品类别进行二级分类。即在本技术实施例一种可能的实现方式中,上述步骤102,可以包括:
36.将第一描述信息输入一级分类模型,以确定第一商品所属的目标一级类别;
37.在第一商品所属的目标一级类别包含子类别的情况下,将第一描述信息输入目标
一级类别对应的二级分类模型,以确定第一商品所属的目标二级类别。
38.在本技术实施例中,可以首先将第一商品对应的第一描述信息输入预先训练完成的一级分类模型,以使一级分类模型输出第一商品所属的目标一级类别。若第一商品所属的目标一级类别中未包含子类别,则可以将第一商品所属的目标一级类别确定为第一商品所属的类别。
39.相应的,若第一商品所属的目标一级类别包含子类别,则可以继续确定第一商品所属的目标二级类别。具体的,可以将第一商品对应的第一描述信息继续输入目标一级类别对应的二级分类模型,以使目标一级类别对应的二级分类模型输出第一商品所属的目标二级类别,并将第一商品所属的目标二级类别确定为第一商品所属的类别。
40.进一步的,在训练多级分类模型时,可以通过训练数据集对初始分类模型进行初步训练,并根据初步训练后的分类模型对各类别的混淆概率,对容易混淆的各类别进行聚类,以生成多级分类模型。即在本技术实施例一种可能的实现方式中,可以通过以下步骤训练生成一级分类模型与二级分类模型:
41.获取训练数据集及测试数据集,其中,训练数据集及测试数据集中,分别包括多个商品的描述信息及每个商品对应的标注类别;
42.利用训练数据集,对初始分类模型进行训练,以生成第一分类模型;
43.利用第一分类模型对测试数据集中的每个商品的描述信息进行处理,以确定每个商品属于各个类别的预测概率;
44.根据每个商品对应的标注类别及属于各个类别的预测概率,确定各个类别间的混淆概率;
45.将混淆概率大于阈值的各类别进行聚类,以生成一级类别;
46.利用聚类后的每个一级类别及分别对应的描述信息,对初始分类模型进行训练,以生成一级分类模型;
47.利用每个一级类别包含的各标注类别及描述信息,对初始分类模型进行训练,以生成与每个一级类别对应的二级分类模型。
48.在本技术实施例中,可以获取大量的商品的描述信息,并根据每个商品的类别对每个商品的描述信息进行标注,以生成每个商品对应的标注类别,即一个商品的描述信息及其对应的标注类别可以构成一条训练数据或测试数据,进而通过大量商品的描述信息及其对应的标注类别可以生成训练数据集与测试数据集。其中,训练数据集中的训练数据与测试数据集中的测试数据可以是不同的,以提升分类模型的训练精度。
49.在本技术实施例中,可以首先将训练数据集中的每个商品的描述信息依次输入初始分类模型,以使初始分类模型输出每个商品对应的预测类别,进而根据每个商品对应的预测类别与标注类别的差异,确定初始分类模型的损失值,并在初始分类模型的损失值大于损失阈值时,根据初始分类模型的损失值对初始分类模型的参数进行更新;之后利用训练数据集对更新后的分类模型继续进行训练,直至更新后的分类模型的损失值小于或等于损失阈值,则将更新后的分类模型确定为第一分类模型。
50.在本技术实施例中,训练生成第一分类模型之后,可以利用测试数据集对第一分类模型进行测试,以确定第一分类模型对各个商品类别的混淆概率,进而根据混淆概率确定一级类别与二级类别。因此,可以将测试数据集中每个商品的描述信息输入第一分类模
型,以使第一分类模型输出每个商品属于各个类别的预测概率,进而根据每个商品对应的标注类别与每个商品属于各个类别的预测概率,确定各个类别之间的混淆概率。若多个类别之间的混淆概率大于阈值,则可以确定该多个类别为相似类别,则可以将该多个类别进行聚类,以生成一个一级类别;相应的,若一个类别与其他类别之间的混淆概率均小于或等于阈值,则可以确定没有与该类别相似的类别,即可以将该类别直接确定为一个一级类别。
51.举例来说,第一分类模型为训练完成的全分类模型,可以预测a、b、c、d、e、f六个类别。表1为利用测试数据集对第一分类模型进行测试,生成的混淆矩阵。其中,表1第1列表示商品对应的标注类别,表1中每行的数值表示第一分类模型输出的每种标注类别的商品属于各类别的预测概率。比如,标注类别为a的商品属于a类别的预测概率为0.75,属于b类别的预测概率为0.15,属于c类别的预测概率为0.03,等等;标注类别为b的商品属于a类别的预测概率为0.2,属于b类别的预测概率为0.7,等等。得到如表1所示的混淆矩阵之后,可以将标注类别为x的商品属于y类别的预测概率与标注类别为y的商品属于x类别的预测概率的均值,确定为类别x与类别y之间的混淆概率,即类别a与类别b之间的混淆概率为(0.15 0.2)/2=0.175,类别e与类别f之间的混淆概率为(0.2 0.25)/2=0.225。假设阈值为0.1,则根据表1中所示的混淆矩阵,由于类别a与类别b之间的混淆概率大于阈值,类别e与类别f之间的混淆概率大于阈值,而类别c和类别d与其他类别之间的混淆概率均小于阈值,则可以将类别a与类别b进行聚类生成一个一级类别ab,并将类别e与类别f进行聚类生成一个一级类别ef,从而生成的各一级类别分别为ab、c、d、ef。
52.表1
[0053] abcdefa0.750.150.030.030.030.01b0.20.70.020.040.010.03c0.030.040.900.0300d000.030.950.020e000.050.050.70.2f000.0500.250.7
[0054]
在本技术实施例中,确定出各一级类别之后,可以根据一级类别包含的各标注类别,将训练数据集中相应商品的标注类别修改为相应的一级类别。比如,训练数据集中包含的标注类别为a、b、c、d、e、f,生成的一级类别分别为ab、c、d、ef,则可以将标注类别为a与b的商品的标注类别修改为ab,将标注类别为e与f的商品的标注类别修改为ef。之后,可以将修改标注数据后的训练数据集中的每个商品的描述信息输入初始分类模型,以根据初始分类模型输出的每个商品对应的预测类别与修改后的标注类别之间的差异,确定初始分类模型的损失值,并根据损失值对初始分类模型的参数进行更新,直至更新后的分类模型的损失值小于或等于损失值阈值,则可以将更新后的分类模型确定为一级分类模型。
[0055]
在本技术实施例中,确定出各一级类别之后,对于每个一级类别,可以根据该一级类别包含的各标注类别,从训练数据集中获取该一级类别对应的训练数据。比如,对于一级类别ab,其包含的标注类别为类别a和类别b,则可以从训练数据集中获取标注类别为类别a和类别b的商品的描述信息与标注类别,作为一级类别ab对应的训练数据。之后,将该一级类别对应的训练数据中的每个商品的描述信息输入初始分类模型,以根据初始分类模型输
出的每个商品对应的预测类别与标注类别的差异,确定初始分类模型的损失值,并根据损失值对初始分类模型的参数进行更新,并利用该一级类别对应的训练数据继续对更新后的分类模型进行训练,直至更新后的分类模型的损失值小于或等于损失值阈值,则可以将更新后的分类模型确定为该一级类别对应的二级分类模型。相应的,按照与上述相同的训练方式,可以依次训练生成各一级类别对应的二级分类模型。
[0056]
需要说明的是,若一级类别未包含多个标注类别,则可以确定该一级类别未包含二级类别,则可以不训练该一级类别对应的二级分类模型。
[0057]
作为一种可能的实现方式,可以预先训练品牌识别模型与品牌词典,并通过词典与识别模型相结合的方式,确定第一商品的品牌。比如,可以首先对第一商品对应的第一描述信息进行分词处理,以确定第一描述信息中包括的各分词,进而将第一描述信息中包括的各分词与预设的品牌词典进行匹配,并将预设的品牌词典中包含的分词,确定为第一商品的品牌;若预设的品牌词典中未包含第一描述信息中的任何一个分词,则可以将第一描述信息输入预先训练的品牌识别模型,以通过品牌识别模型对第一描述信息进行识别处理,生成第一商品的品牌。
[0058]
需要说明的是,在通过品牌识别模型生成第一商品的品牌后,若预设的品牌词典中未包含生成的第一商品的品牌,则可以将生成的第一商品的品牌加入预设的品牌词典中,以不断完善预设的品牌词典,提升品牌识别的准确性和效率。
[0059]
作为一种可能的实现方式,可以通过预设的正则表达式提取第一描述信息中包含的型号和性能描述。可选的,可以首先根据性能描述对应的正则表达式对第一描述信息进行匹配,以提取第一描述信息中包含的性能描述;之后,可以从第一描述信息中去除提取出的性能描述,并对根据型号对应的正则表达式对剩余信息进行匹配,以提取第一描述信息中包含的型号。
[0060]
作为一种示例,性能描述中可以包括两类特征:定量描述与定性描述。比如,定量描述可以包括:手机内存:4g 128g,相机焦距:20

50mm,冰箱容量:80升等;定性描述可以包括:相机的对焦模式:变焦定焦,冰箱:双开门、单开门等。因此,在提取第一描述信息中包含的性能描述时,可以依次提取定量描述与定性描述。比如,可以根据定量描述对应的正则表达式对第一描述信息进行匹配,以提取第一描述信息中包含的第一商品的定量描述;之后从第一描述信息中去除定量描述,并根据定性描述对应的正则表达式对去除定量描述后的剩余信息进行匹配,以从第一描述信息中提取第一商品的定性描述。
[0061]
需要说明的是,在从第一描述信息中提取第一商品的类别、品牌、型号与性能描述等多维特征时,本技术实施例对各维特征的提取顺序不做限定。实际使用时,可以根据实际需要及具体的应用场景,灵活设定各维特征的提取顺序。
[0062]
步骤103,根据商品库中各个商品的各维特征分别与第一商品的各维特征间的第一匹配度,从商品库中获取多个候选商品。
[0063]
其中,商品库,可以是包含商品的描述信息与商品对应的各维特征的映射关系的数据库。
[0064]
其中,候选商品,可以是指商品库中各维特征与第一商品的各维特征间的第一匹配度均大于或等于匹配度阈值的商品。
[0065]
在本技术实施例中,可以按照上述步骤中公开的提取第一商品的各维特征的方
式,对商品库中的各商品的描述信息进行特征提取,以确定商品库中各商品的多维特征,并将商品的描述信息与其对应的多维特征对应存储在商品库中。
[0066]
在本技术实施例中,对于商品库中的每个商品,可以确定该商品的各维特征分别与第一商品的对应维特征之间的第一匹配度,以根据该商品的各维特征分别与第一商品的对应维特征之间的第一匹配度,确定该商品是否为与第一商品的多维特征相似度较高的商品,即是否可以将该商品作为候选商品。
[0067]
作为一种可能的实现方式,若商品库中的一个商品的各维特征与第一商品的对应维的特征之间的第一匹配度均大于或等于匹配度阈值,则可以确定该商品的各维特征与第一商品的各维特征相同或相似,从而可以将该商品确定为候选商品。相应的,对于商品库中的一个商品,若该商品的任意一维特征与第一商品对应维特征之间的第一匹配度小于匹配度阈值,则可以确定该商品与第一商品之间存在不同的特征,从而不可以将该商品确定为候选商品。
[0068]
举例来说,商品的多维特征包括类别、品牌、型号与性能描述,假设匹配度阈值为0.9。若第一商品的类别与商品库中的商品a的类别之间的第一匹配度为1,第一商品的品牌与商品a的品牌之间的第一匹配度为1,第一商品的型号与商品a的型号之间的第一匹配度为0.95,第一商品的性能描述与商品a的性能描述之间的第一匹配度为0.92,从而可以将商品a确定为候选商品。若第一商品的类别与商品库中商品b的类别之间的第一匹配度为0.9,第一商品的类别与商品b的类别之间的第一匹配度为0.5,第一商品的型号与商品b的型号之间的第一匹配度为0.3,第一商品的性能描述与商品b的性能描述之间的第一匹配度为0.1,从而可以确定商品b不是候选商品。
[0069]
作为一种示例,商品库可以用于进行初步筛选,因此商品库中的商品对应的特征可以仅包含第一商品的部分维特征,以降低商品库的数据量,以及提升候选商品匹配的效率。因此,在商品库中的商品对应的特征可以仅包含第一商品的部分维特征时,可以根据商品库中各个商品的各维特征分别与第一商品对应的部分维特征之间的第一匹配度,从商品库中获取多个候选商品。进而,在获取到多个候选商品之后,可以对各候选商品对应的描述信息进行特征提取,以提取候选商品未包含但是第一商品包含的特征,并进一步确定候选商品对应的新提取的各维特征与第一商品的对应维特征间的第一匹配度。
[0070]
举例来说,假设第一商品的多维特征包括类别、品牌、型号与性能描述,商品库中仅包含商品的描述信息与商品的类别、品牌之间的映射关系,从而可以根据商品库中各个商品的类别分别与第一商品的类别之间的第一匹配度,以及商品库中各个商品的品牌分别与第一商品的品牌之间的第一匹配度,从商品库中获取多个候选商品。之后,可以按照第一商品的型号、性能描述的提取方式,从各个候选商品的描述信息中提取各个候选商品的型号、性能描述;进而可以确定各个候选商品的型号分别与第一商品的型号之间的第一匹配度,以及各个候选商品的性能描述分别与第一商品的性能描述之间的第一匹配度。
[0071]
步骤104,根据第一商品的各维特征与每个候选商品的对应维特征间的第一匹配度及各维特征对应的权重,确定第一商品分别与每个候选商品的第二匹配度。
[0072]
其中,第一商品与候选商品的第二匹配度,可以是指第一商品与候选商品之间的整体相似度。
[0073]
在本技术实施例中,可以根据各维特征对衡量商品之间相似度的重要程度,为不
同维特征分别赋予不同的权重,以根据第一商品的各维特征与每个候选商品的对应维特征间的第一匹配度,以及各维特征对应的权重,确定第一商品分布与每个候选商品之间的第二匹配度,以通过第二匹配度表征第一商品与候选商品之间的整体相似度。
[0074]
作为一种示例,对于一个候选商品,可以将第一商品的各维特征与该候选商品的对应维特征间的第一匹配度的加权均值,确定为第一商品与该候选商品间的第二匹配度。即第一商品与候选商品间的第二匹配度可以通过公式(1)确定。
[0075][0076]
其中,s
i
为第一商品与第i个候选商品间的第二匹配度,i为候选商品的序号,a
ij
为第一商品的第j维特征与第i个候选商品的第j维特征间的第一匹配度,ω
j
为第j维特征的权重,j为多维特征的序号,n为多维特征的数量。
[0077]
举例来说,第一商品的多维特征为类别、品牌、型号、定量描述与定性描述,且类别、品牌、型号、定量描述与定性描述的权重分别为0.3、0.3、0.2、0.1、0.1。假设第一商品的描述信息为“【现货当天发】华为mate9手机摩卡金全网通4gb 32gb”,第一商品的多维特征分别为“类别:手机,品牌:华为,型号:mate9,定量描述:4g 32g,定性描述:全网通”,从商品库中获取的候选商品a的多维特征分别为“类别:手机,品牌:华为,型号:mate9,定量描述:4g 32g,定性描述:全网通”;候选商品b的多维特征分别为“类别:手机,品牌:华为,型号:v30,定量描述:6g 128g,定性描述:全网通”;第一商品的各维特征与候选商品a的对应维特征间的第一匹配度分别为1、1、1、1、1;第一商品的各维特征与候选商品b的对应维特征间的第一匹配度分别为1、1、0、0、1。从而,第一商品与候选商品a的第二匹配度为:1
×
0.3 1
×
0.3 1
×
0.2 1
×
0.1 1
×
0.1=1,第一商品与候选商品b的第二匹配度为:1
×
0.3 1
×
0.3 0
×
0.2 0
×
0.1 1
×
0.1=0.7。
[0078]
作为一种示例,在通过部分维特征(如类别、品牌)从商品库中候选商品时,还可以根据各候选商品的各维特征与第一商品的对应维特征间的第一匹配度,确定各候选商品在商品库中的搜索得分。进而,在确定第一商品与各候选商品的第二匹配度时,还可以融入第二匹配在商品库中的搜索得分。比如,可以将将第一商品的各维特征与该候选商品的对应维特征间的第一匹配度,以及该候选商品在商品库中的搜索得分的加权均值,确定为第一商品与该候选商品间的第二匹配度。即第一商品与候选商品间的第二匹配度可以通过公式(2)确定。
[0079][0080]
其中,s
i
为第一商品与第i个候选商品间的第二匹配度,i为候选商品的序号,a
ij
为第一商品的第j维特征与第i个候选商品的第j维特征间的第一匹配度,ω
j
为第j维特征的权重,j为多维特征的序号,n为多维特征的数量,es
i
。为第i个候选商品在商品库中的搜索得分,ω
es
为候选搜索得分的权重。
[0081]
举例来说,第一商品的多维特征为类别、品牌、型号、定量描述与定性描述,且类别、品牌、型号、定量描述与定性描述的权重分别为0.2、0.2、0.2、0.1、0.1,候选商品在商品库中的搜索得分的权重为0.2。假设第一商品的描述信息为“【现货当天发】华为mate9手机摩卡金全网通4gb 32gb”,第一商品的多维特征分别为“类别:手机,品牌:华为,型号:mate9,定量描述:4g 32g,定性描述:全网通”,从商品库中获取的候选商品a的多维特征分
别为“类别:手机,品牌:华为,型号:mate9,定量描述:4g 32g,定性描述:全网通”;候选商品b的多维特征分别为“类别:手机,品牌:华为,型号:v30,定量描述:6g 128g,定性描述:全网通”;第一商品的各维特征与候选商品a的对应维特征间的第一匹配度分别为1、1、1、1、1,候选商品a在商品库中的搜索得分为0.821;第一商品的各维特征与候选商品b的对应维特征间的第一匹配度分别为1、1、0、0、1,候选商品b在商品库中的搜索得分为0.223。从而,第一商品与候选商品a的第二匹配度为:1
×
0.2 1
×
0.2 1
×
0.2 1
×
0.1 1
×
0.1 0.821
×
0.2=0.964,第一商品与候选商品b的第二匹配度为:1
×
0.2 1
×
0.2 0
×
0.2 0
×
0.1 1
×
0.1 0.223
×
0.2=0.544。
[0082]
步骤105,根据第一商品分别与每个候选商品的第二匹配度,从多个候选商品中提取与第一商品匹配的商品。
[0083]
在本技术实施例中,确定出第一商品分别与每个候选商品的第二匹配度之后,可以根据第一商品分别与每个候选商品的第二匹配度,对各个候选商品进行降序排序,并可以将与第一商品的第二匹配度最大的x个候选商品,确定为与第一商品匹配的商品。
[0084]
进一步的,若存在多个候选商品与第一商品的第二匹配度相同,则可以根据多个候选商品对应的各第一匹配度或在商品库中的搜索得分,对多个候选商品进行降序排序。即在本技术实施例一种可能的实现方式中,上述步骤105,可以包括:
[0085]
在至少两个候选商品对应的第二匹配度相同、且均大于其它各候选商品对应的第二匹配度的情况下,根据至少两个候选商品分别对应的第一匹配度,从至少两个候选商品中提取与第一商品匹配的商品。
[0086]
作为一种示例,可以预设各维特征的优先级,从而在多个候选商品与第一商品间的第二匹配度相同时,可以首先根据优先级最高的特征对应的第一匹配度对多个候选商品进行降序排序,若多个候选商品中存在优先级最高的特征对应的第一匹配度相同的部分候选商品,则可以进一步根据优先级次高的特征对应的第一匹配度对该部分候选商品进行降序排序,直至确定出所有第二匹配度相同的候选商品的排序,则可以从所有候选商品中选取排序位于前x的候选商品,确定为与第一商品匹配的商品。
[0087]
作为一种示例,还可以预先指定预设特征,从而在多个候选商品与第一商品间的第二匹配度相同时,可以根据预设特征对应的第一匹配度对第二匹配度相同的多个候选商品进行降序排序,进而可以从所有候选商品中选取排序位于前x的候选商品,确定为与第一商品匹配的商品。比如,预设特征可以为类别、在商品数据库中的搜索得分等,本技术实施例对此不作限定。
[0088]
需要说明的时,实际使用时,可以根据实际需要及具体的应用场景,确定x的具体取值,本技术实施例对此不做限定。
[0089]
本技术实施例提供的商品的匹配方法,通过从第一商品对应的第一描述信息中提取第一商品的多维特征,并根据商品库中各个商品的各维特征分别与第一商品的各维特征间的第一匹配度,从商品库中获取多个候选商品,进而根据第一商品的各维特征与每个候选商品的对应维特征间的第一匹配度及各维对应的权重,确定第一商品分别与每个候选商品的第二匹配度,以根据第一商品分别与每个候选商品的第二匹配度,从各候选商品中提取与第一商品匹配的商品。由此,通过从第一商品对应的第一描述信息中提取与第一商品的商品属性相关的多维特征,并建立包括大量商品及其对应的各维特征的商品库,以通过
与商品属性相关的多维特征匹配,从商品库中提取与第一商品匹配的商品,从而通过从商品的描述信息中提取与商品属性相关的关键特征进行匹配,过滤掉了描述信息中与商品属性无关的无用文本信息,提升了商品匹配的准确性。
[0090]
在本技术一种可能的实现形式中,对于不同类别的商品,其型号和性能描述可能存在较大差异,因此可以为不同类别的商品分别设置不同的识别规则,用于识别商品的型号与性能描述,以进一步提升商品特征识别的准确性。
[0091]
下面结合图2,对本技术实施例提供的商品的匹配方法进行进一步说明。
[0092]
图2为本技术实施例所提供的另一种商品的匹配方法的流程示意图。
[0093]
如图2所示,该商品的匹配方法,包括以下步骤:
[0094]
步骤201,获取第一商品对应的第一描述信息。
[0095]
上述步骤201的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
[0096]
步骤202,对第一描述信息进行类别识别,以确定第一商品所属的类别。
[0097]
在本技术实施例中,可以通过预先训练的分类模型对第一描述信息进行识别,以确定第一商品所属地类别。具体的实现过程及原理可以参照上述实施例的详细描述,此处不再赘述。
[0098]
步骤203,根据第一商品所属的类别,获取第一商品对应的识别规则。
[0099]
在本技术实施例中,由于商品的类别不同,商品的型号或性能描述的表达方式可能存在较大差异,从而可以为每个类别的商品不同的商品类别分别设置不同的识别规则,分别用于识别每个类别的商品的型号和/或性能描述。从而,确定出第一商品所属的类别之后,可以根据第一商品所属的类别,确定与第一商品所属的类别对应的识别规则,并将第一与第一商品所属的类别对应的识别规则确定为第一商品对应的识别规则。
[0100]
作为一种示例,若通过正则表达式匹配确定第一描述信息中的型号与性能描述,则可以设置每个类别的商品的型号对应的正则表达式,以及每个类别的商品的性能描述对应的正则表达式,以分别对每个类别的商品的型号与性能描述进行识别。
[0101]
步骤204,基于识别规则,对第一描述信息进行匹配,以确定第一商品的型号和/或性能描述。
[0102]
在本技术实施例中,若第一商品的多维特征中包括第一商品的型号与性能描述,则识别规则中也可以包括第一商品对应的型号识别规则与性能描述识别规则。从而,可以基于识别规则中包括的第一商品对应的型号识别规则对第一描述信息进行匹配,以确定第一商品的型号;以及基于识别规则中包括的第一商品对应的性能描述识别规则对第一描述信息进行匹配,以确定第一商品的性能描述。
[0103]
进一步的,由于商品的型号通常由字母和数字组成,而商品的性能描述中也可能包含字母和数字,因此为降低商品性能描述对商品型号识别的影响,可以在确定出商品的性能描述后,从第一描述信息中去除性能描述,再进行商品的型号识别,以进一步提升商品型号识别的准确性。即在本技术实施例一种可能的实现方式中,上述步骤204,可以包括:
[0104]
基于性能描述对应的识别规则,对第一描述信息进行匹配,以确定第一商品的性能描述;
[0105]
基于型号对应的识别规则,对第一描述信息中除第一商品的性能描述外的其余信
息进行匹配,以确定第一商品的型号。
[0106]
作为一种可能的实现方式,可以首先根据识别规则中包括的性能描述对应的识别规则,对第一描述信息进行匹配,以确定第一商品的性能描述。之后,可以从第一描述信息中去除第一商品的性能描述,之后可以基于识别规则中包括的型号对应的识别规则,对去除第一商品的性能描述后的其余信息进行匹配,以确定第一商品的型号。
[0107]
举例来说,第一商品的第一描述信息为“konka/康佳bcd

386bx4s4门家用节能2开门十字对开门式电冰箱金色”,则基于性能描述对应的识别规则对第一描述信息进行匹配,可以确定第一商品的性能描述为“4门”,从而从第一描述信息中去除第一商品的性能描述后的其余信息为“konka/康佳bcd

386bx4s家用节能2开门十字对开门式电冰箱金色”,进而基于型号对应的识别规则对其余信息进行匹配,可以确定第一商品的型号为“bcd

386bx4s”。需要说明的是,若直接从第一描述信息提取第一商品的型号,会将第一商品的型号误识别为“bcd

386bx4s4”。
[0108]
步骤205,根据商品库中各个商品的各维特征分别与第一商品的各维特征间的第一匹配度,从商品库中获取多个候选商品。
[0109]
步骤206,根据第一商品的各维特征与每个候选商品的对应维特征间的第一匹配度及各维特征对应的权重,确定第一商品分别与每个候选商品的第二匹配度。
[0110]
步骤207,根据第一商品分别与每个候选商品的第二匹配度,从多个候选商品中提取与第一商品匹配的商品。
[0111]
上述步骤205

207的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
[0112]
本技术实施例提供的商品的匹配方法,通过对第一商品对应的第一描述信息进行类别识别,以确定第一商品所属的类别,并基于识别规则,对第一描述信息进行匹配,以确定第一商品的型号和/或性能描述,之后根据商品库中各个商品的各维特征分别与第一商品的各维特征间的第一匹配度,从商品库中获取多个候选商品,进而根据第一商品的各维特征与每个候选商品的对应维特征间的第一匹配度及各维对应的权重,确定第一商品分别与每个候选商品的第二匹配度,以根据第一商品分别与每个候选商品的第二匹配度,从各候选商品中提取与第一商品匹配的商品。由此,通过为不同类别的商品分别设置不同的识别规则,用于识别商品的型号与性能描述,以通过与商品属性相关的多维特征匹配,从商品库中提取与第一商品匹配的商品,从而通过从商品的描述信息中提取与商品属性相关的关键特征进行匹配,过滤掉了描述信息中与商品属性无关的无用文本信息,并通过提升商品特征识别的准确性,进一步提升了商品匹配的准确性。
[0113]
在本技术一种可能的实现形式中,由于第一商品的多维特征与各候选商品的多维特征可能不能完全匹配,从而可以根据第一商品的多维特征与候选商品的多维特征中均存在的特征间的第一匹配度,从候选商品中选取匹配商品,以进一步提升商品匹配的准确性。
[0114]
下面结合图3,对本技术实施例提供的商品的匹配方法进行进一步说明。
[0115]
图3为本技术实施例所提供的再一种商品的匹配方法的流程示意图。
[0116]
如图3所示,该商品的匹配方法,包括以下步骤:
[0117]
步骤301,获取第一商品对应的第一描述信息。
[0118]
步骤302,对第一描述信息进行识别,以确定第一商品的多维特征。
[0119]
步骤303,根据商品库中各个商品的各维特征分别与第一商品的各维特征间的第一匹配度,从商品库中获取多个候选商品。
[0120]
上述步骤301

303的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
[0121]
步骤304,确定第一商品对应的各维特征数量m及第i个候选商品对应的各维特征数量n
i
,其中,m、n和i分别为正整数,且i小于或等于候选商品的总数量k。
[0122]
步骤305,在m小于n
i
的情况下,根据第一商品对应的m维特征分别与每个候选商品的m维特征的第一匹配度、及m维特征分别对应的权重,确定第一商品分别与每个候选商品的第二匹配度。
[0123]
在本技术实施例中,确定第一商品与各候选商品的第二匹配度时,可以首先确定第一商品的各维特征数量m,以及各个候选商品的各维特征数量n。在m与每个候选商品的各维特征数量n均相同的情况下,可以按照上述实施例中公开的方式,根据第一商品中每维特征分别与第i个候选商品的对应维特征间的第一匹配度,以及各维特征的权重,确定第一商品中各维特征与第i个候选商品的对应维特征间的第一匹配度的加权均值,并将第一商品中各维特征与第i个候选商品的对应维特征间的第一匹配度的加权均值,确定为第一商品与第i个候选商品的第二匹配度。
[0124]
在任意一个候选商品的各维特征数量n与m不同的情况下,比如,m小于第i个候选商品的各维特征数量n
i
的情况下,即第i个候选商品的各维特征中包含第一商品的各维特征中未包含的特征,从而可以根据第一商品的m维特征,从各候选商品的n维特征中去除第一商品的m维特征中未包含的特征,仅保留各候选商品的n维特征中包含的与第一商品的m维特征相同的m维特征,进而根据第一商品对应的m维特征分别与每个候选商品的m维特征间的第一匹配度,以及m维特征分别对应的权重,确定第一商品与每个候选商品的第二匹配度。比如,对于第i个候选商品,可以将第一商品的m维特征与第i个候选商品的m维特征间的第一匹配度的加权均值,确定为第一商品与第i个候选商品的第二匹配度。
[0125]
举例来说,第一商品的多维特征包括类别、品牌、型号,各候选商品的各维特征包括类别、品牌、型号与性能描述,则可以去除各候选商品的性能描述特征,并根据第一商品的类别、品牌、型号分别与每个候选商品的类别、品牌、型号间的第一匹配度,以及类别、品牌、型号分别对应的权重,确定第一商品与每个候选商品的第二匹配度。
[0126]
步骤306,在n
i
小于m的情况下,根据每个候选商品对应的n
i
维特征分别与第一商品的n
i
维特征间的第一匹配度、及n
i
维特征分别对应的权重,确定第一商品分别与每个候选商品的第二匹配度。
[0127]
在本技术实施例中,在任意一个候选商品的各维特征数量n与m不同,比如,第i个候选商品的各维特征数量n
i
小于m的情况下,即第一商品的m维特征中包含第i个候选商品的n
i
维特征中未包含的特征,从而可以根据第i个候选商品的n
i
维特征,从第一商品的m维特征中去除第i个候选商品的n
i
维特征中未包含的特征,仅保留第一商品的m维特征中包含的与第i个候选商品的n
i
维特征相同的n
i
维特征,进而根据第一商品对应的n
i
维特征分别与每个候选商品的n
i
维特征间的第一匹配度,以及n
i
维特征分别对应的权重,确定第一商品与每个候选商品的第二匹配度。比如,对于第i个候选商品,可以将第一商品的n
i
维特征与第i个候选商品的n
i
维特征间的第一匹配度的加权均值,确定为第一商品与第i个候选商品的第
二匹配度。
[0128]
举例来说,第一商品的多维特征包括类别、品牌、型号,各候选商品的各维特征包括类别、品牌,则可以去除第一商品的型号特征,并根据第一商品的类别、品牌分别与每个候选商品的类别、品牌间的第一匹配度,以及类别、品牌分别对应的权重,确定第一商品与每个候选商品的第二匹配度。
[0129]
步骤307,根据第一商品分别与每个候选商品的第二匹配度,从多个候选商品中提取与第一商品匹配的商品。
[0130]
上述步骤307的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
[0131]
本技术实施例提供的商品的匹配方法,通过从第一商品对应的第一描述信息中提取第一商品的多维特征,并根据商品库中各个商品的各维特征分别与第一商品的各维特征间的第一匹配度,从商品库中获取多个候选商品,进而在第一商品对应的各维特征数量m与第i个所述候选商品对应的各维特征数量n
i
不同时,根据m维特征与n
i
特征中均包含特征,确定第一商品分别与每个候选商品的第二匹配度,以根据第一商品分别与每个候选商品的第二匹配度,从各候选商品中提取与第一商品匹配的商品。由此,通过从第一商品对应的第一描述信息中提取与第一商品的商品属性相关的多维特征,并建立包括大量商品及其对应的各维特征的商品库,以通过与商品属性相关的多维特征匹配,从商品库中提取与第一商品匹配的商品,从而通过从商品的描述信息中提取与商品属性相关的关键特征进行匹配,过滤掉了描述信息中与商品属性无关的无用文本信息,并对提取的关键特征进行统一,进一步提升了商品匹配的准确性。
[0132]
在本技术一种可能的实现形式中,由于第一商品的多维特征与各候选商品的多维特征可能不能完全匹配,从而可以根据第一商品的多维特征与候选商品的多维特征中均存在的特征间的第一匹配度,从候选商品中选取匹配商品,并调整各维特征的权重,以进一步提升商品匹配的准确性。
[0133]
下面结合图4,对本技术实施例提供的商品的匹配方法进行进一步说明。
[0134]
图4为本技术实施例所提供的又一种商品的匹配方法的流程示意图。
[0135]
如图4所示,该商品的匹配方法,包括以下步骤:
[0136]
步骤401,获取第一商品对应的第一描述信息。
[0137]
步骤402,对第一描述信息进行识别,以确定第一商品的多维特征。
[0138]
步骤403,根据商品库中各个商品的各维特征分别与第一商品的各维特征间的第一匹配度,从商品库中获取多个候选商品。
[0139]
上述步骤401

403的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
[0140]
步骤404,确定第一商品对应的各维特征数量m及第i个候选商品对应的各维特征数量n
i
,其中,m、n和i分别为正整数,且i小于或等于候选商品的总数量k。
[0141]
步骤405,在m与n
i
不相同的情况下,更新各维特征对应的权重。
[0142]
在本技术实施例中,确定第一商品与各候选商品的第二匹配度时,可以首先确定第一商品的各维特征数量m,以及各个候选商品的各维特征数量n。在m与每个候选商品的各维特征数量n均相同的情况下,可以按照上述实施例中公开的方式,根据第一商品中每维特
征分别与第i个候选商品的对应维特征间的第一匹配度,以及各维特征的权重,确定第一商品中各维特征与第i个候选商品的对应维特征间的第一匹配度的加权均值,并将第一商品中各维特征与第i个候选商品的对应维特征间的第一匹配度的加权均值,确定为第一商品与第i个候选商品的第二匹配度。
[0143]
在任意一个候选商品的各维特征数量n与m不同的情况下,比如m小于第i个候选商品的各维特征数量n
i
不同的情况下,对于第一商品的m维特征,可以仅保留m维特征与n
i
维特征均包含的特征,以及对于各候选商品的n维特征,也可以仅保留m维特征与n
i
维特征均包含的特征。
[0144]
作为一种示例,在m小于第i个候选商品的各维特征数量n
i
的情况下,即第i个候选商品的各维特征中包含第一商品的各维特征中未包含的特征,从而可以根据第一商品的m维特征,从各候选商品的n维特征中去除第一商品的m维特征中未包含的特征,仅保留各候选商品的n维特征中包含的与第一商品的m维特征相同的m维特征,并重新分配m维特征分别对应的权重,以使各维特征对应的权重与当前的各维特征数量相适应,从而提升第二匹配度确定的准确性。
[0145]
举例来说,第一商品的多维特征包括类别、品牌、型号,各候选商品的各维特征包括类别、品牌、型号与性能描述,且类别、品牌、型号与性能描述对应的权重分别为0.3、0.3、0.2、0.2,则可以去除各候选商品的性能描述特征,并将类别、品牌与型号对应的权重分别更新为0.4、0.4、0.2。
[0146]
作为一种示例,在第i个候选商品的各维特征数量n
i
小于m的情况下,即第一商品的m维特征中包含第i个候选商品的n
i
维特征中未包含的特征,从而可以根据第i个候选商品的n
i
维特征,从第一商品的m维特征中去除第i个候选商品的n
i
维特征中未包含的特征,仅保留第一商品的m维特征中包含的与第i个候选商品的n
i
维特征相同的n
i
维特征,并重新分配n
i
维特征分别对应的权重,以使各维特征对应的权重与当前的各维特征数量相适应,从而提升第二匹配度确定的准确性。
[0147]
举例来说,第一商品的多维特征包括类别、品牌、型号,各候选商品的各维特征包括类别、品牌,且类别、品牌、型号对应的权重分别为0.4、0.4、0.2,则可以去除第一商品的型号特征,并将类别、品牌对应的权重分别更新为0.5、0.5。
[0148]
步骤406,根据更新后的各维特征对应的权重、及第一商品的各维特征与每个候选商品的对应维特征间的第一匹配度,确定第一商品分别与每个候选商品的第二匹配度。
[0149]
作为一种示例,m小于第i个候选商品的各维特征数量n
i
的情况下,可以根据第一商品对应的m维特征分别与每个候选商品的m维特征间的第一匹配度,以及更新后的m维特征分别对应的权重,确定第一商品与每个候选商品的第二匹配度。比如,对于第i个候选商品,可以将第一商品的m维特征与第i个候选商品的m维特征间的第一匹配度的加权均值,确定为第一商品与第i个候选商品的第二匹配度。
[0150]
举例来说,第一商品的多维特征包括类别、品牌、型号,各候选商品的各维特征包括类别、品牌、型号与性能描述,且类别、品牌、型号与性能描述对应的权重分别为0.3、0.3、0.2、0.2,则可以去除各候选商品的性能描述特征,并将类别、品牌与型号对应的权重分别更新为0.4、0.4、0.2。进而可以根据第一商品的类别、品牌、型号分别与每个候选商品的类别、品牌、型号间的第一匹配度,以及类别、品牌、型号分别对应的更新后的权重0.4、0.4、
0.2,确定第一商品与每个候选商品的第二匹配度。
[0151]
作为一种示例,在第i个候选商品的各维特征数量n
i
小于m的情况下,根据第一商品对应的n
i
维特征分别与每个候选商品的n
i
维特征间的第一匹配度,以及更新后的n
i
维特征分别对应的权重,确定第一商品与每个候选商品的第二匹配度。比如,对于第i个候选商品,可以将第一商品的n
i
维特征与第i个候选商品的n
i
维特征间的第一匹配度的加权均值,确定为第一商品与第i个候选商品的第二匹配度。
[0152]
举例来说,第一商品的多维特征包括类别、品牌、型号,各候选商品的各维特征包括类别、品牌,且类别、品牌、型号对应的权重分别为0.4、0.4、0.2,则可以去除第一商品的型号特征,并将类别、品牌对应的权重分别更新为0.5、0.5。进而可以根据第一商品的类别、品牌分别与每个候选商品的类别、品牌间的第一匹配度,以及类别、品牌分别对应的更新后的权重0.5、0.5,确定第一商品与每个候选商品的第二匹配度。
[0153]
步骤407,根据第一商品分别与每个候选商品的第二匹配度,从多个候选商品中提取与第一商品匹配的商品。
[0154]
上述步骤407的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。
[0155]
本技术实施例提供的商品的匹配方法,通过从第一商品对应的第一描述信息中提取第一商品的多维特征,并根据商品库中各个商品的各维特征分别与第一商品的各维特征间的第一匹配度,从商品库中获取多个候选商品,进而在第一商品对应的各维特征数量m与第i个所述候选商品对应的各维特征数量n
i
不同时,根据m维特征与n
i
特征中均包含特征,确定第一商品分别与每个候选商品的第二匹配度,并更新各维特征对应的权重,以根据第一商品分别与每个候选商品的第二匹配度,从各候选商品中提取与第一商品匹配的商品。由此,通过从第一商品对应的第一描述信息中提取与第一商品的商品属性相关的多维特征,并建立包括大量商品及其对应的各维特征的商品库,以通过与商品属性相关的多维特征匹配,从商品库中提取与第一商品匹配的商品,从而通过从商品的描述信息中提取与商品属性相关的关键特征进行匹配,过滤掉了描述信息中与商品属性无关的无用文本信息,并对提取的关键特征进行统一和权重调整,进一步提升了商品匹配的准确性。
[0156]
为了实现上述实施例,本技术还提出一种商品的匹配装置。
[0157]
图5为本技术实施例提供的一种商品的匹配装置的结构示意图。
[0158]
如图5所示,该商品的匹配装置50,包括:
[0159]
第一获取模块51,用于获取第一商品对应的第一描述信息;
[0160]
第一确定模块52,用于对第一描述信息进行识别,以确定第一商品的多维特征;
[0161]
第二获取模块53,用于根据商品库中各个商品的各维特征分别与第一商品的各维特征间的第一匹配度,从商品库中获取多个候选商品;
[0162]
第二确定模块54,用于根据第一商品的各维特征与每个候选商品的对应维特征间的第一匹配度及各维对应的权重,确定第一商品分别与每个候选商品的第二匹配度;
[0163]
提取模块55,用于根据第一商品分别与每个候选商品的第二匹配度,从多个候选商品中提取与第一商品匹配的商品。
[0164]
在实际使用时,本技术实施例提供的商品的匹配装置,可以被配置在任意电子设备中,以执行前述商品的匹配方法。
[0165]
本技术实施例提供的商品的匹配装置,通过从第一商品对应的第一描述信息中提取第一商品的多维特征,并根据商品库中各个商品的各维特征分别与第一商品的各维特征间的第一匹配度,从商品库中获取多个候选商品,进而根据第一商品的各维特征与每个候选商品的对应维特征间的第一匹配度及各维对应的权重,确定第一商品分别与每个候选商品的第二匹配度,以根据第一商品分别与每个候选商品的第二匹配度,从各候选商品中提取与第一商品匹配的商品。由此,通过从第一商品对应的第一描述信息中提取与第一商品的商品属性相关的多维特征,并建立包括大量商品及其对应的各维特征的商品库,以通过与商品属性相关的多维特征匹配,从商品库中提取与第一商品匹配的商品,从而通过从商品的描述信息中提取与商品属性相关的关键特征进行匹配,过滤掉了描述信息中与商品属性无关的无用文本信息,提升了商品匹配的准确性。
[0166]
在本技术一种可能的实现形式中,上述多维特征包括以下各项中的至少两项:类别、品牌、型号及性能描述。
[0167]
进一步的,在本技术另一种可能的实现形式中,上述第一确定模块52,包括:
[0168]
第一确定单元,用于将第一描述信息输入一级分类模型,以确定第一商品所属的目标一级类别;
[0169]
第二确定单元,用于在第一商品所属的目标一级类别包含子类别的情况下,将第一描述信息输入目标一级类别对应的二级分类模型,以确定第一商品所属的目标二级类别。
[0170]
进一步的,在本技术再一种可能的实现形式中,上述商品的匹配装置50,还包括:
[0171]
第三获取模块,用于获取训练数据集及测试数据集,其中,训练数据集及测试数据集中,分别包括多个商品的描述信息及每个商品对应的标注类别;
[0172]
第一生成模块,用于利用训练数据集,对初始分类模型进行训练,以生成第一分类模型;
[0173]
第三确定模块,用于利用第一分类模型对测试数据集中的每个商品的描述信息进行处理,以确定每个商品属于各个类别的预测概率;
[0174]
第四确定模块,用于根据每个商品对应的标注类别及属于各个类别的预测概率,确定各个类别间的混淆概率;
[0175]
第二生成模块,将混淆概率大于阈值的各类别进行聚类,以生成一级类别;
[0176]
第三生成模块,用于利用聚类后的每个一级类别及分别对应的描述信息,对初始分类模型进行训练,以生成一级分类模型;
[0177]
第四生成模块,用于利用每个一级类别包含的各标注类别及描述信息,对初始分类模型进行训练,以生成与每个一级类别对应的二级分类模型。
[0178]
进一步的,在本技术又一种可能的实现形式中,上述第一确定模块52,包括:
[0179]
第三确定单元,用于对第一描述信息进行类别识别,以确定第一商品所属的类别;
[0180]
获取单元,用于根据第一商品所属的类别,获取第一商品对应的识别规则;
[0181]
第四确定单元,用于基于所述识别规则,对第一描述信息进行匹配,以确定第一商品的型号和/或性能描述。
[0182]
进一步的,在本技术又一种可能的实现形式中,上述第四确定单元,具体用于:
[0183]
基于性能描述对应的识别规则,对第一描述信息进行匹配,以确定第一商品的性
能描述;
[0184]
基于型号对应的识别规则,对第一描述信息中除第一商品的性能描述外的其余信息进行匹配,以确定第一商品的型号。
[0185]
进一步的,在本技术另一种可能的实现形式中,上述第二确定模块54,包括:
[0186]
第五确定单元,用于确定第一商品对应的各维特征数量m及第i个候选商品对应的各维特征数量n
i
,其中,m、n和i分别为正整数,且i小于或等于候选商品的总数量k;
[0187]
第六确定单元,用于在m小于n
i
的情况下,根据第一商品对应的m维特征分别与每个候选商品的m维特征的第一匹配度、及m维特征分别对应的权重,确定第一商品分别与每个候选商品的第二匹配度;
[0188]
第七确定单元,用于在n
i
小于m的情况下,根据每个候选商品对应的n
i
维特征分别与第一商品的n
i
维特征间的第一匹配度、及n
i
维特征分别对应的权重,确定第一商品分别与每个候选商品的第二匹配度。
[0189]
进一步的,在本技术再一种可能的实现形式中,上述第二确定模块54,包括:
[0190]
第八确定单元,用于确定第一商品对应的各维特征数量m及第i个候选商品对应的各维特征数量n
i
,其中,m、n和i分别为正整数,且i小于或等于候选商品的总数量k;
[0191]
更新单元,用于在m与n
i
不相同的情况下,更新各维特征对应的权重;
[0192]
第九确定单元,用于根据更新后的各维特征对应的权重、及第一商品的各维特征与每个候选商品的对应维特征间的第一匹配度,确定第一商品分别与每个候选商品的第二匹配度。
[0193]
进一步的,在本技术又一种可能的实现形式中,上述提取模块55,包括:
[0194]
提取单元,用于在至少两个所述候选商品对应的第二匹配度相同、且均大于其它各所述候选商品对应的第二匹配度的情况下,根据所述至少两个所述候选商品分别对应的第一匹配度,从所述至少两个所述候选商品中提取与所述第一商品匹配的商品。
[0195]
需要说明的是,前述对图1、图2、图3、图4所示的商品的匹配方法实施例的解释说明也适用于该实施例的商品的匹配装置50,此处不再赘述。
[0196]
本技术实施例提供的商品的匹配装置,通过对第一商品对应的第一描述信息进行类别识别,以确定第一商品所属的类别,并基于识别规则,对第一描述信息进行匹配,以确定第一商品的型号和/或性能描述,之后根据商品库中各个商品的各维特征分别与第一商品的各维特征间的第一匹配度,从商品库中获取多个候选商品,进而根据第一商品的各维特征与每个候选商品的对应维特征间的第一匹配度及各维对应的权重,确定第一商品分别与每个候选商品的第二匹配度,以根据第一商品分别与每个候选商品的第二匹配度,从各候选商品中提取与第一商品匹配的商品。由此,通过为不同类别的商品分别设置不同的识别规则,用于识别商品的型号与性能描述,以通过与商品属性相关的多维特征匹配,从商品库中提取与第一商品匹配的商品,从而通过从商品的描述信息中提取与商品属性相关的关键特征进行匹配,过滤掉了描述信息中与商品属性无关的无用文本信息,并通过提升商品特征识别的准确性,进一步提升了商品匹配的准确性。
[0197]
为了实现上述实施例,本技术还提出一种电子设备。
[0198]
图6为本发明一个实施例的电子设备的结构示意图。
[0199]
如图6所示,上述电子设备200包括:
[0200]
存储器210及处理器220,连接不同组件(包括存储器210和处理器220)的总线230,存储器210存储有计算机程序,当处理器220执行所述程序时实现本技术实施例所述的商品的匹配方法。
[0201]
总线230表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
[0202]
电子设备200典型地包括多种电子设备可读介质。这些介质可以是任何能够被电子设备200访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
[0203]
存储器210还可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)240和/或高速缓存存储器250。电子设备200可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统260可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd

rom,dvd

rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线230相连。存储器210可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本技术各实施例的功能。
[0204]
具有一组(至少一个)程序模块270的程序/实用工具280,可以存储在例如存储器210中,这样的程序模块270包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块270通常执行本技术所描述的实施例中的功能和/或方法。
[0205]
电子设备200也可以与一个或多个外部设备290(例如键盘、指向设备、显示器291等)通信,还可与一个或者多个使得用户能与该电子设备200交互的设备通信,和/或与使得该电子设备200能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口292进行。并且,电子设备200还可以通过网络适配器293与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器293通过总线230与电子设备200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0206]
处理器220通过运行存储在存储器210中的程序,从而执行各种功能应用以及数据处理。
[0207]
需要说明的是,本实施例的电子设备的实施过程和技术原理参见前述对本技术实施例的商品的匹配方法的解释说明,此处不再赘述。
[0208]
本技术实施例提供的电子设备,可以执行如前所述的商品的匹配方法,通过从第一商品对应的第一描述信息中提取第一商品的多维特征,并根据商品库中各个商品的各维特征分别与第一商品的各维特征间的第一匹配度,从商品库中获取多个候选商品,进而根据第一商品的各维特征与每个候选商品的对应维特征间的第一匹配度及各维对应的权重,
确定第一商品分别与每个候选商品的第二匹配度,以根据第一商品分别与每个候选商品的第二匹配度,从各候选商品中提取与第一商品匹配的商品。由此,通过从第一商品对应的第一描述信息中提取与第一商品的商品属性相关的多维特征,并建立包括大量商品及其对应的各维特征的商品库,以通过与商品属性相关的多维特征匹配,从商品库中提取与第一商品匹配的商品,从而通过从商品的描述信息中提取与商品属性相关的关键特征进行匹配,过滤掉了描述信息中与商品属性无关的无用文本信息,提升了商品匹配的准确性。
[0209]
为了实现上述实施例,本技术还提出一种计算机可读存储介质。
[0210]
其中,该计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,以实现本技术实施例所述的商品的匹配方法。
[0211]
为了实现上述实施例,本技术再一方面实施例提供一种计算机程序,该程序被处理器执行时,以实现本技术实施例所述的商品的匹配方法。
[0212]
一种可选实现形式中,本实施例可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd

rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0213]
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0214]
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0215]
可以以一种或多种程序设计语言或其组合来编写用于执行本技术操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c ,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户电子设备上执行、部分地在用户电子设备上执行、作为一个独立的软件包执行、部分在用户电子设备上部分在远程电子设备上执行、或者完全在远程电子设备或服务器上执行。在涉及远程电子设备的情形中,远程电子设备可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户电子设备,或者,可以连接到外部电子设备(例如利用因特网服务提供商来通过因特网连接)。
[0216]
本领域技术人员在考虑说明书及实践这里申请的发明后,将容易想到本技术的其它实施方案。本技术旨在涵盖本技术的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本技术的一般性原理并包括本技术未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本技术的真正范围和精神由权利要
求指出。
[0217]
应当理解的是,本技术并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本技术的范围仅由所附的权利要求来限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献