一种用户画像优化方法与流程

2022-10-29 01:26:04 来源：中国专利 TAG：

1.本发明涉及信息技术领域，尤其涉及一种用户画像优化方法。

背景技术：

2.用户对自身的画像都是无法感知的，只有系统后台通过数据库数据记录。但是，用户画像有时会跟用户真实情况脱节，因此有必要通过确认或者通过少量交互提示来达到更好的画像修改。例如，通过跟用户确认，他的画像推荐了这些，有哪些是他不喜欢的，来避免错误推荐。目前多数画像系统、推荐系统采用后台画像推荐算法，整个过程通过收集用户数据实现，用户基本没有修改调整的权利。本方法通过将系统后台画像，展示给用户，或者通过间接途径，使用户能感知部分画像，方便用户参与画像设计过程中，进行自我优化和改良。通过交互式的用户画像能够实现更好的用户画像刻画，以及用户服务推荐。但是，应该在什么场景进行交互，能够展示多么详细的画像标签，是否可以告诉用户他的很多私人标签。这些都是不确定的，向一个不喜欢进行用户画像的用户交互，可能会引起用户反感。为了识别用户对画像交互的接受情况，需要对用户进行最初的个人关于用户画像的画像识别，即元画像。

技术实现要素：

3.本发明提供了一种用户画像优化方法，主要包括：获取用户数据并进行有效性检验；用户原始数据进行向量化处理；根据用户画像向量构建用户元画像；使用用户数据建立一般用户标签画像；通过聚类距离判定画像标签确定度；根据标签内容划分用户标签种类；根据元画像接受度类型决定用户画像交互方式；通过分析用户接受度，判断可交互画像的类别、层级和数量；根据不同场景类别设计进行不同的标签交互；用户对自我画像标签进行交互修正；针对用户修改后的画像，进行双重推荐置信度检验；根据用户交互行为重新定义用户画像接受类型；进一步可选地，所述获取用户数据并进行有效性检验包括：绘制用户画像，需要多维用户数据，根据用户画像使用需要，确定数据收集维度；若用户不允许访问个人数据，或不接受进行交互推荐，则放弃为用户画像，放弃进行用户画像交互；若用户允许访问个人数据，愿意进行交互推荐，则获取用户基本个人数据，用户隐私偏好设置，以及用户行为习惯数据；对数据进行预处理，通过数据冲突判断，检测用户数据是否完整，对用户数据进行数据清洗。
4.进一步可选地，所述用户原始数据进行向量化处理包括：获取用户原始数据，判断数据是否与用户隐私偏好设置、画像交互偏好、年龄、性别、学历、地域相关，如果数据相关，则将数据划分为用户客观数据；如果数据与浏览内容、浏览时间、浏览频率相关，则将数据划分为用户行为数据；用户客观数据采用独热码将离散型变量数据化，用向量化处理，获取用户客观信息向量；用户行为数据采用统计方法，对用户行为数据进行加权求和，排列用户行为数据，建立用户行为偏好向量；将用户客观信息向
量和用户行为偏好向量组合，构成用户画像向量，作为用户画像数据基础。
5.进一步可选地，所述根据用户画像向量构建用户元画像包括：随机选择相同数量开启用户画像交互和关闭用户画像交互的用户；从选择用户的用户画像向量中，获取用户客观数据中用户隐私偏好设置、画像交互偏好、年龄、性别、学历、地域相关数据，作为用户分类数据；对用户分类数据进行归一化处理，去除取值尺度的影响；将用户分类数据投射到高维数据空间中，假设存在高维超平面p，按照用户是否支持进行用户画像交互维度进行划分；分别计算用户分类数据与假设超平面之间的欧式距离d，所有用户与平面之间的距离和记作dp；以最小化dp作为高维超平面优化条件，获得高维超平面也就是支持向量；根据用户向量与支持向量的距离d，d小于设定的阈值，则划分为不确定型，d大于设定的阈值，且在支持向量正向，则划分为积极型，d大于设定的阈值，且在支持向量负向，则划分为保守型；不同类别用户对于用户画像交互接受度不同；将用户交互支持判断结果和用户基本数据组合，建立用户元画像。
6.进一步可选地，所述使用用户数据建立一般用户标签画像包括：对所有用户，获取用户画像向量，选择用户画像方向，针对每一维度方向数据进行聚类分析，获取聚类中心向量；选择聚类中心设定阈值范围内用户的用户客观信息向量和用户行为偏好向量；将用户客观信息向量按照独热码规则，反推出离散型变量，提取离散型变量名称；提取用户行为偏好向量中设定阈值排名之前的用户浏览主题；对离散型变量名称进行统计分析，以重复最多的字词作为用户基本标签；对用户浏览主题进行统计分析，以重复最多的浏览主图作为用户行为标签；将用户基本标签和用户行为标签整合，构建一般用户画像。
7.进一步可选地，所述通过聚类距离判定画像标签确定度包括：获取聚类中心向量以及用户画像向量，计算用户画像向量与聚类中心的欧式距离；根据距离大小，衡量用户标签的确定度；距离小于设定的阈值，则判定用户标签为确定性标签；距离大于设定的阈值，则判定用户标签为模糊类标签；将标签判定结果添加到一般用户画像中，标识一般用户画像的标签，重构为一般用户画像。
8.进一步可选地，所述根据标签内容划分用户标签种类包括：对于一般用户画像中的画像标签进行自然语言分析处理，判断标签是否涉及关键信息；若标签涉及营销类信息，将标签归入营销类标签中；若标签涉及个人隐私信息，需要额外判断标签是否属于确定性标签；如果属于模糊类标签，展示可能引起用户反感，则拒绝在用户画像交互过程中展示；将其他不涉及关键信息的标签，归入通用类标签。
9.进一步可选地，所述根据元画像接受度类型决定用户画像交互方式包括：根据元画像中将用户划分为保守型，积极型，不确定型三类；不同类型元画像的用户，对于用户画像交互行为接受度不一致，需要设计不同的交互方式；积极型用户愿意接受全面用户画像交互，不确定型用户愿意接受部分交互方式，保守型不愿意接受公开用户画像交互方式；对于积极型用户，提供展示用户画像标签，增加、减少用户标签机会，以及用户自定义画像标签的主动交互机会；对于不确定型用户，选择展示部分用户画像标签、增删用户标签的主动交互方式；对于保守型用户，由系统进行后台数据画像，用户对不满意标签进行删除，但无法添加和修改标签，减少用户画像交互参与度，由画像系统收集数据，调整用户画像；对于模糊类、个人隐私、营销类标签交互，提供弹窗询问的交互模式。
10.进一步可选地，所述通过分析用户接受度，判断可交互画像的类别、层级和数量包括：根据用户对于用户画像交互的元画像分类，每个用户展示出的用户画像标签内容和详细程度也有所不同；对于保守型用户，不进行主动用户画像交互，推荐算法按照设置正常运行；对于不确定型用户，提供营销类标签，通用类标签，不提供隐私类标签；对于积极型用户，提供所有类别标签；根据用户接受度判定用户画像交互标签提供数量和标签层级，接受度越高，标签提供数量越多，标签层级越深入。
11.进一步可选地，所述根据不同场景类别设计进行不同的标签交互包括：采集交互场景的地址信息，从地址信息数据库中检索判断是否为常见场景，识别场景类型；若地址信息不在检索范围内，采集进行用户画像交互的场景信息、标题文字，通过统计分析识别得出出现频率最高的文字，判断场景主题；根据主题将交互场景进行划分成为营销类、隐私类、通用类场景，不同的场景主题进行不同类别标签交互；若用户存在与场景主题一致的标签，则在此类场景下，进行标签交互；根据用户元画像接受度类型，选择对应的交互方式。
12.进一步可选地，所述用户对自我画像标签进行交互修正包括：用户通过主动修改和被动调整两种方式影响修改个人画像；系统主动进行用户画像交互，根据一般用户画像给出确定性用户标签，通过弹窗确认或者信息栏展示方式呈现；用户根据个人兴趣爱好和基本信息，主动选择适合自身形象的画像标签；对于积极型用户，提供对标签内容进行修正和重选的权利，用户按照自己对自身兴趣和形象的判断，修改标签内容；系统被动进行用户画像交互，根据用户新增的行为数据，持续进行用户画像更新，获得数据分析用户画像，后台对用户画像进行更改，修改过程用户无法影响控制。
13.进一步可选地，所述针对用户修改后的画像，进行双重推荐置信度检验包括：在用户修正画像之前，通过用户画像标签设计用户推荐算法，获得系统推荐算法；根据用户修正后的用户画像，增加用户修改标签的推荐权重，重新排列设计用户推荐算法，获得用户定义推荐算法；比较两种推荐算法，得出推荐算法差异点；针对存在差异的推荐方向，进行双重展示，同时展示两个算法推荐内容，统计用户接受度；如果用户对自定义的标签浏览量行为增加，接受度增加，则判定用户对标签修改合理，置信度提升；相反，如果用户对自定义标签的数据没有正向增加，则判定用户对标签进行了错误修改，置信度下降。
14.一种用户画像优化方法其特征在于，所述系统包括：收集用户画像交互过程中的行为数据，进行统计分析；若用户参与用户画像交互，进行用户画像选择和修改，同时置信度提升，则上调用户画像交互级别；若用户参与用户画像交互，进行用户画像的改进，画像置信度稳定，则保持正常画像交互；若用户修改选择画像标签，但是统计分析得出画像修改的置信度持续下降，下调用户画像接受度级别；若用户持续在提供的交互界面拒绝进行画像交互，下调用户画像接受度级别。
15.本发明实施例提供的技术方案可以包括以下有益效果：本发明区别于传统仅仅依靠算法构建的，没有用户主动参与的纯分析型用户画像，能够构建用户元画像。本发明用户参与用户画像的设计过程中，通过合理的交互模式，使用户了解自己的画像，并且能够依据个人喜好对用户画像进行一定修改。系统通过画像交互，能够更加准确细致的判断用户画像，进行针对性推荐。通过将用户数据个性化、可定
制化、可交互化一定程度上解决了用户数据使用与侵犯用户隐私方面的问题。
16.【附图说明】图1为本发明的一种用户画像优化方法的流程图。
17.【具体实施方式】为了使本发明的目的、技术方案和优点更加清楚，下面结合附图和具体实施例对本发明进行详细描述。
18.图1为本发明的一种用户画像优化方法流程图。如图1所示，本实施例一种用户画像优化方法具体可以包括：步骤101，获取用户数据并进行有效性检验。
19.绘制用户画像，需要多维用户数据，根据用户画像使用需要，确定数据收集维度。若用户不允许访问个人数据，或不接受进行交互推荐，则放弃为用户画像，放弃进行用户画像交互。若用户允许访问个人数据，愿意进行交互推荐，则获取用户基本个人数据，用户隐私偏好设置，以及用户行为习惯数据。对数据进行预处理，通过数据冲突判断，检测用户数据是否完整，对用户数据进行数据清洗。用户数据量直接影响到用户画像，因此需要确保收集较为完整正确的用户数据。例如：本次画像针对定向营销方面进行用户画像，确定收集数据方向为用户基本数据以及用户购物数据。若用户允许访问，则收集用户数据和购物方面行为数据，对用户数据进行处理分析。若用户不允许访问个人数据，则放弃对用户进行画像和推荐。
20.步骤102，用户原始数据进行向量化处理。
21.获取用户原始数据，判断数据是否与用户隐私偏好设置、画像交互偏好、年龄、性别、学历、地域相关，如果数据相关，则将数据划分为用户客观数据。如果数据与浏览内容、浏览时间、浏览频率相关，则将数据划分为用户行为数据。用户客观数据采用独热码将离散型变量数据化，用向量化处理，获取用户客观信息向量。用户行为数据采用统计方法，对用户行为数据进行加权求和，排列用户行为数据，建立用户行为偏好向量。将用户客观信息向量和用户行为偏好向量组合，构成用户画像向量，作为用户画像数据基础。例如：用户画像设计针对四个主要维度，分别对用户个人信息、工作、消费、兴趣爱好收集数据。对于用户年龄、性别、学历、地域这样的客观数据，统一数据结构，采用独热码，将离散型变量数据化，建立用户客观信息向量，完成对客观数据处理。对于用户购物浏览数据，统计用户浏览每一类别物品时间，以及购买金额等数据，对购物相关数据加权求和依次排列，得出用户购物偏好向量。对于用户兴趣数据，统计用户浏览每一类兴趣标签内容时间，以及浏览每一类兴趣标签频率数据，对浏览时间和浏览频率数据进行加权求和依次排列，得出成为用户兴趣偏好向量。将用户购物偏好向量、用户兴趣偏好向量，以及其他维度行为偏好向量数据重新构造，组成数据表头为维度名称，数据内容为各自维度偏好向量内容的用户行为偏好向量。用户客观数据向量以及用户行为偏好向量共同构成用户画像向量。
22.步骤103，根据用户画像向量构建用户元画像。
23.随机选择相同数量开启用户画像交互和关闭用户画像交互的用户。从选择用户的用户画像向量中，获取用户客观数据中用户隐私偏好设置、画像交互偏好、年龄、性别、学历、地域相关数据，作为用户分类数据。对用户分类数据进行归一化处理，去除取值尺度的影响。将用户分类数据投射到高维数据空间中，假设存在高维超平面p，按照用户是否支持
进行用户画像交互维度进行划分。分别计算用户分类数据与假设超平面之间的欧式距离d，所有用户与平面之间的距离和记作dp。以最小化dp作为高维超平面优化条件，获得高维超平面也就是支持向量。根据用户向量与支持向量的距离d，d小于设定的阈值，则划分为不确定型，d大于设定的阈值，且在支持向量正向，则划分为积极型，d大于设定的阈值，且在支持向量负向，则划分为保守型。不同类别用户对于用户画像交互接受度不同。将用户交互支持判断结果和用户基本数据组合，建立用户元画像。例如：通过用户画像向量，获取到用户画像交互偏好，以及用户其他综合个人信息。将获得的数据进行svm支持向量机分析，获得一个支持向量，该支持向量能够综合个人数据判定用户偏好支持程度。如果一个用户的分类数据经过计算，与支持向量p的距离d小于设定的阈值，则判断用户为不确定型，无法准确判断用户是否支持用户画像交互。如果某一用户与支持向量的距离d大于设定的阈值，且处于支持向量正向，则说明用户对进行画像交互持有积极态度，给予积极型判定。用户的支持情况判定结果会加入到用户基本数据中，建立用户元画像。
24.步骤104，使用用户数据建立一般用户标签画像。
25.对所有用户，获取用户画像向量，选择用户画像方向，针对每一维度方向数据进行聚类分析，获取聚类中心向量。选择聚类中心设定阈值范围内用户的用户客观信息向量和用户行为偏好向量。将用户客观信息向量按照独热码规则，反推出离散型变量，提取离散型变量名称。提取用户行为偏好向量中设定阈值排名之前的用户浏览主题。对离散型变量名称进行统计分析，以重复最多的字词作为用户基本标签。对用户浏览主题进行统计分析，以重复最多的浏览主图作为用户行为标签。将用户基本标签和用户行为标签整合，构建一般用户画像。例如：用户客观信息向量，了解到某用户年龄在18到22岁之间，性别为男，职业为学生。用户行为偏好向量显示，用户浏览了多条cba季后赛新闻，这些新闻中包含了cba、篮球、球星、体育等关键词。选择用户爱好作为画像方向，针对浏览行为和兴趣爱好方面的特征向量，进行聚类分析。聚类分析将会把有类似爱好、个人信息情况的用户聚类。经过对于用户客观信息向量和用户行为偏好向量的统计分析，得出该名用户所处类别中，用户基本聚类标签有“大学生”“男性”，用户行为聚类标签有“运动”“篮球”“易建联”“cba球迷”。最终可以给该用户添加确定画像标签：“大学生”“男性”“运动”“篮球”“易建联”“cba球迷”。
26.步骤105，通过聚类距离判定画像标签确定度。
27.获取聚类中心向量以及用户画像向量，计算用户画像向量与聚类中心的欧式距离。根据距离大小，衡量用户标签的确定度。距离小于设定的阈值，则判定用户标签为确定性标签。距离大于设定的阈值，则判定用户标签为模糊类标签。将标签判定结果添加到一般用户画像中，标识一般用户画像的标签，重构为一般用户画像。例如：通过计算用户画像向量与用户所处聚类中心向量的距离，发现该距离小于设定的阈值，则评价用户标签为确定性标签。将标签判定结果添加到一般用户画像中，最终可以给该用户添加确定性画像标签：“大学生”“男性”“运动”“篮球”“易建联”“cba球迷”，不确定性标签：无。
28.步骤106，根据标签内容划分用户标签种类。
29.对于一般用户画像中的画像标签进行自然语言分析处理，判断标签是否涉及关键信息。若标签涉及营销类信息，将标签归入营销类标签中。若标签涉及个人隐私信息，需要额外判断标签是否属于确定性标签。如果属于模糊类标签，展示可能引起用户反感，则拒绝在用户画像交互过程中展示。将其他不涉及关键信息的标签，归入通用类标签。例如：如果
某用户获得大学生、运动、篮球、cba球迷、易建联标签。经过判断，篮球和营销有关，则将篮球标签划归到营销类中。如果用户存在“艾滋病患者”这样隐私类标签，则判断标签的确认度，如果确认度不高，贸然进行用户画像交互会引发用户反感，则不在用户画像交互中展现。
30.步骤107，根据元画像接受度类型决定用户画像交互方式。
31.根据元画像中将用户划分为保守型，积极型，不确定型三类。不同类型元画像的用户，对于用户画像交互行为接受度不一致，需要设计不同的交互方式。积极型用户愿意接受全面用户画像交互，不确定型用户愿意接受部分交互方式，保守型不愿意接受公开用户画像交互方式。对于积极型用户，提供展示用户画像标签，增加、减少用户标签机会，以及用户自定义画像标签的主动交互机会。对于不确定型用户，选择展示部分用户画像标签、增删用户标签的主动交互方式。对于保守型用户，由系统进行后台数据画像，用户对不满意标签进行删除，但无法添加和修改标签，减少用户画像交互参与度，由画像系统收集数据，调整用户画像。对于模糊类、个人隐私、营销类标签交互，提供弹窗询问的交互模式。例如：若一个用户的元画像表明，该用户为积极型用户，则对其进行全面的用户交互。在用户界面提供系统通过算法计算出的一般用户标签，用户可以对标签进行增加、减少，甚至可以主动修改某些标签内容。比如，用户画像中存在一个“潮流”标签，用户可以将标签内容修改为“滑板”，推荐系统可以根据用户自己设置的用户标签进行更好的服务。对于保守型用户，仅仅面向用户展示用户标签，并且后台进行用户画像调整，不允许用户自己修改用户画像内容。如果用户在画像标签交互过程中，对某些标签存在质疑，可以选择删除标签。
32.步骤108，通过分析用户接受度，判断可交互画像的类别、层级和数量。
33.根据用户对于用户画像交互的元画像分类，每个用户展示出的用户画像标签内容和详细程度也有所不同。对于保守型用户，不进行主动用户画像交互，推荐算法按照设置正常运行。对于不确定型用户，提供营销类标签，通用类标签，不提供隐私类标签。对于积极型用户，提供所有类别标签。根据用户接受度判定用户画像交互标签提供数量和标签层级，接受度越高，标签提供数量越多，标签层级越深入。用户画像交互需要将尽可能多的，呈现用户接受范围之内的标签。例如：如果用户属于积极型用户，画像交互的接受度较高，则进行个人爱好类交互，在用户标签展示中展示个人爱好类的标签。用户对可交互画像的接受度高，且“运动”以及级别更小的“易建联”标签确定为可交互画像。如果用户属于保守型用户，不愿意进行画像交互，则不进行主动的用户画像交互，采用常规推荐算法。
34.步骤109，根据不同场景类别设计进行不同的标签交互。
35.采集交互场景的地址信息，从地址信息数据库中检索判断是否为常见场景，识别场景类型。若地址信息不在检索范围内，采集进行用户画像交互的场景信息、标题文字，通过统计分析识别得出出现频率最高的文字，判断场景主题。根据主题将交互场景进行划分成为营销类、隐私类、通用类场景，不同的场景主题进行不同类别标签交互。若用户存在与场景主题一致的标签，则在此类场景下，进行标签交互。根据用户元画像接受度类型，选择对应的交互方式。例如：通过关键文字统计分析，发现该场景是一个购物网站，同时，用户标签中存在营销类别标签，则在该场景中主要进行营销类用户画像交互。若识别出该场景为在线视频观看场景，在网页上进行用户交互，可以针对用户行为兴趣爱好标签进行画像交互。如果该用户为积极型用户，则可以尝试主动弹窗询问用户，某个标签是否推荐正确。
36.步骤1010，用户对自我画像标签进行交互修正。
37.用户通过主动修改和被动调整两种方式影响修改个人画像。系统主动进行用户画像交互，根据一般用户画像给出确定性用户标签，通过弹窗确认或者信息栏展示方式呈现。用户根据个人兴趣爱好和基本信息，主动选择适合自身形象的画像标签。对于积极型用户，提供对标签内容进行修正和重选的权利，用户按照自己对自身兴趣和形象的判断，修改标签内容。系统被动进行用户画像交互，根据用户新增的行为数据，持续进行用户画像更新，获得数据分析用户画像，后台对用户画像进行更改，修改过程用户无法影响控制。例如：系统给用户展示画像中，存在“潮流”标签，用户可以对该标签进行修改。比如，将“潮流”标签修改为“滑板”这样更详细更深入的标签。被动交互方式不会征询用户同意和指示，系统不会受到用户修改的干扰，随着用户数据增加，计算新的用户画像。
38.步骤1011，针对用户修改后的画像，进行双重推荐置信度检验。
39.在用户修正画像之前，通过用户画像标签设计用户推荐算法，获得系统推荐算法。根据用户修正后的用户画像，增加用户修改标签的推荐权重，重新排列设计用户推荐算法，获得用户定义推荐算法。比较两种推荐算法，得出推荐算法差异点。针对存在差异的推荐方向，进行双重展示，同时展示两个算法推荐内容，统计用户接受度。如果用户对自定义的标签浏览量行为增加，接受度增加，则判定用户对标签修改合理，置信度提升。相反，如果用户对自定义标签的数据没有正向增加，则判定用户对标签进行了错误修改，置信度下降。例如：系统检测到用户修改“潮流”为“篮球”标签，则场景判定标签差异过大，推荐算法针对修改前后标签内容差异，设计两套推荐内容，在推荐过程中，同时展示两种标签内容。记录用户行为数据，并从数据中分析标签停留时间等行为数据，比较两种推荐算法带给用户行为的数据增量，如果用户对于新推荐的标签内容更加关注，则说明用户自定义修改画像置信度高。
40.步骤1012，根据用户交互行为重新定义用户画像接受类型。
41.收集用户画像交互过程中的行为数据，进行统计分析。若用户参与用户画像交互，进行用户画像选择和修改，同时置信度提升，则上调用户画像交互级别。若用户参与用户画像交互，进行用户画像的改进，画像置信度稳定，则保持正常画像交互。若用户修改选择画像标签，但是统计分析得出画像修改的置信度持续下降，下调用户画像接受度级别。若用户持续在提供的交互界面拒绝进行画像交互，下调用户画像接受度级别。用户面对用户画像交互行为存在差异，用户行为反应出用户对于画像交互的接受度。例如：在一个营销类场景中，用户在弹出画像交互页面选择“是否对美妆感兴趣”，若用户选择“是”并且用户推荐的置信度提升，则用户进行积极接受，多次判断积极之后，上调用户接受度级别。若用户在交互界面不进行标签选择，而是直接关闭弹窗，数量超过一定阈值之后，就会下调用户画像接受度，降低用户主动交互形式。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：基于Linux的虚拟串口通信方法、装置、系统及介质与流程

一种用户画像优化方法与流程

相关文献

最热文献