1.本发明涉及信息技术领域,特别地,涉及一种基于决策树的博物馆游客感兴趣点预测方法。
背景技术:
2.随着旅游行业的发展,博物馆作为游客热门选择的地点成为文化产业不可或缺的一部分。然而传统博物馆的展览手段,展览形式都收到技术、人力等因素的限制。无法充分满足游客日益个性化的游览需求,为游客带来更好的游览体验。这将使得博物馆的文化传播和民族教育的机构功能收到了限制。在传统博物馆展览服务中,游客往往只能被动地接受普遍性的展览服务,无法根据个人的兴趣及要求自发地开展博物馆的游览学习。这种被动地游览形式使得游客对于展品文物内涵体会甚微,也无法收获个性化的视听体验。
技术实现要素:
3.有鉴于此,本发明目的是提供一种基于决策树的博物馆游客感兴趣点预测方法,能够较好地了解游客的实际需求。
4.为了实现上述目的,本发明的技术方案是:
5.一种基于决策树的博物馆游客感兴趣点预测方法,包括:
6.建立决策树模型;
7.采集游客的基本信息;
8.将游客的基本信息输入到所述决策树模型中,所述决策树模型输出对游客的兴趣点的预测数据。
9.优选地,所述决策树模型至少包括预测感兴趣部分模型、预测感兴趣服务种类模型、预测感兴趣文物种类模型、预测感兴趣朝代模型、预测感兴趣展览方式模型和预测感兴趣活动模型中的一种或多种。
10.优选地,所述建立决策树模型的步骤包括:
11.依次设置根节点、若干内部节点和叶节点;
12.根据各个模型的特点,将性别、年龄、家乡、职业、文化程度、专业与所述根节点、若干内部节点分别关联;
13.依次设置根节点、若干内部节点的分支条件。
14.优选地,所述决策树模型采用sklearn库中的分类决策树。
15.优选地,还包括:
16.在应用决策树模型之前,先评估游客的基本信息与预测数据的相关程度。
17.优选地,采用皮尔逊相关系数对所述相关程度进行评估。
18.优选地,还包括对所述决策树模型进行训练:
19.收集n份游客基本信息及兴趣点数据;
20.将采集的数据分成训练集和验证集,训练集用于训练分类决策树模型,而验证集
用于检测模型性能优劣。
21.优选地,采集游客的基本信息的方法包括:
22.使用语音导览设备或通过wifi热点获得游客的各种信息。
23.本发明技术效果主要体现在以下方面:
24.1、为博物馆游客感兴趣点预测模型提供了良好的数据规范整理方案;
25.2、通过模型的应用提供个性化的讲解和游览服务;
26.3、较准确直观地获取游客对于博物馆的兴趣点;
27.4、为博物馆后续的增值业务推进提供数据及理论依据。
附图说明
28.图1为实施例中预测方法的流程图;
29.图2为实施例中决策树模型的步骤的流程图。
具体实施方式
30.以下结合附图,对本发明的具体实施方式作进一步详述,以使本发明技术方案更易于理解和掌握。
31.本实施例提供了一种基于决策树的博物馆游客感兴趣点预测方法,该方法包括:
32.s10、建立决策树模型;
33.在本实施例中,决策树模型采用sklearn库中的分类决策树。
34.决策树模型至少包括预测感兴趣部分模型、预测感兴趣服务种类模型、预测感兴趣文物种类模型、预测感兴趣朝代模型、预测感兴趣展览方式模型和预测感兴趣活动模型中的一种或多种。其中,
35.感兴趣部分指的是大唐遗宝展(何家村出土文物)、第一展厅(史前、周、秦)、第三展厅(唐、唐以后)和第二展厅(汉、魏晋南北朝)。
36.感兴趣服务种类指的是商品、基础设施、展品、新技术手段和服务。
37.感兴趣文物种类指的是木器、木器
┋
竹器、木器
┋
纺织品、木器
┋
银器、漆器
┋
珐琅器、漆器
┋
纺织品、玉器、玉器
┋
木器、玉器
┋
漆器、玉器
┋
玻璃器、玉器
┋
珐琅器、玉器
┋
瓷器、玉器
┋
竹器、玉器
┋
纸类文物、玉器
┋
纺织品、玉器
┋
金器、玉器
┋
铁器、玉器
┋
铜器、玉器
┋
银器、玉器
┋
陶器、玉器
┋
骨器、玻璃器
┋
珐琅器、玻璃器
┋
陶器、珐琅器、珐琅器
┋
纸类文物、珐琅器
┋
纺织品、珐琅器
┋
陶器、瓷器、瓷器
┋
漆器、瓷器
┋
玻璃器、瓷器
┋
珐琅器、瓷器
┋
纸类文物、瓷器
┋
纺织品、瓷器
┋
陶器、石器、石器
┋
木器、石器
┋
玉器、石器
┋
玻璃器、石器
┋
珐琅器、石器
┋
瓷器、石器
┋
纸类文物、石器
┋
金器、石器
┋
铜器、石器
┋
陶器、石器
┋
骨器、竹器、竹器
┋
瓷器、竹器
┋
金器、纸类文物、纸类文物
┋
陶器、纺织品、纺织品
┋
纸类文物、纺织品
┋
陶器、金器、金器
┋
漆器、金器
┋
玻璃器、金器
┋
珐琅器、金器
┋
瓷器、金器
┋
纸类文物、金器
┋
纺织品、金器
┋
银器、铁器、铁器
┋
漆器、铁器
┋
纺织品、铁器
┋
金器、铅锌器、铜器、铜器
┋
漆器、铜器
┋
珐琅器、铜器
┋
瓷器、铜器
┋
纸类文物、铜器
┋
金器、铜器
┋
铁器、铜器
┋
银器、铜器
┋
陶器、银器
┋
珐琅器、银器
┋
陶器、陶器、骨器、骨器
┋
木器、骨器
┋
瓷器、骨器
┋
竹器、骨器
┋
铜器。
38.感兴趣朝代指的是史前时期、周、唐、唐以后、汉、秦、魏晋南北朝。
39.感兴趣展览方式指的是人工讲解和讲解器讲解、多媒体手段(视频、图片等)、文字
展板、文物展品、新技术手段(3d建模、vr等)。
40.感兴趣活动指的是临时展览、互动活动(手工作坊、教学工坊)、演出、讲座、座谈会、辩论会。
41.在应用决策树模型之前,先评估游客的基本信息与预测数据的相关程度。具体是采用皮尔逊相关系数对相关程度进行评估。其中,游客的基本信息包括性别、年龄、家乡、职业、文化程度、专业。通过皮尔逊相关系数公式,计算游客各项兴趣点选择与性别、年龄、家乡、职业、文化程度、专业的相关系数矩阵,得到各指标间的相关性。该相关性指标可以作为输入特征属性的挑选评估指标,对相关性较高的属性作为决策树模型的输入。而相关性较低的选项特征,考虑到可能因为数据量不足而出现过拟合现象,不予采纳作为输入选项特征。还可以观察输入特征属性之间的相关性,若两个选项特征属性的相关性较大,则认为两个特征属性是强相关属性,只选取一个特征选项属性作为输入特征。
42.另外,建立决策树模型的步骤包括:
43.s11、依次设置根节点、若干内部节点和叶节点;
44.s12、根据各个模型的特点,将性别、年龄、家乡、职业、文化程度、专业与根节点、若干内部节点和叶节点分别关联;
45.对于各个不同类型的决策树模型,以上的几种基本信息,其在决策树模型中的位置略有不同,一般来说,根节点均与性别关联,剩下的若干内部节点(本实施例中数量为5个)则根据决策树模型的类型,将年龄、家乡、职业、文化程度、专业按照不同的顺序进行排列后分别关联。
46.s13、依次设置根节点、若干内部节点的分支条件。
47.s20、采集游客的基本信息;
48.其中,采集游客的基本信息的方法包括:使用语音导览设备或通过wifi热点获得游客的各种信息。语音导览设备通过智能语音的方式引导游客以说话的方式录入基本信息,wifi热点则是在游客使用微信扫描热点链接的二维码后,授权热点程序通过微信获取或者提供填写页面来获取游客的基本信息。
49.s30、将游客的基本信息输入到决策树模型中,决策树模型输出对游客的兴趣点的预测数据。
50.另外,为了提高准确率,本实施例还对决策树模型进行训练,具体包括:
51.s31、收集n份游客基本信息及兴趣点数据;
52.s32、将采集的数据分成训练集和验证集,训练集用于训练分类决策树模型,而验证集用于检测模型性能优劣。若训练集得出的结果与验证集中的一致,则表示正确,否则为错误。因此,所有验证集中分类正确的比例则为准确率。
53.当然,以上只是本发明的典型实例,除此之外,本发明还可以有其它多种具体实施方式,凡采用等同替换或等效变换形成的技术方案,均落在本发明要求保护的范围之内。
再多了解一些
本文用于企业家、创业者技术爱好者查询,结果仅供参考。