一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种足球获胜影响因素的挖掘方法与流程

2021-10-29 23:15:00 来源:中国专利 TAG:足球比赛 获胜 挖掘 因素 影响


1.本发明涉及足球比赛数据分析技术领域,具体而言涉及一种足球获胜影响因素的挖掘方法。


背景技术:

2.目前主要采用数理统计法、有序probit模型、泊松分布、系统论等,这些方法并不适用于分析复杂动态的足球数据的特点。目前,研究足球获胜的问题主要包括:(1)仅从足球运动员所需的单一技术出发进行研究,得出来的结论不够全面,忽略了研究足球获胜因素是一个系统论的问题;(2)在研究足球数据时,分析比较单一,忽视了这些数据之间的关系;(3) 在对足球获胜因素进行分类时,指标分类过于狭隘,虽然引进了代理变量,但是得出来的结论要么是纯理论的,并没有从实际出发,要么就直接从纯实践出发,忽视数据的科学性。
3.《基于关联规则的足球比赛数据分析》的文献中提出了一种基于关联规则的足球比赛数据分析方法,将关联规则应用在足球比赛数据分析上,但主要是对已确定的与球员运动数据相关联的几个因素采用关联规则应用处理,最终会根据支持度和置信度进一步提取出致胜因素,例如“在中超赛场上,若要赢得比赛胜利,需要保持均衡的控球率,提高传球成功率以及多尝试过人;同时为了避免输球,注意控制失误次数以及提高射门次数”。该文献并未考虑其他主观因素的影响,也没有结合球员的运动数据做整体战术风格分析,更加没有考虑到样本数据集的选择方式。


技术实现要素:

4.本发明针对现有技术中的不足,提供一种足球获胜影响因素的挖掘方法,从对数据进行简单的统计分析出发,在数据的基础上通过对足球获胜因素进行指标分类,并将此分析的结果用于建立关联规则模型以检验效果,并从数据分析的结果趋势检验模型建立的结果。
5.为实现上述目的,本发明采用以下技术方案:
6.一种足球获胜影响因素的挖掘方法,所述挖掘方法包括以下步骤:
7.s1,选择其中一个球队,对该球队在指定时间段内的足球比赛信息进行采集,以生成该球队对应的样本数据;所述足球比赛信息包括该球队的足球赛况、所有球员的包括传球在内的行为数据和与比赛相关的外部环境数据,根据足球比赛规则对足球比赛信息中的每个字段的含义进行分析;
8.s2,基于足球运动数据特点,构建足球运动影响因素数据集,该足球运动影响因素数据集中包含一定量的主观因素和一定量的客观因素,主观因素是指对比赛存在影响的球员自身行为动作的影响因素,客观因素是指对比赛存在影响的与球员行为动作无关的其他影响因素;
9.s3,根据足球赛况,对比赛双方实力进行评估,选择两者实力相差小于预设实力阈
值的胜场作为子样本数据;
10.s4,基于关联规则分析方法构建客观因素模型,该客观因素模型对子样本数据中与行为动作无关的因素进行分析,得出该球队对应的客观因素的影响力排序;
11.s5,构建动作因素模型,该动作因素模型以传球动作为基础,结合球员身份对与行为动作相关的部分子样本数据进行分析,得出该球队对应的主观因素的影响力排序。
12.可选地,步骤s1中,所述外部环境数据至少包括天气数据、场地、教练、比赛阶段、赛程和主客场。
13.可选地,步骤s2中,主观因素至少包括团队间的配合方式因素、紧密度因素和战术因素。
14.可选地,步骤s3中,选择待分析球队与其他任意一个球队的胜负比,筛选得到胜负比与 1的差值绝对值小于预设差值阈值的球队集合,选取待分析球队与球队集合中所有球队的胜场比赛数据作为子样本数据。
15.可选地,传球的行为数据包括传球时间、起始坐标、动作发出者和球的接收者。
16.可选地,步骤s5中,构建动作因素模型,该动作因素模型以传球动作为基础,结合球员身份对与行为动作相关的部分子样本数据进行分析,得出该球队对应的主观因素的影响力排序的过程包括以下步骤:
17.s51,引入了距离变量来替换双方队员的移动坐标,根据距离变量对传球动作进行分类;
18.s52,将球员之间传球的次数进行网络分析;
19.s53,将传球数最多的球员,随机选择一个球员样本,对与其配合次数最多的3名队员进行行为的研究;
20.s54,将这个球员与其配合次数最多的3名球员分别按照树状图罗列,将不同球员标识出不同的颜色;
21.s55,对树状图进行分析,获取树状图中所有的小团体;其中,如果树状图的起点与终点都是同一个球员,则构成一个分支,分支包含的所有球员形成了球队中的其中一个小团体;
22.s56,根据得到的小团体数据和对应的传球动作类型,分析得到团队配合方式、团队紧密度和采用的战术。
23.可选地,步骤s55中,如果配合次数位于第二与第三的球员与其他分支的球员存在重复,则以能够形成闭合团队的分支为优先,其次为配合次数为第二的分支、配合次数为第三的分支,删除其他无意义的分支。
24.可选地,所述挖掘方法还包括以下步骤:
25.s6,提取排序较高的数个客观因素和主观因素;
26.s7,采用指定时间段内的其他队伍的胜场数据对提取的客观因素和主观因素进行评估验证。
27.本发明的有益效果是:
28.本发明从实践角度,通过查阅文献资料获得足球获胜因素,再根据数据,对因素进行解读并划分为主观因素与行为因素,然后根据划分的特点从纵向和横向两个方面去处理数据,最后建立关联规则模型,数据处理的结果既提供了建立模型的字段,又预测了关联规
则模型所产生的大概关联趋势。将简单统计方法与数据挖掘放在同一个平面上进行使用。本发明为未来足球训练提供更科学的知识,也为未来运用科学技术分析足球数据提供了思路。
附图说明
29.图1为双方得分对比的折线图;
30.图2为huskies获胜的比赛中担任主客场的次数的直方图;
31.图3为huskies队获胜的比赛中所聘用的不同教练的次数的直方图;
32.图4为huskies队获胜的比赛中与不同对手对战的次数的直方图;
33.图5为传球队员之间的配合次数网络图;
34.图6为huskies_d1与其配合球员次数的直方图;
35.图7为huskies_g1配合队员次数的直方图;
36.图8为huskies_f1传球配合球员次数的直方图;
37.图9为huskies_m4传球配合球员次数的直方图;
38.图10为huskies_f6传球配合队员次数的直方图;
39.图11为huskies_d8配合传球队员次数的直方图;
40.图12为huskies_m1传球配合队员次数的直方图;
41.图13为huskies_f2传球配合队员次数的直方图;
42.图14为huskies_m6传球配合队员次数的直方图;
43.图15为huskies_d5传球配合队员次数的直方图;
44.图16为huskies_d3传球配合队员次数的直方图;
45.图17为huskies队中球员huskies_d1与其他队员的传球;
46.图18为客观因素模型设计;
47.图19为关联规则模型结果;
48.图20为2018年英格兰超级联赛的统计分析结果图;
49.图21为2019年英格兰超级联赛的统计分析结果图;
50.图22为2020年英格兰超级联赛的统计分析结果图;
51.图23为本发明实施例的足球获胜影响因素的挖掘方法流程图。
具体实施方式
52.现在结合附图对本发明作进一步详细的说明。
53.需要注意的是,发明中所引用的如“上”、“下”、“左”、“右”、“前”、“后”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
54.图23是本发明实施例足球获胜影响因素的挖掘方法流程图。参见图23,该挖掘方法包括以下步骤:
55.s1,选择其中一个球队,对该球队在指定时间段内的足球比赛信息进行采集,以生成该球队对应的样本数据;所述足球比赛信息包括该球队的足球赛况、所有球员的包括传球在内的行为数据和与比赛相关的外部环境数据,根据足球比赛规则对足球比赛信息中的
每个字段的含义进行分析。
56.数据的采集包括对某一球队的足球赛况、整个赛季所有球员的行为数据(包括坐标、距离、位置),尤其是整个赛季球员传球行为数据,并根据足球比赛规则分析每个字段的含义,使用合适的统计图进行显示,并做适当解释。
57.理论上本发明可以采集任何一个待分析球队的真实比赛数据,甚至模拟场景下的球队比赛数据,本实施例的方法步骤并不会因为选取的样本数据发生改变,只可能因为选取的样本书或者待分析球队调整主观因素和客观因素的具体类型。
58.例如,本实施例选取2010年美国大学生数学建模比赛d题的数据,共3个文件:matches, fullevents,psaaingevents。第一个matches文件的数据主要是关于整个赛程中每一场比赛的结果以及相关的一些数据。整个赛程中一共包含38场比赛,与同一个对手队比赛两次。其中包含的字段有matchid(每场比赛的序号)、opponentid(对手队的名字)、outcome(比赛结果)、 ownscore(huskies队在本场比赛中获得的分数)、opponentscore(对手队在本场比赛中获得的分数)、side(huskies队的主客场安排)、coachid(在本场比赛中huskies队的教练)。第二个fullevents文件中记录的是所有场次比赛中各个运动员的行动的信息,比如传球等动作。其中的字段有matchid、teamid(当前运动员所在的队名)、originplayerid(动作发出者及位置)、destinationplayerid(动作接收者及位置)、matchperiod(比赛阶段,分为上半场和下半场)、eventtime(动作时间,以秒为单位)、eventtype(动作发出的名称)、eventsubtype (动作发出的结果)、eventorigin_x(动作开始的地点x坐标,范围为[0,100])、eventorigin_y (动作开始的地点y坐标,范围为[0,100])、eventdestination_x(动作结束的地点x坐标,范围为[0,100])、eventdestination_y(动作结束的地点y坐标,范围为[0,100])。第三个 passingevents文件记录的是整场比赛传球的数据。传球是整体战术配合的基础,是组织进攻、变换战术、迅速逼近对方球门、创造射门机会的主要战术方法。传球的水平代表一个运动员和一个队整体能力的高低,而传球成功率往往决定着比赛的胜负。字段与fullevents中的字段一样。但是在处理数据的时候要结合动作发出者的位置(前锋、后卫等)以及距离来分析。
[0059]
s2,基于足球运动数据特点,构建足球运动影响因素数据集,该足球运动影响因素数据集中包含一定量的主观因素和一定量的客观因素,主观因素是指对比赛存在影响的球员自身行为动作的影响因素,客观因素是指对比赛存在影响的与球员行为动作无关的其他影响因素。
[0060]
基于足球运动数据的特点设计了足球运动表现的影响因素分类指标,并根据数据的特点设计了对足球复杂动态数据的处理方式,先进行了纵向处理,获得数据的子样本,再对子样本进行横向处理。具体的,首先基于足球运动数据特点整理得到该球队可能涉及到的足球运动影响因素的分类指标:从运动员的角度,将影响因素分为主观因素和客观因素。主观因素是指运动员自身的因素对比赛的影响,比如心理状况、身体状况、技术水平。这里的主观因素也可成为行为因素。客观因素是指除运动员自身情况的以外的因素,比如教练的战略安排、教练、天气状况等。在此基础上,再提出对足球复杂动态数据处理方式:纵向处理和横向处理。纵向处理是指数据是以某一球队为主要研究对象,沿着这一球队的一方向,从题目出发,纵向处理数据,找出所有关于这一球队获胜的所有表格的信息,并进行处理分析,得到子样本。横向处理是指对子样本数据进行处理、比较分析。
[0061]
s3,根据足球赛况,对比赛双方实力进行评估,选择两者实力相差小于预设实力阈值的胜场作为子样本数据。事实上,步骤s3是对数据的纵向处理过程。包括:
[0062]
s31,通过图形功能的折线图节点绘制双方得分情况对比,获得比赛双方实力对比,如图 1。通过对比huskies队与对手队最后的得分,来判断双方实力,灰色线条代表huskies队,黑色线条代表同场比赛huskies队的对手队。在38场比赛中,唯一不变的要素是huskies队,因此,此次的研究对象为huskies队,从高低起伏可以看出huskies队的实力低于大部分球队,胜出的概率比较低。所有比赛在保证客观的情况下,即主客场的担任次数相同的情况下,忽略表格中未出现的因素,huskies队都会尽量选择对自己有利的情况,所以在双方实力悬殊非常大的情况下(文中通过对比比赛的得分判断双方的实力),对最后结果影响最大的就是队员自身的情况以及队员之间的默契程度。
[0063]
s32,从对数据的简单分析过程中,在表格matches的比赛数据中,发现主客场因素以及教练因素都是huskies队,因此在huskies队的比赛情况的数据信息更全面,数据趋向于对 huskies队的比赛情况进行分析。
[0064]
s33,对matches中huskies队的客观因素进行关联规则分析,分析结果如表1。比赛结果为win的影响因素最全面,而比赛结果为tie、loss所获得的影响因素并不全面,即获得结果为loss与tie的限制条件并不是必然的,而有研究价值的就是结果为win的比赛情况,因此选择huskies队获胜的比赛情况进一步分析。表1是huskies队的比赛情况的关联规则分析结果表。
[0065]
表1 huskies队的比赛情况的关联规则分析
[0066][0067]
s34,对结果字段进行【设为标志】处理,转化为布尔类型的值,再通过对记录的【选择】筛选出结果为win的比赛信息。胜出的比赛分别为1、6、11、14、15、17、18、25、27、30、 31、
35、36。表2是huskies队获胜的信息表。
[0068]
表2 huskies队获胜的信息
[0069][0070]
s35,在这些胜出的比赛中,从图2至图3中可以发现huskies队为主场并且教练为coach3 的次数较多,说明主客场与教练对huskies队获胜产生了一定的影响。但是,这两个因素能不能构成影响足球获胜的因素之一,需要将这两个因素作为关联规则模型中的两个变量进一步进行研究。从图4中看出,在胜出的比赛中,huskies队赢了两次的对手分别是1、15、17,因为不考虑球员的心理素质等因素,所以综合对比,oppponent1、opponent15、opponent17与他们实力相差过大,分析价值不大。
[0071]
s36,将huskies队与opponent1、opponent15、opponent17比赛的进行通过【选择】节点进一步筛选过滤。从表中可以发现,这几场获胜的比赛中,huskies队全部为主场且教练还是 coach3指导的次数多。
[0072]
通过对第一个matches文件的分析,可得到主客场以及教练两个因素,并且得到了深入研究的方向为matchid为6、11、14、18、25、27、30。matchid是三个表格的共同字段,而这筛选出的几场比赛是进行其他影响获胜因素的重点研究比赛。表3是huskies队胜出的比赛中未与opponent1、opponent15、opponent17的比赛信息表。
[0073]
表3 huskies队胜出的比赛中未与opponent1、opponent15、opponent17的比赛信息
[0074][0075]
s37,huskies队获胜比赛中场上huskies队员的数据处理
[0076]
通过对宏观数据进行纵向处理后得到了huskies队值得分析的几场比赛:6、11、14、18、 25、27、30。再根据给出的第二个表格数据进行深入研究每名队员在赛场上的动作。
huskies队极有获胜,间接说明huskies队与opponent15队的实力相差悬殊。
[0108]“opponentid_opponent17

outcome_win”:当huskies队的对手为opponent17时, huskies队极有可能获胜。
[0109]“opponentid_opponent15,coach3

outcome_win”:当huskies队的对手为opponent15 且教练为coach3时,huskies队很有可能获胜,说明足球获胜因素有对手的实力,这属于不可控因素,只有提高自身实力才是通往胜利的正确之路。
[0110]“opponentid_17,coach3

outcome_win”:当huskies队的对手为opponent17且教练为 coach3时,huskies队获胜的可能性极大。
[0111]
教练这一角色是为了在上场时提供一定的策略,是整个团队的主脑,教练还要了解每个队员的踢球特点,然后根据其特点安排不同的位置,还要时刻觉察不同队员的状态,在适当地时候要给予合理的安排。因此教练也是足球获胜的因素之一。而有时候就算教练再优秀,如果球员自身实力不足,也是无济于事的,因此这些因素都是相辅相成,相互配合的,合理的搭配会带来成功,不适当地搭配会失败。
[0112]“coachid_coach2,side_home

outcome_win”:当huskies队的教练为coach2并且 huskies为主场时,获胜的可能性会很大。
[0113]
以上的因素都是一些外部因素,而有时候这些因素也是促成获胜的必不可少的因素之一。
[0114]
(二)动作因素结果分析
[0115]
最后通过调整了置信度阈值和支持度阈值得到了有关eventsubtype、eventtype以及l 的前项,虽然置信度与支持度都不高,但是说明这些因素还是对最后结果输赢产生了一定的影响。表4是部分关联规则表。
[0116]
表4 部分关联规则
[0117]
[0118][0119]
(三)结论
[0120]
(a)在数据分析阶段运用的简单统计方法得出huskies队是一个防守能力很强的队伍,并且远射门、短传跟中传能力很强的队伍,从huskies胜出的比赛进行分析得出来的。猜想,是不是所有获胜的足球队伍都有此类特征,于是查阅了2018、2019、2020的英格兰超级联赛的统计网站数据,发现了如下的结果:防守能力最强的队伍也是获胜最多的队伍,验证了之前数据分析的方向是对的,并且结论有待更科学的验证。具体统计分析结果参见图20至图 22。
[0121]
(b)在数据处理阶段中运用的简单统计方法中,除了得出了与关联规则分析结果的趋势,还得出了一些额外的结论。比如,传球过程中,会形成闭合小团体进行配合传球,多以2人为主。说明团队间的配合紧密程度因素以及战术因素的重要性。
[0122]
(c)由关联规则分析可得:在球员自身实力很强的前提下,一般在比赛的前7~8场,球员的体力比较充沛,根据当时的天气状况、场地以及当时的具体情况实行,使用中传比较合适,间接反映球员间的配合很紧密,策略运用得很好,即在加上有丰富经验以及比较优秀教练的指导下,提高了足球获胜的几率。
[0123]
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜