首页 >> 数学 >> 计算机科学 >> 文章

阿马罗在论文中列出了2008年欧洲杯三场比赛的球员评分示意图。

文/金煜

和篮球、棒球等相比,进球少的足球向来以难以量化出名,主观因素即让球场上变得风云莫测,但又同时给预测和评选等相应措施带来很大的不便。不过,且慢,谁说足球不能量化的?

美国学者阿马罗(Luis Amaral)不仅看球、踢球,还将自己的数学能力运用到足球中去,利用数学模型设计出一种“量化最佳球员”的计算方式。其结果基本符合欧洲杯的评价结果,现在世界杯正热火举行中时,他的“最佳球员”模式也正一路测试过来。

统计难度
集体运动更难量化

足球是世界上最流行的运动,但也是最难量化的运动。足球球场变化复杂,球的运动轨迹无从预测。相比之下,为得分较多的篮球和棒球比赛做数据统计就容易多了,你甚至可以计算出每个球员对整场球赛的贡献是多少。但是,足球更多是一门集体活动,每一粒进球都是集体合作的结果。12个人的合作到底是如何导致更好的进球表现的,这在数学上的解释依然相当之少。而对于全体队员来说,个人的表现到底该如何评判也很模糊。

“要量化足球是很困难的,很多表现只能凭借主观来评判。”前国安队总经理、北体大成教学院院长马冰说,“队员状态如何,传球、进攻、防守表现如何,都得靠人为判断。一般评选最佳球员都只能人为判断。”

不过,美国西北大学的化学生物工程教授,同时也是该校复杂系统中心成员的阿马罗和他一帮热爱足球的科学家朋友却不相信这点。“要测量一名球员的球场表现,必须‘隐藏’在球队中才能进行:不管是从对方球队得球,还是传球给队员,个体球员都可能对全队造成极大的影响。”他们在6月16日发表于开放在线期刊《PLoS》上的研究中写道。

阿马罗在接受本报记者电话采访时说,从小就看球的他一直以来都对足球有一个困惑:“看球的时候,总有喜欢的球队和球员,因此在做评价的时候不免会有偏好。我们就想怎么可以客观地评价足球队和队员。”

量化球员表现并非第一次。“这些排行榜的问题是,并未与公认的其他评价标准进行验证。”

这份研究名为《量化球赛中个体球员表现》,阿马罗与合作者们以2008年欧洲杯为对象,分别对所有球员的表现进行了量化,评选“最佳球员”。其结果与体育媒体、球队专家、教练、俱乐部经理等普遍认可的主观评价一致。

主要指标
传球是核心数据

和对篮球的研究不同,他们的量化指标并非立足于进球数。事实上,现在的足球比赛中也会统计一些基本数据,比如射门次数、任意球数、助攻数等,而阿马罗小组的研究则侧重于传球的次数。

阿马罗介绍说,研究者将一支球队视为一个计算机“网络”,球员之间的传球就是这个网络各节点之间的连接。当然,因为比赛的目标就是进球,因此,是否进球也成为被列入评价指数之一。“我们看球从最初开始运动到最后完成射门这一路的过程。”阿马罗说,“以射门结束的球的运动路线越多,球队表现就最佳;同时,以射门结束的球在某个队员中经过的越多,这名队员的表现也最佳。”

研究者们用数学模型绘制出了“网络”中各球员之间的球的流动,再加上射门的数据,形成最后的结果。模型只计算射门成功的传球,丢球、射失等都不计分,球每过一名球员(节点),这名球员就会得到1分。然后,数学模型会模拟运行几百万次,看网络中队员最后的平均得分是多少,高于平均值越多的球员,表现就越佳。

比如,在2008年欧洲杯德国对西班牙一战中,德国队后卫之间的“节点连接”非常多,但在中场和前锋之前却并不活跃;相反,西班牙队全场的连接都非常活跃。计算结果显示,西班牙队表现更佳,其最终以1比0胜德国。

数模的结果与欧洲杯的评价一致,西班牙得分最高,评分体系中得分最高的20名球员同样也是公认的欧洲杯前20名最佳球员。西班牙8号中场哈维在一场比赛中的得分最高,他的后卫队员拉莫斯则在所有比赛中的得分最高。“如果我们的测量方式不好的话,不可能结果和这么多专家的评估有如此惊人的一致。”他说。

阿马罗说,这个评分系统可以用在历史上的一些最佳球员的评价中,比如,足球历史上最著名的争论:真正的球王是谁,贝利,还是马拉多纳?

最新数据
梅西暂列最佳

这种计算方法是否会突出中场和前锋,而忽视以破坏对方进攻为主的后卫?阿马罗解释说,后卫可以降低对方球员的得分,此外,往往射门得分的连续传球都是从后卫开始的,后卫可以从对方脚下抢走球,发动新一轮的进攻,也可以通过很好的传球给中场和前锋创造机会。“你看我们对本届世界杯已进行的比赛的分析,得分高的常是后卫。”阿马罗说。

本届世界杯成为这个小组测试这个系统的最佳对象,它们对每场球赛都进行分析,并在实验室的主页上更新公布每场球赛,每个球队,每个球员的表现评估。到截稿前,阿根廷球员梅西得分最高。

那么,守门员怎么办?阿马罗表示,守门员是现在这个计算中唯一没法准确评估的球员,“守门员的角色跟别的球员都不一样。”

这个系统在欧洲杯的评估表现得很好,但以个人突破见长的南美球队是否会不适应这个系统?对此,阿马罗说,“巴西队也有很多传球,球队风格并不影响算法。并不是说这个系统更适合某支队伍。事实上,到目前为止,等级最高的是南美球队,韩国队也有很好的得分。”

即使如此,在现阶段,通过这个系统来预测谁最终会夺得大力神杯还有很多的不确定性。“世界杯到现在这个阶段,一个问题是,运气的成分还是很大。”他解释道,“比如西班牙和瑞士的比赛,西班牙踢得很好,有很多机会可以攻门,但都运气不好没攻入。美国队和英国的比赛也是这样。运气起到了很大的作用。”

“足球比赛就是这样,即使很努力,但还是不一定会赢,不确定性就是足球的最大魅力。”他说。不过,随着更多的比赛出现,好队好的表现会越来越出现好的结果,到淘汰赛的时候,可能就可以对表现优秀的球队做出预测了。

另类统计
如何让你的球队获胜?

希腊亚里士多德大学的研究者们也对世界杯的比赛进行了一系列统计研究。这些数据或许值得各队的主教练们好好研究。他们发现,下半场比上半场更容易进球。在 1998年和2002年世界杯中,大部分进球都是在下半场完成。2006年世界杯中,其差距减少,但下半场的进球依然以52.5%的比例居多。研究者分析说,比赛进行越长,进球也越多,他们猜测,原因可能与队员疲劳、缺水、注意力分散导致防守失误,以及战术策略有关。研究者还对欧洲杯的进球模式进行了分析,发现44%的进球都来自有组织进攻,35.6%来自定位球,20.3%来自防守反击,在进球前的运球方式中,长传占了最多,达34.1%。在定位球中,进球最多的是角球和任意球。
阿马罗等科学家的实验室主页

提供了相关比赛的数据统计结果。这是世界杯赛事发文前的球员TOP20。

0
为您推荐

48 Responses to “如果让科学家来选“国脚””

  1. Sheldon说道:

    梅洛排名好高啊!

  2. 火柴说道:

    这个算法有问题,阿根廷和西班牙都喜欢倒球,推进速度慢,但会进一些所谓的团队进球,就是传二三十脚得分的场面,那样队员得分自然就高。象德国队员靠跑位技术和稳定的传接技术,几次传递就能到门前,这样的球队得分就低。前二十一个德国球员也没有,说明算法取样太单一。

    • Zis76_2mm说道:

      完全赞同你的意见,应该在每次取样中加入时间因素的考虑,每次成功进球所需时间短者加分。
      德国战车隆隆向前!!!

    • 崔略商说道:

      呵呵,照他们这个算法,我估计最厉害的球队是90年代初的哥伦比亚队,球员是巴尔德拉马。他们好多传球都在一米以内。

    • 理科太次郎说道:

      我一直梦想建立一个合适的球队量化模型,掌握这种赌球利器就发大财啦$$^o^)/~
      量化足球的难点在于概率因素、球员水平、团队配合、球队战术四者的平衡
      本文重点在球员水平和团队配合上,但是单单以传球衡量球员和团队水平实在太狭隘,例如加图索、普约尔这样的防守球员还有范尼、维埃里这样的强力中锋,当然因扎吉这样的机会主义者让他多传球也不太现实,所以对于不同位置上的球员指标应该有相应的权重变化
      另一方面,既然是拿来“选”球员就必须考虑战术安排,斯内德、罗本在皇马不得志显然不是因为球员水平问题,所以只用传球一项数据来衡量很可能选错人或者漏选
      当然,数学家的笔头子永远也赶不上贝利的”上帝之嘴“,从这种意义上说,贝利是绝对的“球王”,拥有“上帝之手”的马拉多纳也只能甘拜下风了

  3. changst说道:

    关于进球,从发动进攻开始,到临门一脚,中间传递不超过5次的进球概率有没统计,恐怕要在除去定位球中占到8成以上

    基本上频繁倒脚阵地进攻是没啥效果的

  4. 综治维稳说道:

    踢足球不是一个人在战斗撒!

  5. timelau说道:

    赞同火柴说的,这个研究考虑的因素太少了。

  6. 叮当说道:

    我是很喜欢这样的基本统计方法,我感觉这样的统计适合于强队对弱队的比赛,甚至实力很接近球队之间的比赛。
    这个方法也有比较突出的弱点,正如这位科学家所说,“运气”。他既没有定义“运气”也没有说那些是什么和“运气”有关,使得他的整个数模丢分不少。
    有足球经验的人都知道,找出攻防平衡的某个“点”是很重要的。通常对胜负起作用的是那个“点”开始,场的控球传球统计。对于一个球队来说,攻和防是相反的函数状态,用到进攻的资源而不是整越多,给防守留下的余地越少。一个强队会自始至终保持很好的防守阵容,和相对较强的进攻阵容。所有比较好的欧洲强队似乎都有这个传统。
    南美虽然有一些最好的球队,但是这一点似乎没有欧洲的对手做得好。

    • 须臾含霈说道:

      貌似除了“强队对弱队的比赛”,就是“实力很接近球队之间的比赛”了吧。。。

  7. 安徽卫视记者方博说道:

    我个人有点小小的观点,请大家来拍砖。
    我认为,足球就是足球,运动就是运动。纯粹的身体的释放,是一种game。不应当对他科学化数字化理论化。足球是身体的对抗,是体能的比拼,是意志的考验,是运气的垂青。那什么都看的这么理性了就没意思了。四肢与头脑是分属于不同的系统的。

    反正 足球和F1不一样。随意的去玩弄它吧。

  8. 叮当说道:

    “场的控球传球统计。” 应该为“而不是全场的控球传球统计。”

  9. 冰锋说道:

    啊!把网络分析的方法用到这个地方了?!
    个人认为,射门不中的数据也要考虑进去,这样的网络数据比较完善。
    另外,对不同的网络做一下聚类,给出不同球队的特征,对于确定方法的适用范围应该有帮助。

  10. kenzhon说道:

    本届世界杯上暂时表现最为团队的德国没人入选,说明这样的统计还是有局限性的。

  11. 代餐粉说道:

    梅洛世界第三?没有西罗?

  12. 叶自若说道:

    哎,感觉好多文章科学是科学,普及可就不太普及了,像我这种白弱文科半吊子,看得云里雾里的。。。。

  13. wiems说道:

    这样的数学模型对于长传冲吊,防守反击的球队以及机会主义的前锋,或者像范尼这类的禁区杀手不公平。

  14. lifishake说道:

    德国没人入选,荷兰没人入选.
    换句话说,入选的除了西班牙都回家了.
    所以...

  15. 筋斗云说道:

    足协将来也来个API,每场球每个球员的各种数据自动产生,自然全球都会来搞模型了。

  16. 盘树说道:

    这东西,干嘛用来分析足球?分析篮球更可靠点。德国队曾经的89米助攻怎么算?足球这事,实力很重要,运气也很重要。

  17. 冷蟹说道:

    似乎这个算法考虑太多的个人能力,忽略了团队因素。不管是球队还是单个球员都不是质点,所以这样单纯数学计算欠妥。正如lifeshake所言。。。。。。

  18. 崔略商说道:

    以前的CM,现在的FM,足球经理游戏,分析现实球员的能力很厉害。

  19. 沐湍泽说道:

    兰帕德也不简单啊~~可惜厄齐尔太年轻了,要不绝对得上去了~~

  20. 紫砂壶说道:

    呃……这个不知道有没有实用意义

  21. 丹尼斯说道:

    我对这个模型不完全赞同,比如老马年轻时,经常可以一个人带球过掉几个后卫,这样完成一次进攻并以进球结束,过程中不会有太多传球,可是老马的个人能力对比赛的影响是决定性的。

  22. kk说道:

    科学家分析着玩呗
    没看着各大门户网站还有一群SB在分析双色球呢。。

  23. Bray说道:

    梅西啊……

  24. Nova说道:

    作者至少应该把原始论文的名字给出来吧,你给个中文名字让我们怎么去找?

  25. zzzuz说道:

    这就是不踢球的书呆子科学家写的足球科学,窝烤。。。

  26. zzzuz说道:

    LS有人说了对,FM对于一些足球妖人的数据还是比较靠谱的。。。

  27. 说道:

    比如,在2008年欧洲杯德国对西班牙一战中,德国队后卫之间的“节点连接”非常多,但在中场和前锋之前却并不活跃……

    55555

  28. Tompkins说道:

    以后赌球就方便多了

  29. 游识猷说道:

    梅西最高!hooray~~~~~

  30. 再见阿南说道:

    决定比赛结果的因素的确很多,但是当我们给到两个前提的时候:一,针对某场比赛;二,实力悬殊不够大(例:不是西班牙和中国).其实最大的决定因素是心理,如果一个球队坚信采用针对性的战术可以战胜对手,就会有很好的表现,当然如果意外失球导致丧失了这种判断,那么崩盘也是正常的结果。顺便强烈支持西班牙,即使他决赛被荷兰击败,那也能预料到是在全场压迫对手的情况下被偷袭所致,并非打得不好。也不是说西班牙的战术和打法就是超越所有其他国家,而是他们在这样的风格之下坚持了十年以上,并将之发挥到极致,而巴西变得保守了,德国还正在重新成长,荷兰已经忘记了全攻全守,意大利没有了坚固的防守和灵光一击的天才,所以结果就是西班牙的独领风骚,不论结果如何,西班牙是在坚持进攻这样一个更高风险的战术上去战斗,理应比其他对手更该捧杯,当然也希望看到之后的百花齐放。

  31. cooleyes说道:

    西班牙还真的拿了冠军!
    看完决赛,觉得好郁闷,两队都没有射手啊!荷兰人只会犯规,西班牙人只会倒脚……

  32. Power说道:

    如果依据实际比赛的数据进行评估,想不通,模型怎么运行几百万次。

  33. Power说道:

    http://www.plosone.org/article/info:doi/10.1371/journal.pone.0010937
    “Quantifying the Performance of Individual Players in a Team Activity"

  34. 453720900说道:

    貌似球场上就11个人。。。哪来的12人合作。。。。。。。

  35. wang_dewen说道:

    假设:不踢假球!
    条件:能《量化》的还是足球?能《量化》的话,从此不看足球!
    结论:这辈子就看足球了

  36. yningc说道:

    梅洛本来就很强的,就是被妖化了~

  37. 胡丹青说道:

    和大部分楼上的结论正好相反,如果真有所谓可靠的模型,那么
    1)足球以后不会被拿来赌了,赌博的本质是建立在随机性上的,而庄家和赌客对随机性的“看法”不一(术语叫做attitudes towards risk)使得赌博市场得以存在。如果没有了随机性,或者大家对风险的偏好一致,那么赌市不会有,保险市场也将塌缩。上述二必要条件缺一不可。
    2)FIFA不会坐以待毙,绝对会改规则,改的思路就是增大随机性,beat the model。不然足球就死了,不要比了。FIFA和NBA性质一样,都是做市场的,而市场最希望的比赛就是有球队跳出来beat the odds。

  38. acrode说道:

    Cargo cult science,个人观点

  39. 一路向北说道:

    量化是在考验数学模型 结果仅供参考

  40. ZKL47说道:

    邓华德教练是《姚之队》用数据分析挑选出来的。洛杉矶奥运会之前都是亏损的,照习惯思维选一个市长做主席,而美奥委会用数据选出非官方人选,进入奥运赚钱的拐点。
    任何学科用到数学,才能达到完美程度。

Leave a Reply