NBA 2019-20 赛季的真实正负值出炉,有哪些亮点?

好久没写回答了,今年的RPM对很多人来说槽点很多,而且事实上今年确实产生了一些特殊变化,我来简单讲一下。

首先,需要明确一下,很多人提到RPM的时候都会说“它的公式没有公开”,因而对其抱有很大的不信任。实际上RPM的核心算法是公开的,它是在英格尔曼多年前发明的RAPM的基础上发展而来的一种xRAPM数据,这是一项革命性数据,改变了最近十年all-in-one数据的发展方向。它的核心观念是不再关注球员在场上做了什么,比如得分篮板等事件,而是关注球员在场上对最终的比分产生了什么影响,再通过复杂的数学方法来消除噪音,减小误差。对这个算法有兴趣的可以到我的公众号”篮圈上的坐标系“找到详细的介绍文章。目前大家能看到的绝大多数正负值高阶数据都是基于RAPM通过不同方式发展而来的,包括BPM,PIPM,RAPTOR等等。

而RAPM本身存在一个重大缺陷,它对样本的需求量非常非常大,大到一个赛季1230场比赛的样本都不足够得到稳定的结果,因此很少有人在分析时直接采用单独年份的RAPM,使用RAPM时,许多专家都会采用5年,8年,甚至14年数据。而英格尔曼来到ESPN后,继续发展了RAPM,加入了其他辅助数据来帮助RAPM在更小的样本下得到稳定的结果,这个发展版本就是RPM。RPM没有对外公开的就是这部分辅助数据的用法。

当有些人以”RPM公式没公开“为理由拒绝RPM时,有两个事实是可以确认的,第一,这人对RPM毫无了解,第二,以RAPM所采用的数学工具来看,即便公开了,这个人也看不懂,因为它其实不是一个”公式“,而是一个几十万行的矩阵。

RPM的核心算法决定了三件事情:

1.四分之一赛季的小样本必然会有失真

ESPN数据专家Kevin Pelton多次表示,即便经过了各种调整,单个赛季的RPM依然会有不稳定的情况,他在文章时经常会采用多年RPM来进行论证,目前四分之一个赛季的RPM出现失真是非常正常的事情,往年都有类似的现象。每年第一版RPM和最终的RPM都有明显差异。比如去年的第一版RPM小加索尔+8的RPM,到赛季末就降到了3左右。

2.它以绝对的比分结果为导向,必然受随机事件影响

我们在看待RPM的时候往往把它看作一个球员对比赛的实际影响力,我们一般默认这种影响力自然是从实力出发带来的结果。但事实上,有一些结果是出于随机因素,也就是所谓的”篮球是圆的“。

这里最显著影响结果的因素就是三分和罚球的命中率。已经有大量数据证据证明,三分命中率的起伏绝大多数时候来自于球员的个人手感,而非防守影响。防守的强度,策略,最终对命中率产生的影响在球员手感起伏这个巨大噪音面前几乎可以忽略。因此球员在场时队友的三分手感会极大的影响球员的ORPM,在防守端,对手得三分命中率同样会有这样的影响。

这一版DRPM中的许多异常都可以用这个理由来解释:比如浓眉不在场时对手的三分命中率只有30%,这必然导致浓眉不在场时湖人的防守数据会超常,最终使得浓眉的DRPM不好。另一个案例是施罗德,他的DRPM高居控卫第四,事实是他在场时对手得三分命中率32%,不在场时却有40%,这显然是不正常的。罚球命中率作为一项不受防守干扰的数据,自然也会有类似的问题。目前RPM大幅度异常的球员往往都是受到中远投命中率随机起伏的影响。

实际上,目前已经有很多基于RAPM的正负值模型都加入了三分运气修正,比如PIPM,不知道ESPN为何迟迟不改。(不过RPM亲爹英格尔曼倒是说过,加入运气修正对减少误差没有显著帮助)

3.轮换方式死板的球队在其中受到的影响更大

RAPM的算法核心思路实际上是把每一组阵容和对阵看作是一个方程,而正负分则是方程的值,几十万组对阵组合构成了一个巨大的方程组,球员的贡献就是其中的未知数。大家上学的时候解方程或许遇到过一种情况,未知数太多,方程组太少,最终导致方程没有唯一解。

在RPM中同样存在这种情况,就是当一支球队的轮换如果非常死板,他们的阵容组合就会太少,最终引起多重共线。掘金就是一支这样的球队。

所以当大家发现巴顿的DRPM爆炸高的时候,就有可能是这种现象在小样本下的极端体现。

到这里,第一版RPM出现的“异常”情况,在我看来都“毫无新意”,每年都有,如果只是这样,我可能懒得回答这个问题,但今年其实存在特殊情况。

RPM的发明者英格尔曼今年从ESPN离职,加入了独行侠的管理层,RPM不再在他的亲爹掌控之下,有一些业内消息称ESPN重构了RPM的部分算法,这也是今年RPM比往年晚公布了将近一个月的原因。由于重构部分没有公开,我只能做一些推测,目前我确认了两件事情。

1.可替代球员水平大幅度提高了

可替代球员水平可以简单看作是饮水机水平,即低于该水准的球员不该出现在联盟里,当然实际上会因为各种原因,有很多低于该水平的球员在联盟里打球,一般模型中会定义可替代球员水平为“一支完全由这个水平球员组成的球队一个赛季能赢10场比赛”,关于这个概念的具体介绍也可以在我的公众号“篮圈上的坐标系”找到。

往年这个可替代球员水平的值是-3.12,即低于-3.12的球员不该上场了,上场就会带来极大的负面影响。今年,根据目前的少量数据推测,可替代球员水平已经提升到了-1.08到-1.14之间,具体数值还不能确定。

这不是RPM第一次做这个调整,13-14赛季和14-15赛季,这个数值是-2.54。因此,如果大家要对RPM做纵向比较,13-14和14-15为一组,15-16开始到18-19为一组,今年是全新的。

2.不同位置球员的攻防影响力差异被大幅度削减了

过去的RPM有一个显著特征,就是5个位置从1到5,ORPM的整体水平逐渐降低,DRPM的水平逐渐提升。

这是有一定合理性的,因为场上控卫往往掌握着大量分配球的权力,对进攻的发起起主导作用,除非约基奇这样的特例,每个队触球次数和传球次数最多的往往都不是中锋球员。

反过来在防守端由于中锋站位最靠近篮下,能参与的协防往往是最多的,防守端的影响力也会比其他位置更大。

但是今年的新版RPM,这一趋势被明显削弱。目前并不确定其中的具体原因,有数据专家推测可能是“身高”这一数据在全面重测后发生了改变,引起了这个结果,也有人觉得身高这一参数可能从RPM中被完全移除了。

来源:知乎 www.zhihu.com

作者:知乎用户(登录查看详情)

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载

此问题还有 7 个回答,查看全部。
延伸阅读:
NBA一个巨星对球队的影响能有多大?

为什么说今年的NBA冠军是最水的?