昨天晚间,上海男篮主场迎战辽宁。主队是本轮之前全CBA节奏最快(场均95.7个回合)的球队,客队虽然节奏仅位居联盟中游(场均89个回合),但是攻防质量都是顶尖梯队:百回合得分第三(111.3)、百回合失分第二少(98.3)、同时对手有效命中率联盟第二低(46.5%)。

  上面我们提到的这些数据,都来自于CBA官方网站。放十年前,从球迷到记者想要通过联赛官方渠道统一获取这些详尽且实时更新的基础与高阶数据,简直是天方夜谭。又或者说,这是早前一段年岁里中国许多职业体育联赛的普遍现象——基础数据统计和比赛数据归纳得依靠球迷和媒体人“自行发电”,计算与存储高阶数据的能力更是缺失。

  后来随着联赛发展。球队和赛事对于数据的认识与需求逐步提升,开始着手投入资源,但是又多少呈现出“零敲碎打”的面貌来。球队自己管自己的,也没有义务呈现给球迷。联赛与数据商的合作不是很稳定,也一直没有建设官方的数据库平台。CBA现在可以在官方网站上直接浏览与调取数据,而中超……中超甚至没有官网。

  非要说也不能怪足协,足协主办的足协杯、中冠联赛、女子和五人制赛事都有相关页面,但因为管办分离,所以开中超专区不是中国足协官网的职责……中超官方社交媒体时不时会发布一些数据内容,但这还是只能提供一些话题和热度,不是一个足够稳定的数据平台。球迷要想查阅一些更丰富更多样的中超数据,还是得借助各大足球网站,或者是数据商渠道。

  数据的统计、存储与呈现,标志着一个联赛的职业化程度,也赋予了它被进一步挖掘与诠释的“可能性”。对于从业者来说,数据是通过分析方法转化为技战术判断的素材;对于球迷和媒体,这是可以展开的谈资,是观察比赛、理解比赛的延伸;对于联赛,这不但是在“非比赛时间”保持曝光率和用户黏性的手段,同时也是历史积淀的体现。

  通过不同角度、不同限定条件挖掘出来的数据组合,能够丰富受众们对比赛和选手的认识。我们知道王哲林的回合占有率是27.2%,超过联盟同位置87%的球员,他的关键时刻得分(45分)高居联盟第二;但同时,他的总出场时间上海全队第一,线%)只位居同位置联盟中下游。辛苦、扛鼎、同时疲惫低效。

  刘礼嘉,出场时间很少,但回合占有率超过同位置75%的球员,并且真实命中率是CBA大前锋里前5%。另外,他在合理冲撞区内的出手数量不如王哲林,但篮下命中率(81.8%)达到了联盟最顶尖水准。同时助攻率1.3%几乎是联盟最低一档——几个数据统合起来,刘礼嘉一个嗅觉敏锐、篮下效率极高的无球终结者形象跃然纸上。

  青岛的王洪,全CBA包括外援在内“助攻率/回合占有率”排名第一的球员。一方面因为他助攻率很高,在场情况下队友接他助攻得分的比例超过43%;同时他的进攻欲望实在太低:回合占有率12.3%,只超过联盟里4%的球员。本赛季场均得分只有4.4分,却能用不到23分钟的出场时间贡献接近联盟前十的6.2次场均助攻。为什么?青岛小外援杰曼回合占有率50.4%(他在场时,全队超过一半的出手由他完成),全联盟第一。另外多说一句,王洪的助失比很漂亮。助攻数前15名里唯一一个场均失误不到两次的人。

  过分执着于数据当然也不见得是好事,可能会让你陷入某种“定语狂热”当中去。比如说新疆的黄荣奇是“CBA盖帽率最高的本土后卫球员”,但要是把这个限定要素稍加修改,加一个“出场时间超过400分钟”,那么榜首人物又会变成四川的景菡一。如果我们再把这个时间限定去掉,改成“30岁以上”,那么黄荣奇和景菡一又得乖乖离开榜单,方硕将成为如此环境之下的第一人……看着也很无聊,但这就是数据极度丰富后的蝴蝶效应。先有数据,然后总会有人去使用,当中有靠谱的,也有不那么靠谱的。

  数据这块,美国职业体育确实是先行者。Basketball-reference,著名的NBA数据网站【之一】,普通球迷到知名记者都会用。页面称不上很美观(个人评价),不过你可以在上面查到1951-52赛季,费城勇士的保罗·阿里金是NBA联盟场均博取罚球最多的球员(8.8次),不过当赛季罚球命中率第一是皇家罗切斯特的鲍比·温泽尔(90.4%)。每一场比赛、每一个回合、每一次投篮集合起来聚沙成塔,就构成了历史。

  “XX岁以上”、“XX分钟以上”、“比赛时间XXX以内”……这些定语我们都很眼熟。附着于NBA之上的各路篮球媒体都喜欢这么干,毕竟这是他们的工作,是媒体和联盟的热度、话题以及流量来源。被各种“限定款数据”轰炸久了难免令人有些厌倦,但CBA远没到数据挖掘过剩的程度,我们只是刚起步没多久而已。道阻且长,但很好的是,至少已经在路上。