4 通过分级模型降低过度收缩
可能总所周知,贝叶斯模型的一个缺点是过度收缩现象。在这种情况下,一些极端事件趋向于将整个观察值朝好的方面推进。在球赛结果预言的分级模型应用中,这一点尤其重要。例如可能一些球队的预测结果会非常好(夺取最后的冠军或前几名),然而其他球队的结果预测非常糟糕(为保级苦苦挣扎)。
第二节的模型假设所有的进攻和防守倾向由常规过程得出,特性由超参数刻画。显然,这可能不足以得到每只球队的不同特点,因此造成了过度收缩。并且带有以下两个效果:
a 对特别好的球队不利。 b 过高估计了实力很差的队伍。
避免此问题一种的可能方法是引入更复杂的参数结构,以允许三种不同的参数生成机制。一种是为了顶级球队,一种为了中等球队,另一种是垫底的球队。同样,根据Berger (1984), 收缩可以通过进攻和防守参数来限制,参数通过使用v=4自由度的nct分布(非中央t分布)来代替第二节中的正态分布来建造。
因此,可能性模型,和超参数home的事先规范是不变的。而其它超参数的建立如下:首先,我们定义每支球队t两个隐含变量(非观察的)和,取值分别为1,2,3根据进攻(防守)方面来鉴别差,中,优秀等级的表现。这些被给定的适当类型分布,依据先验概率向量。
我根据参数为(1,1,1)的狄利克雷分布(Dirichlet Distribution)为确定最小信息模型,但是显然人们会在向量上包含(可能是主观上)先验信息以描述先验机会,此机会即为每一只球队是三类中哪一类。
于是,进攻和防守效果对于每支球队t被表示为:
特别地,因为的值未知,于是上述公式本质上需要定义为进攻和防守的混合模式:
|