世界杯的单位是什么?
这个问题的答案和数学建模中的模型检验一样,取决于你所建模型的精度要求。 你可能无法分辨5米和4.99998米的差异,但10亿和9.99998亿的差值对你来说绝对是肉眼可见的。 因此对于人类感知精度的研究可以告诉我们单位的选择问题--当误差源是随机且不可观测时(比如你没法精确知道哪次踢球你的鞋带突然散了),对数正态分布是最接近实际情况的假设,这意味着绝对值大的数据更可能来自相对较小样本的量(因为对数函数在x>0的情况下严格递增)。 当误差源是可观测且有限(比如这次比赛你的球鞋完全正常的情形下),正态分布是一种合理的假设,此时整体上的单位选择没有差别。 但如果是可逆过程(诸如足球比赛中一队进球后另一队必定会在不久之后进一球)的情况呢? 这时候,如果我们对每个球队每次失误的概率做进一步分析的话可以发现,除了一些特殊情况(比如某队一直连丢球的机会都不给对方),各个球队每次失误的概率几乎总是落在[0,1]区间内,而且总是有至少一个球队的每次失误概率为0或者为1。这就说明,对数正态分布仍然是可能的。 我并没有发现关于此问题的精确验证方法,但这的确是我个人根据对数正态分布做出的一种合理估计。
以上是对数正态分布这种假设情况下的解释,但是真实的世界显然要复杂得多。在这种情况下,我们也许需要一种基于经验的方法来决定单位的选择。例如我们可以计算出每个队伍每场比赛每10万人次的失误次数作为经验数据,然后看看是否存在明显的规律(比如某个队伍总是比其他所有队伍的失误率低很多)从而帮助我们进行选择。