OpenSci-CN/AutoTransfer

多版本润色+整合

ray306 opened this issue · 0 comments

ray306 commented

<段落_1>
<原始版>
过去一个世纪中,统计学的发展见证了旨在允许从数据中进行推断的方法的蓬勃发展。这些方法在其哲学基础、它们应该解决的问题以及它们在实践中的使用频率方面存在广泛的差异。一个受欢迎且广泛推广的方法类别是区间估计。对区间估计存在各种不同的方法,其哲学基础和计算方式各异,但总体上都被认为是对参数的估计,通过给出参数的一系列值而不是单一值来考虑测量或抽样不确定性。
</原始版>
<版本1>
在过去的一个世纪里,统计学领域的进步促成了众多旨在从数据中抽取推论的方法论的繁荣发展。这些方法论在哲学基础、解决问题的方式以及实际应用的频率等方面,呈现出显著的多样性。其中,区间估计方法便广受欢迎,并被普遍采用。关于区间估计,其方法众多,它们在哲学根基和计算手段上各有差异,但共同点在于它们都旨在估计参数值,通过提供一系列可能的值而非单一值来反映测量或抽样的不确定性。
</版本1>
<版本2>
过去的一个世纪见证了统计学方法的迅猛发展,这些方法旨在从数据中提取推断。它们在哲学基础、应对问题的方式及实际应用频率上有着显著差异。其中,区间估计方法因其广泛应用而颇受青睐。这些方法在哲学基础和计算方法上各不相同,但它们共同的目标是提供参数的估计范围,而非单一值,以此考量测量或抽样的不确定性。
</版本2>
<版本3>
在过去的一个世纪里,统计学的飞速发展催生了各种旨在从数据中推断结论的方法。这些方法在哲学基础、解决问题的类型以及实际应用的频率等方面,呈现出丰富多样的差异。其中,区间估计作为一种受到广泛欢迎和推崇的方法类别,尤其引人注目。区间估计有着多种不同的形式,它们在哲学基础和计算方法上各有千秋,但共同点在于,它们提供了对参数的估计,这种估计不是简单的单一值,而是考虑到测量或抽样不确定性而给出的一系列可能值。
</版本3>
<整合版>
在过去的一个世纪里,统计学领域的飞速发展催生了各种从数据中提取推论的方法,这些方法在哲学基础、解决问题的方式及实际应用频率等方面呈现出丰富多样的差异。区间估计方法作为其中的佼佼者,因其广泛的应用而备受推崇。这些方法在哲学基础和计算方法上各有特色,但它们的共同目标是提供参数的估计范围,而非单一值,以此来反映测量或抽样的不确定性。
</整合版>
</段落_1>

<段落_2>
<原始版>
在许多种区间估计方法中,最受欢迎的是置信区间(CI)。几乎所有初级统计教材都介绍了置信区间;它们受到许多知名期刊的方法论指南的推荐或要求(例如,Psychonomics Society,2012年;Wilkinson和Statistical Inference工作组,1999年);并且它们构成了方法改革提出的方案的基础(Cumming,2014年;Loftus,1996年)。在当前方法改革的氛围中,对置信区间理论允许的推断类型以及不允许的推断类型有着明确的理解,对于决定未来如何进行科学是至关重要的。
</原始版>
<版本1>
在诸多区间估计方法中,置信区间(CI)尤为突出。它不仅是几乎所有初级统计教材的标准内容,还常受到多个知名期刊的方法论指南推崇或要求,例如Psychonomics Society(2012年)和Wilkinson与Statistical Inference工作组(1999年)。置信区间也构成了近年来方法论改革提案的核心(如Cumming 2014年,Loftus 1996年所提)。在当前的方法论改革氛围中,正确理解置信区间理论所允许的推断类型及其限制,对决定未来科学研究的方向具有至关重要的意义。
</版本1>
<版本2>
在众多区间估计方法中,置信区间(CI)尤为流行。几乎所有基础统计学教材均涉及置信区间,多个著名期刊的方法论指南也推荐或要求使用它们(如Psychonomics Society 2012年、Wilkinson和Statistical Inference工作组1999年)。此外,它们是方法改革议案的核心(Cumming 2014年、Loftus 1996年)。在当前的方法改革氛围中,正确理解置信区间理论所允许和禁止的推断类型,对决定未来科学研究的方向至关重要。
</版本2>
<版本3>
在众多区间估计方法中,置信区间(CI)尤为突出,几乎成为各类初级统计教材的标配。它不仅被多个知名期刊的方法论指南推荐或要求,如Psychonomics Society(2012年)和Wilkinson与Statistical Inference工作组(1999年),而且成为了Cumming(2014年)和Loftus(1996年)提出的方法改革方案的基石。在当前的方法改革浪潮中,对置信区间理论所允许和禁止的推断类型有了清晰的认识,这对于决定未来科学研究的走向至关重要。
</版本3>
<整合版>
在诸多区间估计方法中,置信区间(CI)的地位尤为突出。几乎所有基础统计学教材都涵盖了置信区间的内容,多个著名期刊的方法论指南也推崇其使用(如Psychonomics Society 2012年、Wilkinson与Statistical Inference工作组1999年)。此外,置信区间也是近年来方法论改革提案的核心(如Cumming 2014年、Loftus 1996年所提)。在当前方法论改革的背景下,正确理解置信区间理论所允许和限制的推断类型,对决定未来科学研究的方向具有至关重要的意义。
</整合版>
</段落_2>

<段落_3>
<原始版>
在这篇论文中,我们认为对置信区间(CIs)的提倡是基于对CI理论的一种民间理解,而非一种有原则的理解。我们概述了支持民间CI理论的三种谬论,并将其置于CI理论的哲学和历史背景中。通过一个从统计文献中改编的易懂的例子,我们展示了CI理论与民间CI理论的差异。最后,我们在ANOVA和回归分析中提倡并广泛使用的一个CI的上下文中展示了对置信的谬误,并讨论了CI理论与民间CI理论不匹配的含义。
</原始版>
<版本1>
本文旨在指出,对置信区间(CIs)的倡导往往基于对CI理论的一种非原则性、民间理解,而非其学理。我们将概述三种支持民间CI理论的常见误解,并将其放置在CI理论的哲学和历史背景之中。通过一个改编自统计文献的例子,本文旨在清晰展示CI理论与民间CI理论之间的区别。最后,我们将在ANOVA和回归分析中广泛使用的一个CI实例的背景下,展示对置信的误解,并讨论CI理论与民间CI理论的不一致所带来的含义。
</版本1>
<版本2>
本文认为,对置信区间(CI)的推崇基于对CI理论的一种非正式理解,而不是基于原则的理解。我们将概述支持非正式CI理论的三大误区,并将其置于CI理论的哲学和历史背景中进行考察。通过一个改编自统计文献的易于理解的示例,我们展示了CI理论与非正式CI理论之间的差异。最后,我们将在ANOVA和回归分析中广泛应用的一个CI实例中,探讨关于置信的常见误解,并讨论CI理论与非正式CI理论不匹配的意义。
</版本2>
<版本3>
本文认为,对置信区间(CIs)的推崇基于一种民间的、非原则性的对CI理论的理解。我们将介绍支持这种民间CI理论的三大谬误,并将其放置在CI理论的哲学和历史背景中进行审视。通过一个改编自统计文献的易于理解的实例,我们将展示CI理论与民间CI理论之间的差异。最后,我们将在ANOVA和回归分析中广泛使用的一个CI实例的背景下,展示对置信的谬误,并讨论CI理论与民间CI理论不匹配的意义。
</版本3>
<整合版>
本文旨在指出,对置信区间(CIs)的普遍推崇往往基于对CI理论的一种民间且非原则性的理解。我们将概述三种支持这种民间CI理论的常见误解,并将其放置在CI理论的哲学和历史背景之中进行审视。通过一个改编自统计文献的易于理解的实例,本文将清晰地展示CI理论与民间CI理论之间的区别。最后,我们将在ANOVA和回归分析中广泛使用的一个CI实例的背景下,探讨对置信的常见误解,并讨论CI理论与民间CI理论不匹配的深远含义。
</整合版>
</段落_3>

<段落_4>
<原始版>
我们的主要观点是:不应该像现代支持者建议的那样使用置信区间,因为这种用法在置信区间理论中并没有得到证明。现代支持者认为置信区间具有的好处是在置信区间理论之外的考虑因素;因此,如果按照CI支持者建议的方式使用,CI可能会提供严重误导的推断。对于许多CI,支持者实际上并没有探讨CI是否支持合理的推断。因此,我们认为在最好的情况下,对CI理论的引用是多余的,因为可以在CI理论之外证明推断的合理性,在最坏的情况下是不明智的,因为这样的引用是站不住脚的。
</原始版>
<版本1>
我们的核心观点是,不应依照现代支持者所建议的方式使用置信区间,因为这种使用方式在置信区间理论中并未得到支持。现代支持者所强调的置信区间的优势,实际上超出了置信区间理论的范畴;因此,如果按照他们的建议使用置信区间,可能会导致严重误导的推论。对于许多CI的使用,支持者并未真正探讨它们是否支持合理的推断。因此,我们认为,在最好的情况下,引用CI理论可能是多余的,因为在CI理论之外就可以证明推断的合理性;在最坏的情况下,则是不明智的,因为这种引用缺乏坚实的基础。
</版本1>
<版本2>
我们的主要论点是:不应按现代支持者所建议的方式使用置信区间,因为这种用法在置信区间理论中并未得到证实。现代支持者所声称的置信区间的优点,实际上超出了置信区间理论的范畴;因此,如果按照他们的建议使用,置信区间可能导致严重误导的推断。对于许多CI,支持者实际并未探究其是否支持合理的推断。因此,我们认为在最好的情况下,引用CI理论是多余的,因为可以在CI理论之外证明推断的合理性;在最坏的情况下,则是不明智的,因为这种引用毫无根据。
</版本2>
<版本3>
我们主张,不应该像现代一些支持者所建议的那样使用置信区间,因为这种用法在置信区间理论中并无依据。这些现代支持者宣扬的置信区间的优势,其实是基于置信区间理论之外的考量。因此,若按照这些支持者的建议来使用置信区间,可能会导致严重误导的推断。事实上,很多支持者并未深入探讨置信区间是否真正支持合理的推断。因此,在最好的情况下,引用CI理论是多余的,因为推断的合理性可以在CI理论之外证明;而在最坏的情况下,这样的引用是不明智的,因为它毫无根据。
</版本3>
<整合版>
我们的主张是,不应像现代一些支持者所建议的那样使用置信区间,因为这种用法在置信区间理论中并无依据。这些现代支持者宣扬的置信区间的优势,其实是基于置信区间理论之外的考量。因此,若按照这些支持者的建议来使用置信区间,可能会导致严重误导的推断。事实上,很多支持者并未深入探讨置信区间是否真正支持合理的推断。因此,在最好的情况下,引用CI理论是多余的,因为推断的合理性可以在CI理论之外证明;而在最坏的情况下,这样的引用是不明智的,因为它毫无根据。
</整合版>
</段落_4>

<段落_5>
<原始版>

置信区间的民间理论

</原始版>
<版本1>

置信区间的民间理论

</版本1>
<版本2>

置信区间的非正式理论

</版本2>
<版本3>

关于置信区间的民间理论

</版本3>
<整合版>

关于置信区间的民间理论

</整合版>
</段落_5>

<段落_6>
<原始版>
在科学实践中,经常有必要估计一些感兴趣的数量,并表达对这一估计的不确定性。如果我们的目标是估计正态总体的真实均值,我们可能会选择样本均值 x¯ 作为估计值。非正式地说,我们期望 x¯ 接近,但接近程度取决于样本大小和样本中观察到的变异性。为了表达估计的不确定性,通常使用置信区间。
</原始版>
<版本1>
在科学研究实践中,经常需要估计某些感兴趣的量,并对这一估计的不确定性进行表达。假设我们的目标是估计正态总体的真实均值μ,那么我们可能会选择样本均值 ( \bar{x} ) 作为估计量。通俗来说,我们期望 ( \bar{x} ) 与 μ 接近,但这种接近程度依赖于样本的大小和样本中观察到的变异性。为了表达估计的不确定性,通常采用置信区间。
</版本1>
<版本2>
在科学研究实践中,我们经常需要估计某些感兴趣的量,并表达对这一估计的不确定性。若目标是估计正态总体的真实均值μ,我们可能选择样本均值 x̄ 作为估计。非正式地讲,我们期望 x̄ 与μ接近,但这种接近程度依赖于样本大小和样本中观测到的变异性。为了表达估计的不确定性,通常会使用置信区间。
</版本2>
<版本3>
在科学实践中,我们经常需要估计某些感兴趣的量,并表达对这些估计的不确定性。以估计正态总体的真实均值μ为例,我们可能会选择样本均值x̄作为估计值。通俗地说,我们期望x̄与μ相近,但这种接近的程度依赖于样本大小和样本中观测到的变异性。为了表达这种估计的不确定性,人们通常采用置信区间。
</版本3>
<整合版>
在科学研究实践中,我们经常需要估计某些感兴趣的量,并表达对这些估计的不确定性。以估计正态总体的真实均值μ为例,我们可能会选择样本均值 ( \bar{x} ) 作为估计值。通俗地说,我们期望 ( \bar{x} ) 与 μ 接近,但这种接近的程度依赖于样本大小和样本中观测到的变异性。为了表达这种估计的不确定性,人们通常采用置信区间。
</整合版>
</段落_6>

<段落_7>
<原始版>
关于置信区间的所有人都同意的一点是基本定义:对于一个参数(我们通用地称为,可能表示总体均值、中位数、方差、概率或任何其他未知数量),置信区间是由一个过程生成的区间,在重复抽样中,这个过程有固定的概率包含参数。如果该过程生成包含的区间的概率为0.5,则是一个50%的置信区间;同样,对于95%的置信区间,概率为0.95。
</原始版>
<版本1>
关于置信区间的一个普遍共识是其基本定义:对于某个参数(通常用 θ 表示,可能代表总体均值、中位数、方差、概率或其他未知量),置信区间是由一个特定过程生成的区间。在重复抽样的情境中,这个过程具有固定概率包含该参数。例如,若该过程生成包含 θ 的区间概率为0.5,则构成一个50%的置信区间;对于95%的置信区间,这一概率则为0.95。
</版本1>
<版本2>
对于置信区间,所有人都认同一个基本定义:对某个参数(通常表示为θ,可能是总体均值、中位数、方差、概率或其他未知量),置信区间是由某个过程生成的区间。在重复抽样中,这个过程以固定概率包含该参数。例如,若该过程生成的区间包含θ的概率为0.5,则为50%的置信区间;对于95%的置信区间,这一概率为0.95。
</版本2>
<版本3>
对置信区间的基本定义,所有人都达成了共识:对于一个参数(通常称为θ,可能代表总体均值、中位数、方差、概率或任何其他未知量),置信区间是由一种过程生成的区间。在重复抽样中,这个过程有固定的概率包含该参数。举例来说,一个包含θ的区间的生成概率为0.5,则这是一个50%的置信区间;相应地,对于95%的置信区间,该概率为0.95。
</版本3>
<整合版>
关于置信区间的基本定义,所有人都达成了共识:对于一个参数(通常称为θ,可能代表总体均值、中位数、方差、概率或任何其他未知量),置信区间是由一种过程生成的区间。在重复抽样中,这个过程有固定的概率包含该参数。举例来说,如果一个区间的生成概率为0.5,则这是一个50%的置信区间;对于95%的置信区间,该概率为0.95。
</整合版>
</段落_7>

<段落_8>
<原始版>
定义** 1 **(置信区间) _参数 θX% 置信区间是由一个过程生成的区间( LU ),在重复抽样中,该过程有 X% 的概率包含 θ 的真值,对于 θ 的所有可能值都成立( Neyman1937 )。
</原始版>
<版本1>
定义 1 (置信区间):参数 θ 的 X% 置信区间是由一个特定过程生成的区间(L,U),在重复抽样中,该过程有 X% 的概率包含 θ 的真值,且对 θ 的所有可能值都适用(Neyman,1937)。
</版本1>
<版本2>
定义 1(置信区间) _参数 θX% 置信区间是由一个过程生成的区间( LU ),在重复抽样中,该过程有 X% 的概率包含 θ 的真值,且对于 θ 的所有可能值都适用( Neyman1937 )。
</版本2>
<版本3>
定义 1 (置信区间):对于参数θ,其X%的置信区间是由一个过程生成的区间(L,U),在重复抽样中,该过程有X%的概率包含θ的真实值,且这一概率对θ的所有可能值都成立。(Neyman,1937)
</版本3>
<整合版>
定义 1 (置信区间):对于参数θ,其X%的置信区间是由一个过程生成的区间(L,U),在重复抽样中,该过程有X%的概率包含θ的真实值,且这一概率对θ的所有可能值都成立。(Neyman,1937)
</整合版>
</段落_8>

<段落_9>
<原始版>

1_

</原始版>
<版本1>

1

</版本1>
<版本2>

1

</版本2>
<版本3>

1

</版本3>
<整合版>

1

</整合版>
</段落_9>

<段落_10>
<原始版>
置信区间的置信系数来源于生成它的过程。因此,区分过程(CP)和置信区间是有帮助的:X%置信过程是在重复样本中生成覆盖θ的过程,而置信区间是由这样的过程生成的特定区间。置信过程是一个随机过程;而置信区间是被观察并固定的。
</原始版>
<版本1>
置信区间的置信系数来源于生成它的过程。因此,区分置信过程(CP)和置信区间是有益的:X%置信过程指的是在重复样本中生成覆盖 θ 的区间的过程,而置信区间则是由此过程生成的具体区间。置信过程是一个随机过程,而置信区间则是被观察到并确定的。
</版本1>
<版本2>
置信区间的置信系数源于其生成过程。因此,区分置信过程(CP)和置信区间本身是有益的:X%置信过程是在重复样本中生成覆盖θ的过程,而置信区间则是由该过程生成的具体区间。置信过程是随机的;而置信区间则是观察到的、固定的。
</版本2>
<版本3>
置信区间的置信系数来源于生成它的过程。因此,区分生成置信区间的过程(CP)与置信区间本身是有助益的:X%置信过程是一个在重复样本中生成包含θ的区间的随机过程,而置信区间则是由这一过程生成的具体区间。置信过程是随机的;而置信区间是已观察到且固定的。
</版本3>
<整合版>
置信区间的置信系数来源于生成它的过程。因此,区分生成置信区间的过程(CP)与置信区间本身是有助益的:X%置信过程是一个在重复样本中生成包含θ的区间的随机过程,而置信区间则是由这一过程生成的具体区间。置信过程是随机的;而置信区间是已观察到且固定的。
</整合版>
</段落_10>

<段落_11>
<原始版>
如何解释置信过程似乎很清晰:它是生成区间,这些区间将在样本的固定比例中包含真值的任何过程。然而,当我们从数据中计算出一个具体的区间并必须对其进行解释时,我们面临困难。如何从我们对置信过程属性的了解转移到对某个观察到的置信区间的解释,这并不明显。
</原始版>
<版本1>
置信过程的解释似乎相当直观:它是一种生成区间的过程,这些区间将在固定比例的样本中包含真值。然而,当我们根据数据计算出具体的区间后,如何解释这个区间就变得复杂。如何将我们对置信过程属性的理解转化为对某个特定观察到的置信区间的解释,并不是一件显而易见的事。
</版本1>
<版本2>
对置信过程的解释似乎非常明确:它是一个生成区间的过程,这些区间将在一定比例的样本中包含真值。然而,当我们从数据中计算出一个具体区间并需要对其进行解释时,就遇到了困难。如何从我们对置信过程属性的理解转

移到对一个具体观察到的置信区间的解释,并非显而易见。
</版本2>
<版本3>
对置信过程的解释看

似简单明了:它是一种生成区间的过程,这些区间将在固定比例的样本中包含参数的真值。然而,当我们根据实际数据计算出一个具体的区间并需要对其进行解释时,问题就变得复杂起来。如何从我们对置信过程属性的了解,转变为对某个特定观察到的置信区间的解释,这一点并不直观。
</版本3>
<整合版>
对置信过程的解释看

似简单明了:它是一种生成区间的过程,这些区间将在固定比例的样本中包含参数的真值。然而,当我们根据实际数据计算出一个具体的区间并需要对其进行解释时,问题就变得复杂起来。如何从我们对置信过程属性的了解,转变为对某个特定观察到的置信区间的解释,这一点并不直观。
</整合版>
</段落_11>

<段落_12>
<原始版>
教科书作者和置信区间的支持者通过声称置信区间具有三个可取之处的属性,无缝地弥合了这个差距:首先,置信系数可以被解读为一个度量,即我们应该对区间包含参数的不确定性有多大;其次,CI宽度是估计不确定性的度量;第三,区间包含参数的"可能"或"合理"值。所有这些都涉及从观察到的数据对参数进行推理:也就是说,它们是"后数据"推断。
</原始版>
<版本1>
教科书作者和置信区间的支持者们通常通过强调置信区间的三个特性来弥合这一认知差距:首先,置信系数可以被解释为一种度量,反映了区间包含参数的不确定性程度;其次,CI的宽度是对估计不确定性的量度;第三,该区间包含了参数的“可能”或“合理”的值。这些特性都涉及基于观察数据对参数进行的推理,即它们属于“后数据”推断。
</版本1>
<版本2>
教科书作者和置信区间的支持者通常通过声称置信区间具有三个优点来弥补这一差距:首先,置信系数可以被解释为一种度量,反映我们对区间包含参数的不确定性程度;其次,CI的宽度是估计不确定性的一个指标;第三,该区间包含了参数的“可能”或“合理”值。这些都涉及从观察到的数据对参数进行推理,即所谓的“后数据”推断。
</版本2>
<版本3>
教科书作者和置信区间的支持者通常通过声称置信区间具有三个吸引人的属性来弥合这一差距:首先,置信系数可以被解读为对区间包含参数的不确定性的一种度量;其次,CI的宽度是估计不确定性的度量;第三,该区间包含参数的“可能”或“合理”值。所有这些属性都涉及从观察到的数据对参数进行推理,也就是说,它们属于“后数据”推断。
</版本3>
<整合版>
教科书作者和置信区间的支持者通常通过声称置信区间具有三个吸引人的属性来弥合这一差距:首先,置信系数可以被解读为对区间包含参数的不确定性的一种度量;其次,CI的宽度是估计不确定性的度量;第三,该区间包含参数的“可能”或“合理”值。所有这些属性都涉及从观察到的数据对参数进行推理,也就是说,它们属于“后数据”推断。
</整合版>
</段落_12>

<段落_13>
<原始版>
例如,对于95%置信区间,Masson和Loftus(2003)陈述"在没有任何其他信息的情况下,获得的置信区间包含总体均值的概率为95%。" Cumming(2014)写道"我们可以有95%的信心认为我们的区间包含[参数],并且可以将下限和上限视为[参数]的可能下限和上限。"
</原始版>
<版本1>
例如,针对95%的置信区间,Masson和Loftus(2003)这样表述:“在没有任何其他信息的情况下,所得到的置信区间包含总体均值的概率为95%。”Cumming(2014)则写道:“我们可以有95%的把握认为我们的区间包含了[参数],并且可以将区间的下限和上限视为[参数]的可能的下限和上限。”
</版本1>
<版本2>
例如,对于95%置信区间,Masson和Loftus(2003)表述:“在没有其他信息的情况下,得到的置信区间包含总体均值的概率为95%。” Cumming(2014)写道:“我们可以有95%的信心认为我们的区间包含[参数],并可以把区间的上下限视为[参数]的可能的上下限。”
</版本2>
<版本3>
例如,针对95%的置信区间,Masson和Loftus(2003)表述:“在没有其他信息的情况下,得到的置信区间包含总体均值的概率为95%。” Cumming(2014)则写道:“我们可以有95%的信心认为我们的区间包含[参数],并且可以将区间的下限和上限视为[参数]的可能的下限和上限。”
</版本3>
<整合版>
例如,针对95%的置信区间,Masson和Loftus(2003)这样表述:“在没有其他信息的情况下,得到的置信区间包含总体均值的概率为95%。” Cumming(2014)则写道:“我们可以有95%的信心认为我们的区间包含了[参数],并且可以将区间的下限和上限视为[参数]的可能的下限和上限。”
</整合版>
</段落_13>

<段落_14>
<原始版>
这些对置信区间的解释是不正确的。我们将这些作者犯下的错误称为"基本置信谬误"(FCF),因为它似乎是根据置信区间的定义自然流出的。
</原始版>
<版本1>
然而,这些对置信区间的解释并不准确。我们将这些作者犯下的错误称为“基本置信谬误”(FCF),因为它们似乎直接源于对置信区间定义的直观理解。
</版本1>
<版本2>
这些对置信区间的解释是不正确的。我们将这种误解称为“基本置信谬误”(FCF),因为它似乎是根据置信区间的定义自然而然的推论。
</版本2>
<版本3>
然而,这些对置信区间的解释实际上是不准确的。我们将这些作者所犯的错误称为“基本置信谬误”(FCF),因为这种误解似乎是基于对置信区间定义的自然但错误的理解。
</版本3>
<整合版>
然而,这些对置信区间的解释实际上是不准确的。我们将这些作者所犯的错误称为“基本置信谬误”(FCF),因为这种误解似乎是基于对置信区间定义的自然但错误的理解。
</整合版>
</段落_14>

<段落_15>
<原始版>

置信区间与可信区间

</原始版>
<版本1>

置信区间与可信区间

</版本1>
<版本2>

置信区间与可信区间

</版本2>
<版本3>

置信区间与可信区间的比较

</版本3>
<整合版>

置信区间与可信区间的比较

</整合版>
</段落_15>

<段落_16>
<原始版>
关于贝叶斯推断和频率推断之间关系的一个误解是它们将导致相同的推断,因此所有置信区间可以简单地以贝叶斯方式解释。例如,在数据正态分布的情况下,存在一个特定的先验,它将导致置信区间在数值上等同于使用贝叶斯后验计算的贝叶斯可信区间(Jeffreys,1961;Lindley,1965)。这可能导致人们怀疑使用置信程序或贝叶斯程序没有关系。然而,我们表明,置信区间和可信区间可能存在显著的分歧。了解一个置信区间在数值上等同于某个可信区间的唯一方法是证明它。不能——也不应该——假定对应关系。
</原始版>
<版本1>
一个关于贝叶斯推断和频率推断之间关系的常见误解是,它们会导致相同的推论,从而所有置信区间都可以简单地用贝叶斯方式解释。例如,在数据呈正态分布的情况下,某些特定的先验会导致置信区间在数值上与使用贝叶斯后验计算的贝叶斯可信区间一致(Jeffreys,1961;Lindley,1965)。这可能会让人误以为使用置信程序或贝叶斯程序没有区别。然而,我们指出,置信区间和可信区间之间可能存在显著的差异。唯一了解一个置信区间在数值上与某个可信区间相等的方法,是通过证明。不能——也不应该——仅凭假设认为这两者是对等的。
</版本1>
<版本2>
关于贝叶斯推断和频率推断之间关系的一个常见误解是,它们会导致相同的推断,因此所有置信区间都可以简单地用贝叶斯方式解释。例如,在数据正态分布的情况下,某些特定的先验会使置信区间在数值上等同于贝叶斯后验计算得到的贝叶斯可信区间(Jeffreys,1961;Lindley,1965)。这可能导致人们认为,选择使用置信程序或贝叶斯程序并无太大差异。然而,我们将展示置信区间和可信区间在某些情况下可能存在显著差异。唯一了解一个置信区间在数值上等同于某个可信区间的方法,是通过证明。我们不能也不应假定它们之间存在对应关系。
</版本2>
<版本3>
关于贝叶斯推断与频率推断之间关系的一个常见误解是,它们会导致相同的推断,因此所有置信区间都可以简单地用贝叶斯方式来解释。例如,在数据正态分布的情况下,有一种特定的先验分布,它会使得置信区间在数值上等同于使用贝叶斯后验概率计算得到的贝叶斯可信区间(Jeffreys,1961;Lindley,1965)。这可能导致人们误认为,使用置信程序或贝叶斯程序并无区别。然而,我们展示了置信区间和可信区间可能存在显著的不同。唯一能够确定一个置信区间在数值上与某个贝叶斯可信区间相同的方法,是通过证明。我们不能也不应该假定它们之间有直接的对应关系。
</版本3>
<整合版>
关于贝叶斯推断与频率推断之间关系的一个常见误解是,它们会导致相同的推断,因此所有置信区间都可以简单地用贝叶斯方式来解释。例如,在数据正态分布的情况下,有一种特定的先验分布,它会使得置信区间在数值上等同于使用贝叶斯后验概率计算得到的贝叶斯可信区间(Jeffreys,1961;Lindley,1965)。这可能导致人们误认为,使用置信程序或贝叶斯程序并无区别。然而,我们展示了置信区间和可信区间可能存在显著的不同。唯一能够确定一个置信区间在数值上与某个贝叶斯可信区间相同的方法,是通过证明。我们不能也不应该假定它们之间有直接的对应关系。
</整合版>
</段落_16>

<段落_17>
<原始版>
更广泛地说,通过指出在某些受限情况下它们在数值上与贝叶斯程序一致,来为置信程序辩护实际上根本不是辩护。首先必须选择要使用的置信程序,而有许多种。如果承诺使用允许贝叶斯解释的程序,那么把时间花在简单应用贝叶斯理论上要好得多。如果需要贝叶斯理论的好处——而明显是需要的,对于置信区间的支持者来说——那么没有理由不应用贝叶斯推断的全部普遍性,而不是将偶尔与可信区间一致作为对置信区间的挥手辩护。
</原始版>
<版本1>
更广泛地说,仅仅指出在某些特定情况下置信程序与贝叶斯程序在数值上一致,并不构成对置信程序的有效辩护。首先,必须选择要使用的置信程序,而这些程序众多且各不相同。如果承诺使用那些允许贝叶斯解释的程序,那么投入时间直接应用贝叶斯理论更为合理。如果需要贝叶斯理论的优势——显然,对于置信区间的支持者来说是需要的——那么没有理由不使用贝叶斯推断的全面性,而不是偶尔与可信区间一致作为对置信区间的敷衍辩护。
</版本1>
<版本2>
更广泛地说,简单地指出在某些限定情况下置信区间与贝叶斯程序数值一致,并不能作为对置信程序的辩护。首先,必须选择要使用的置信程序,而可选择的程序众多。如果承诺使用允许贝叶斯解释的程序,不如直接运用贝叶斯理论。如果需要贝叶斯理论的优势——显然是需要的,对于置信区间的支持者来说——那么没有理由不应用贝叶斯推断的全面性,而不是偶尔与可信区间一致性作为对置信区间的支持。
</版本2>
<版本3>
更广泛地说,仅仅因为在某些受限情况下,置信程序在数值上与贝叶斯程序一致,并不能作为对置信程序的辩护。首先必须选择要使用的置信程序,而其种类繁多。如果承诺使用允许贝叶斯解释的程序,那么不如直接应用贝叶斯理论。如果我们需要贝叶斯理论的好处——显然我们需要,至少对于置信区间的支持者来说是这样——那么就没有理由不完全应用贝叶斯推断的普遍性,而不是仅仅满足于偶尔与贝叶斯可信区间一致的程度。
</版本3>
<整合版>
更广泛地说,仅仅因为在某些受限情况下,置信程序在数值上与贝叶斯程序一致,并不能作为对置信程序的辩护。首先必须选择要使用的置信程序,而其种类繁多。如果承诺使用允许贝叶斯解释的程序,那么不如直接应用贝叶斯理论。如果我们需要贝叶斯理论的好处——显然我们需要,至少对于置信区间的支持者来说是这样——那么就没有理由不完全应用贝叶斯推断的普遍性,而不是仅仅满足于偶尔与贝叶斯可信区间一致的程度。
</整合版>
</段落_17>

<段落_18>
<原始版>
然而,对于应用统计文献中提出的许多置信程序,我们应该期望,没有努力显示这些区间具有置信区间支持者所期望的推断特性。我们应该期望,新置信区间的开发者首先展示他们的区间具有期望的推断特性,而不仅仅是真值的名义覆盖和"短"宽度。因为置信区间的开发者没有这样做,对置信区间的推动是在不确定的基础上。采用贝叶斯推断,在所有推断都在一个逻辑、统一的框架内产生,将使评估这些置信程序的属性的问题变得不重要。如果需要,还可以评估贝叶斯程序的覆盖范围;但如果主要关心的是合理的后数据推断,那么贝叶斯属性应该是首要考虑的,而不是频率覆盖(参见Gelman,2008;Wasserman,2008)。
</原始版>
<版本1>
然而,对于在应用统计文献中提出的许多置信程序,我们应该预期,这些程序没有努力展示它们具有置信区间支持者所期望的推断特性。我们应该期待,新开发的置信区间在提出时就应该首先展示其具有期望的推断特性,而不仅仅是真值的名义覆盖率和“短”的宽度。因为置信区间的开发者没有这样做,推动置信区间的使用是建立在不稳定的基础上的。采用贝叶斯推断,所有推断都在一个逻辑、统一的框架内生成,这将使得评估这些置信程序的属性变得不那么重要。如果需要,还可以评估贝叶斯程序的覆盖范围;但如果我们的主要关心点是合理的后数据推断,那么贝叶斯特性应该是首要考虑的,而非频率覆盖。
</版本1>
<版本2>
然而,对于许多在应用统计文献中提出的置信程序,我们应该预期它们并未显示出置信区间支持者所期望的推断特性。我们期待新开发的置信区间首先展示其具有期望的推断特性,而不仅仅是真值的名义覆盖和“短”宽度。因为置信区间的开发者没有这样做,所以对置信区间的推广建立在不确定的基础上。采用贝叶斯推断,所有推断都在一个逻辑、统一的框架内产生,这将使评估置信程序的属性变得不重要。如果需要,还可以评估贝叶斯程序的覆盖范围;但如果主要关心的是合理的后数据推断,那么贝叶斯属性应是首要考虑的,而不是频率覆盖(参见Gelman,2008;Wasserman,2008)。
</版本2>
<版本3>
然而,对于应用统计文献中提出的许多置信程序,我们应期望它们没有努力证明这些区间具有置信区间支持者所希望的推断特性。我们还应期望,新置信区间的开发者在提出他们的区间时,首先展示这些区间具有所期望的推断特性,而不仅仅是名义上的真值覆盖率和“短”宽度。因为开发者未能这样做,所以对置信区间的推动是建立在不稳定的基础之上。采用贝叶斯推断,将所有推断置于一个逻辑统一的框架内,这会使评估这些置信程序的属性变得不再重要。如果需要,还可以评估贝叶斯程序的覆盖范围;但如果主要关注合理的后数据推断,那么贝叶斯属性应该是首要考虑的,而不是频率覆盖(参见Gelman,2008;Wasserman,2008)。
</版本3>
<整合版>
然而,对于应用统计文献中提出的许多置信程序,我们应期望它们没有努力证明这些区间具有置信区间支持者所希望的推断特性。我们还应期望,新置信区间的开发者在提出他们的区间时,首先展示这些区间具有所期望的推断特性,而不仅仅是名义上的真值覆盖率和“短”宽度。因为开发者未能这样做,所以对置信区间的推动是建立在不稳定的基础之上。采用贝叶斯推断,将所有推断置于一个逻辑统一的框架内,这会使评估这些置信程序的属性变得不再重要。如果需要,还可以评估贝叶斯程序的覆盖范围;但如果主要关注合理的后数据推断,那么贝叶斯属性应该是首要考虑的,而不是频率覆盖(参见Gelman,2008;Wasserman,2008)。
</整合版>
</段落_18>

<段落_19>
<原始版>
对于通过区间推理的拥护者,采用贝叶斯推断将带来其他好处。置信区间的端点始终由数据设置。然而,假设我们有兴趣确定参数在特定范围内的可能性;例如,在美国,对于智力障碍的罪犯执行死刑是违法的。佛罗里达州对智力障碍的标准是真实的智商低于70。由于智商是有误差的,人们可能会问我们对于某个罪犯的真实智商低于70的概率有多大(有关IQ的置信区间,请参见Anastasi和Urbina(1997)或Cronbach(1990))。在这种情况下,我们希望评估的区间不再是样本的函数。真实值在固定区间内的长期概率是未知的,可能是0或1,因此不能构造任何置信程序,尽管这样的信息对于研究人员、政策制定者或罪犯辩护人可能非常重要(Pratt等人,1995)。
</原始版>
<版本1>
对于通过区间推理的拥护者来说,采用贝叶斯推断将带来其他好处。置信区间的端点始终是由数据确定的。然而,假设我们想要确定参数在特定范围内的可能性;例如,在美国,对智力障碍的罪犯执行死刑是非法的。佛罗里达州规定,真实智力低于70即为智力障碍。由于智商测量存在误差,我们可能会问,对于某个罪犯,其真实智商低于70的概率有多大。在这种情况下,我们关注的区间不再是样本的函数。真实值在固定区间内的长期概率是未知的,可能是0或1,因此不能构造任何置信程序,尽管这样的信息对研究者、政策制定者或辩护律师可能极其重要。
</版本1>
<版本2>
对于区间推理的支持者来说,采用贝叶斯推断将带来额外好处。置信区间的端点始终由数据决定。然而,如果我们感兴趣的是确定参数在特定范围内的可能性,例如在美国,对智力障碍的罪犯执行死刑是非法的。佛罗里达州对智力障碍的标准是真实智商低于70。由于智商测试存在误差,我们可能会询问对某个罪犯的真实智商低于70的概率有多大(参见关于智商的置信区间的讨论,Anastasi和Urbina(1997)或Cronbach(1990))。在这种情况下,我们关注的区间不再是样本的函数。真实值在固定区间内的长期概率是未知的,可能是0或1,因此不能构建任何置信程序,尽管这样的信息对研究人员、政策制定者或辩护律师可能极其重要(Pratt等,1995)。
</版本2>
<版本3>
对于通过区间推理的拥护者而言,采用贝叶斯推断还有其他好处。置信区间的端点始终由数据决定。但假设我们关注的是判断参数是否落在某个特定范围内的可能性,例如在美国,对智力障碍的罪犯执行死刑是非法的。佛罗里达州对智力障碍的标准是真实智商低于70。由于智商的测量存在误差,我们可能会询问某个罪犯的真实智商低于70的概率有多大(有关智商的置信区间,请参见Anastasi和Urbina(1997)或Cronbach(1990))。在这种情形下,我们所关心的区间不再是样本的函数。真实值在固定区间内的长期概率是未知的,可能是0或1,因此无法构建任何置信程序,尽管这样的信息对于研究者、政策制定者或辩护律师可能极其重要(参见Pratt等人,1995)。
</版本3>
<整合版>
对于通过区间推理的拥护者而言,采用贝叶斯推断还有其他好处。置信区间的端点始终由数据决定。但假设我们关注的是判断参数是否落在某个特定范围内的可能性,例如在美国,对智力障碍的罪犯执行死刑是非法的。佛罗里达州对智力障碍的标准是真实智商低于70。由于智商的测量存在误差,我们可能会询问某个罪犯的真实智商低于70的概率有多大(有关智商的置信区间,请参见Anastasi和Urbina(1997)或Cronbach(1990))。在这种情形下,我们所关心的区间不再是样本的函数。真实值在固定区间内的长期概率是未知的,可能是0或1,因此无法构建任何置信程序,尽管这样的信息对于研究者、政策制定者或辩护律师可能极其重要(参见Pratt等人,1995)。
</整合版>
</段落_19>

<段落_20>
<原始版>
即使在表面上看似乎简单的情况下,固定区间嵌套在置信区间(CI)内,反之亦然,也不能对固定区间的合理性得出结论。人们可能会假设嵌套在CI内的区间由于较短而具有较低的置信度,但正如图1b所示,某些50%置信区间内部嵌套着100%置信区间(似然性)。同样,人们可能认为如果CI嵌套在固定区间内,那么固定区间的概率就必须大于该区间。但在图1a中,可以想象一个略大于50% UMP区间的固定区间;由于其占据似然性的一小部分,它将具有远低于50%的真值包含概率。了解FCF是一种谬论,阻止了使用置信区间来评估固定区间的概率。另一方面,贝叶斯程序提供了计算任何给定数值范围的合理性的能力。由于所有这些推断都必须从后验分布中进行,因此推断必须保持相互一致(Lindley,1985;另请参见Fisher,1935,进行类似的论证)。
</原始版>
<版本1>
即使在表面上看似简单的情况下,当固定区间嵌套在置信区间(CI)内,或者反之,也不能直接得出关于固定区间合理性的结论。可能有人会假设,嵌套在CI内的较短区间由于其长度而具有更低的置信度,但正如图1b所示,某些50%的置信区间内部实际上嵌套着100%的置信区间(似然性)。同样,如果CI嵌套在一个固定区间内,人们可能会错误地认为,这个固定区间的概率必然高于该CI。但在图1a的情况中,可以设想一个略大于50% UMP区间的固定区间;由于其仅覆盖似然性的一小部分,其真值包含的概率可能远低于50%。认识到基本置信谬误是一种误解,防止了我们用置信区间来评估固定区间的概率。另一方面,贝叶斯方法提供了计算任何特定数值范围合理性的能力。由于所有这些推断必须从后验分布中得出,因此推断必须保持内部一致性(参见Lindley,1985;以及Fisher,1935的类似论证)。
</版本1>
<版本2>
即使在看似简单的情况下,将固定区间嵌套在置信区间(CI)内,或反之,也不能得出关于固定区间合理性的结论。例如,人们可能会假设嵌套在CI内的区间由于较短而具有较低的置信度,但实际上,某些50%的置信区间内可能嵌套着100%的置信区间(似然性)。相反,如果CI嵌套在固定区间内,也不能简单地认为固定区间的概率超过了该CI。例如,可以设想一个略大于50% UMP区间的固定区间,由于它只占似然性的一小部分,其真值包含概率可能远低于50%。理解基本置信谬误是一种错误,有助于阻止我们使用置信区间来评估固定区间的概率。相反,贝叶斯程序提供了计算任何特定数值范围合理性的能力。由于所有这些推断都必须从后验分布出发,因此这些推断必须保持一致性(Lindley,1985;另请参见Fisher,1935的类似论证)。
</版本2>
<版本3>
即使在表面看似简单的情况下,固定区间嵌套在置信区间(CI)内,或者相反,也不能简单推断固定区间的合理性。通常人们可能会假设,在CI内的较短区间因其长度较短而具有较低的置信度,但正如图1b所示,某些50%置信区间内部实际上嵌套着100%置信区间(似然性)。同样,如果CI嵌套在一个固定区间内,人们可能会错误地认为固定区间的概率必须高于该CI。然而,如图1a所示,可以设想一个略大于50% UMP区间的固定区间;由于它只占似然性的一小部分,其真值包含概率实际上可能远低于50%。认识到基本置信谬误(FCF)是一种误解,有助于防止使用置信区间来评估固定区间的概率。相反,贝叶斯程序提供了一种计算任何给定数值范围合理性的方法。由于所有这些推断都必须基于后验分布,因此推断必须保持一致性(参见Lindley,1985;另请参见Fisher,1935,进行类似的论证)。
</版本3>
<整合版>
即使在表面看似简单的情况下,固定区间嵌套在置信区间(CI)内,或者相反,也不能简单推断固定区间的合理性。通常人们可能会假设,在CI内的较短区间因其长度较短而具有较低的置信度,但正如图1b所示,某些50%置信区间内部实际上嵌套着100%置信区间(似然性)。同样,如果CI嵌套在一个固定区间内,人们可能会错误地认为固定区间的概率必须高于该CI。然而,如图1a所示,可以设想一个略大于50% UMP区间的固定区间;由于它只占似然性的一小部分,其真值包含概率实际上可能远低于50%。认识到基本置信谬误(FCF)是一种误解,有助于防止使用置信区间来评估固定区间的概率。相反,贝叶斯程序提供了一种计算任何给定数值范围合理性的方法。由于所有这些推断都必须基于后验分布,因此推断必须保持一致性(参见Lindley,1985;另请参见Fisher,1935,进行类似的论证)。
</整合版>
</段落_20>

<段落_21>
<原始版>
然而,从置信区间转向可信区间需要一种思维方式的转变,摆脱与区间相关的测试中心观点(例如,"区间中是否包含0?")。尽管每个置信区间都可以解释为一种测试,但不能这样解释可信区间。通过检查某个可信区间是否包含感兴趣的特定参数值来评估贝叶斯可信度是错误的,如Berger(2006)所说。当感兴趣的是测试特定值(例如零假设)时,必须为该特定值分配先验非零概率。虽然在概念上不难,但超出了本文的范围;有关易于理解的账户,请参阅Rouder等人(2009),Wagenmakers等人(2008)或Dienes(2011)。
</原始版>
<版本1>
然而,从置信区间转向可信区间需要一种思维方式的转变,这种转变摆脱了与区间相关的传统测试中心观点(例如,“区间中是否包含0?”)。尽管每个置信区间都可以被解释为一种测试,但我们不能以同样的方式解释贝叶斯可信区间。通过检查某个贝叶斯可信区间是否包含特定的参数值来评估贝叶斯可信度是不正确的,如Berger(2006)所述。当我们感兴趣的是测试特定值(例如零假设)时,必须为该特定值分配非零的先验概率。虽然这在概念上并不困难,但它超出了本文的讨论范围;对于更易理解的阐述,请参阅Rouder等人(2009),Wagenmakers等人(2008)或Dienes(2011)的工作。
</版本1>
<版本2>
然而,从置信区间转向可信区间需要一种思维方式的转变,需要摆脱测试中心的观点(例如,“区间中是否包含0?”)。尽管每个置信区间都可以解释为一种测试,但贝叶斯可信区间不应该这样解释。通过检查某个可信区间是否包含特定参数值来评估贝叶斯可信度是错误的,正如Berger(2006)所指出的。当感兴趣的是测试特定值(例如零假设)时,必须为该特定值分配先验非零概率。虽然这在概念上并不复杂,但超出了本文的讨论范围;有关更易理解的讨论,请参阅Rouder等人(2009)、Wagenmakers等人(2008)或Dienes(2011)的工作。
</版本2>
<版本3>
然而,从置信区间转向可信区间需要一种思维方式的转变,需要摆脱与区间相关的测试中心观点(例如,“区间是否包含0?”)。虽然每个置信区间都可以被解释为一种测试,但不能这样解释贝叶斯可信区间。通过检查某个贝叶斯可信区间是否包含感兴趣的特定参数值来评估贝叶斯可信度是错误的,如Berger(2006)所指出的。当关注的是测试特定值(例如零假设)时,必须为该特定值分配先验非零概率。虽然这在概念上并不困难,但超出了本文的讨论范围;有关易于理解的介绍,请参阅Rouder等人(2009)、Wagenmakers等人(2008)或Dienes(2011)。
</版本3>
<整合版>
然而,从置信区间转向可信区间需要一种思维方式的转变,需要摆脱与区间相关的测试中心观点(例如,“区间是否包含0?”)。虽然每个置信区间都可以被解释为一种测试,但不能这样解释贝叶斯可信区间。通过检查某个贝叶斯可信区间是否包含感兴趣的特定参数值来评估贝叶斯可信度是错误的,如Berger(2006)所指出的。当关注的是测试特定值(例如零假设)时,必须为该特定值分配先验非零概率。虽然这在概念上并不困难,但超出了本文的讨论范围;有关易于理解的介绍,请参阅Rouder等人(2009)、Wagenmakers等人(2008)或Dienes(2011)。
</整合版>
</段落_21>

<段落_22>
<原始版>
最后,我们相信在科学中,我们推断的含义很重要。由于明确使用先验,贝叶斯可信区间支持根据合理性来解释概率。另一方面,置信区间基于一种不允许推断合理性的哲学,并且不使用先验信息。将置信区间用作可信区间的方式是试图将贝叶斯含义引入频率统计学的一种尝试,而没有适当考虑先验。正如人们所说,没有免费的午餐;必须做出选择。我们怀疑研究人员在有选择的情况下宁愿指定先验并获得贝叶斯理论带来的好处。然而,我们不应假装选择不需要做出。置信区间理论和贝叶斯理论不可互换,不应被视为如此。
</原始版>
<版本1>
最后,我们认为,在科学研究中,我们对推断的含义给予高度重视是至关重要的。贝叶斯可信区间通过明确使用先验知识,支持基于合理性来解释概率。相反,置信区间基于一种不允许推断合理性的哲学,并且不使用先验信息。试图将贝叶斯含义引入到频率统计学中,而未适当考虑先验知识,就是用可信区间的方式使用置信区间的尝试。正如常言,天下没有免费的午餐;必须做出选择。我们怀疑,面对选择时,研究人员更愿意指定先验并从贝叶斯理论中获益。然而,我们不应假装这种选择是不必要的。置信区间理论和贝叶斯理论是不同的,也不应被视为可互换的。
</版本1>
<版本2>
最后,我们相信,在科学研究中,我们所做推断的含义至关重要。贝叶斯可信区间通过明确使用先验信息,支持基于合理性解释概率。而置信区间则建立在不允许推断合理性的哲学基础上,且不使用先验信息。将置信区间作为可信区间的替代品是试图将贝叶斯含义引入频率统计学的尝试,却没有适当考虑先验。正如俗话所说,没有免费的午餐;必须做出选择。我们怀疑,当研究人员有选择的情况下,他们宁愿指定先验并享受贝叶斯理论的优势。然而,我们不应假装选择不需要做出。置信区间理论与贝叶斯理论不可互换,也不应被视为如此。
</版本2>
<版本3>
最后,我们相信,在科学中,对我们的推断所含意义的理解至关重要。由于明确使用了先验信息,贝叶斯可信区间支持根据合理性来解释概率。而置信区间则基于一种不涉及推断合理性的哲学,并且不使用先验信息。将置信区间当作贝叶斯可信区间来使用,无异于试图将贝叶斯含义引入频率统计学,却没有适当地考虑到先验信息。正如常言所说,天下没有免费的午餐;我们必须做出选择。我们怀疑,在有选择的情况下,研究者更愿意指定先验并享受贝叶斯理论带来的好处。然而,我们不应该假装这种选择是不必要的。置信区间理论和贝叶斯理论是不可互换的,也不应该被视为可以互换。
</版本3>
<整合版>
最后,我们相信,在科学中,对我们的推断所含意义的理解至关重要。由于明确使用了先验信息,贝叶斯可信区间支持根据合理性来解释概率。而置信区间则基于一种不涉及推断合理性的哲学,并且不使用先验信息。将置信区间当作贝叶斯可信区间来使用,无异于试图将贝叶斯含义引入频率统计学,却没有适当地考虑到先验信息。正如常言所说,天下没有免费的午餐;我们必须做出选择。我们怀疑,在有选择的情况下,研究者更愿意指定先验并享受贝叶斯理论带来的好处。然而,我们不应该假装这种选择是不必要的。置信区间理论和贝叶斯理论是不可互换的,也不应该被视为可以互换。
</整合版>
</段落_22>