论统计推理中贝叶斯归纳的哲学研究,本文主要内容关键词为:归纳论文,哲学论文,中贝叶斯论文,此文献不代表本站观点,内容供学术参考,文章仅供参考阅读下载。
中图分类号:B81
文献标识码:A
文章编号:1673-7059(2012)05-0045-12
一、对贝叶斯归纳主观性的质疑
贝叶斯分析的先验分布,反映了实验结果出炉之前的个人信息。因此,这些主观信息在个体之间因人而异,存在着变化的趋势。前提的主观性或许会使人想到,由贝叶斯归纳所得出的结论也是“特殊的”、“主观的”和“反复和无规律性的”,这似乎就与以“客观”为标榜的科学理论相悖。
学界已经用科学客观性方法做过很多尝试。例如,已经证明“主观性困境”可能来自其根源——即通过拒绝主观性,来支持所有科学家理性上可接受的纯客观先验概率。但事实上,尽管科学理论具有惟一性,客观上是正确的,但归纳概率却是备受推崇、吸引人的思想方法,而且科学家们在调查的早期阶段也经常就某理论的可信性问题上持截然不同的观点。
第二种方法尝试开发贝叶斯归纳理论的某些有限定理。这些定理反映的是,如在O先验概率假说等确定的、不严格约定前提下,不同的贝叶斯使用者无论先前的观点是什么,都会随着信息的无限增加最终达成一致性的后验观点。而迄今为止,这种有限定理的用途不是很大。究其原因,首先,由于它们仅在有限意义上处理后验概率函数的性质,然而随着数量的无限增加,对于其他有限信息之后真实的数量特征却闭口不谈,因而,它们也起不到规范性或解释性说明的作用。
第三种方式也是本文所认可的方式。该方法认为科学观念即使在很少相关信息之后也常趋于雷同,并提出贝叶斯定理应为这一现象提供解释性框架结构,为具体事例提供具体的解释。如,华南师范大学陈晓平教授在评价豪森、康德的基础上,从哲学的角度给出指导性的论证。[1]而本文认为,一旦真正认识问题的本质,贝叶斯方法中的主观性就会被广泛接受。
我们使用实际研究中统计推理文献中常遇到的两个例子来进行说明:第一个是正态总体均值的估计;第二个是二项比率的估计。本文试图表明,在这两种估计过程中最终将达成近似一致的看法。
1.估计正态总体分布的均值
已知。某个待估计总体的均值呈正态分布,其标准方差是,假定该认识在通常情况下或多或少是真实的。
给出。该结果由Lindley于1965年证得,[2]如图1所示。
图1 Lindley(1965):先验和后验分布
由于分布的精度是由其变量的倒数来定义的,上述第二个等式是指,后验分布的精度随已估总体均值精度的增加而增加。同样,测量值的精度随测量工具精度(其精度是其误差分布的变化的倒数)的增加而增加。估计越精确,该参数的值就越不确定。
由上述公式可得出:观念的收敛是十分灵敏的。在该例中,一个人总体均值的正态先验分布的集中在10,标准差为10;而另一个人的则集中在100上,标准差为20。这种差异指出了,在第一个人看来几乎确定无疑认可的包含真实均值的范围却不包含第二个人所言的。是两个人的初始观念的迥异引起的,而如此大的分歧在相关观测资料不足的前提下仍能得到解决。下述表格解释了两人后验分布的均值和标准差、不同容量的随机样本。每个样本的均值各为50。
我们选择先验分布中不常见的一个极端一致的例子作说明:表格的第一行,没有表示初始状态的相关信息。容量仅为20的样本已使两个后验分布十分接近,而容量为100的样本使得两者完全相同。起始的观点越接近,在已知相似性的范围内,获得相关后验观点所需要的证据就越少。因此,尽管所考察案例的贝叶斯分析必须出自大的主观先验分布,对结论影响最大的还是客观实验证据,同样也是更普遍、更真实的。
2.估计二项比例
统计推理值的另一个标准问题是如何评价,如,掷出的硬币字面朝上(或者说纹面向上)的物理概率等。在掷币事件中,通过掷硬币,得出每掷一次硬币落地时正面朝上或正面朝下等相关数据。如果只有两种可能结果,即,概率θ和1-θ,且每次实验都保持不变,那么该数据生成过程就叫做伯努利过程,θ和1-θ被称为伯努利参数或二项比例。
评价伯努利参数的贝叶斯方法,是从已有实验结果中通过刻画一个假定所谓β分布形式的先验分布开始的。这种限制简化了相关后验分布计算的说明实际上并非十分苛刻,因为取决于两个正值参数u和v的取值的β分布有着广泛的形式,使得能够选择一个最接近真实信念分布的β分布。
由于使用充分的数据信息也不会对相关先验(分布)中的后验概率产生太大影响,那么,对具体说明的先验误差也将不会产生明显的作用。随机变量x有β分布,仅当其密度:
图2 β分布
因此,先验分布对后验分布的影响随着样本容量变化而稳步递减。
3.可信区间和置信区间
参数估计经常通过θ=θ[*]±ε概率的形式表达,即,具有θ真值的大概率值的集合。通常,如果用 P表示θ在AB之间的概率,那么,区间(a,6)就是θ的100%可信区间。贝叶斯者推荐把可信区间作为后验分布的有益总结。
使用第一个例子来解释这种思想,该例子关注
当然,存在与此对应的后验分布不同区域的其它95%可信区间,例如,由θ>-1.46定义的值的无穷范围。以及延伸到后验分布尾部,而不包括其中心值周围狭长地带的区间。对于选择区间的选择会引发争论(如,Lindley,1965,第二卷,第24-25页)。严格来讲,在这一点上大多数人都存在误解,人们不应选择区间,因为选择意味着一种承诺,即超出许可的所有的区间共享95%的概率。从归纳的或科学的观点看来。所有的95%的可信区间在同一水平上。
贝叶斯的可信区间类似经典统计的置信区间。实际上,尤其在我们先前的例子中,95%的可信区间在图中所描绘的和习惯上接近的95%的置信区间相一致。然而两种区间类型本质上是有差异的:第一种陈述的是与证据相关的概率,θ位于区间内;第二种没有提及任何的概率的信息,或者用“非概率项”表述任何关于θ的不确定性的程度。可信区间,为经典置信区间基础理论的直观知识提供了浅显而合理的解释。
二、贝叶斯归纳中平稳估计原理的应用
上述两个例子中给出的估计,对先验分布中的变化不是十分敏感。由于例子中所假定的先验分布在第一个例子中局限于正态分布,第二个例子局限于β分布。问题是——一旦这些限制不再受约束,这些“钝性”是否仍然持续,而平稳估计原理对其要求是持续的。Edwards,Lindman和Savage(1963)[3],Blackwell和Dubins(1962)证明了广义结论的一个方面。[4]
接着Edwards。Lindman和Savage指出:在此条件下,后验的真实分布和建立在一致的先验假设计算上的后验分布大致相同。此外,近似值越大,α,β和δ就越小。因此,不管不同人的先验信念是什么,只要它们满足上述条件,定理就保证他们的后验信念都大致相同。
图3 Philips(1973):稳定估计的应用[5]
现实中,平稳估计原理的所述条件一般是可达的,人们可检查他们是否能在任意个案中成立。如果通过首先计算后验分布,先验分布是一致的,那么,检验一个99.99%的可信区间(图中阴影部分)以观察区间内真实的先验分布变化范围是否与原理要求的一样小,最后依据超标的量,来检查区间外实际先验分布。
平稳估计原理保证,贝叶斯估计相对于我们的两个例子中提到的先验分布的相对独立性,不是被严格限制在属于某分布谱系的先验分布。该原理也告诉我们,提供的样本充分地大,无需为了做一个既准确又精确的贝叶斯估计花费巨大的准确度和精度,来刻画先验分布。这就回答了对贝叶斯估计的批评——即由于准确断定自己或他人的先验信念分布的实际困难,就很难摆脱背景的干扰。
三、贝叶斯归纳对证据的刻画
一方面,实验结果是一种物理状态,另一方面,科学证据是一种语言表征,问题是:物理状态的哪些方面应进入证据陈述?一个完整的刻画应当是无穷长,这显然是不可能的。甚至也不应当要求证据中应包含实验结果的各方面概要性的思想,因为有些方面是简单不相干的。证据无须涉及不相干的细节。
当前。如果我们知道事实是如何影响假设评定的,那么事实就与假设相关。当评价使用的方法是贝叶斯的时。这就意味着,与事实的关联性是由其是否改变任何兴趣假设的概率决定的。用掷硬币事例中获得的证据,估计一个硬币落地时是正面还是背面朝上的物理概率的问题,我们说明证据关联性的定义。设,掷币10次,得到6次正面朝上,4次反面朝上,下图显示几种该结果的可能描述和可能得到的几种情况:
业已表明,在任何归纳推理中,停止规则都是不相关的。
为说明第一个,重新考虑使用前面的停止规则:在第一个事件中,一旦午餐时间到了,实验将停止,假设实验的目的是用随机样本评估一群进行备餐厨师的平均身高。现在如果身材高大厨师的备餐速度比身体矮的快,在随机抽样之前所花费的时间则取决于未知参数,并且包含为任何贝叶斯分析所反映的有关抽样的相关信息。表面可能与事实相悖,它并没有支持经典理论的涉及停止规则的立场,因为这并不是说,在某一点上,依据实验者的主观意愿或计划,停止实验具有任何归纳显著性。
提出的第二个有争论性的问题是:对于任意假设,只要它开始达到所预期的后验分布,不管它实际上偏离的什么样的真相,一个没有事先得知实验终止条件的贝叶斯主义者就能决定是否继续抽样。根据Mayo(1996)指出,确定的贝叶斯最终必将是成功的,也就是说,在有限的范围内,随着重复抽样以至无穷,或者像Mayo指出的那样,抽样过程能够“进行的时间足够长”。Mayo指出,该推理假定的属性(putative property)把贝叶斯引入“歧途”,并导致任何形式的贝叶斯估计无效。[6]
Mayo没有,其他人也没有证明,从“反复试验”的结果中得出的这种结论有误导性、不符合逻辑,也是错误的。因此,除非这种证明是既有的,那么,对任意贝叶斯主义者来说,都没有可辩护的。
此外,反对意见的大前提是错的。Savage(1962)证得:不管抽样过程持续多久,使用贝叶斯定理也不能为所有的假设提供证据支持。[7]Kadane等(1999)也证明了:一个错误理论最终获得有力证据支持的概率是很小的,其大小取决于假设的先验概率和为之寻求的确认度。[8]
充分性
四、抽样
为了从样本数据中获得后验分布的一个参数,需要计算贝叶斯定理中用数字表示的似然项。似然性也是经典推理所要求的。为确保每一个元素是精确地由样本中包含的同一个客观概率赋予的,实验样本应通过物理的随机化装置的方法创建。
这就意味着,无规划或有意识地获得的样本,对于经典估计目的来说,将因无信息价值而加以拒绝;而通过随机化过程产生的类似样本,就能被接受。这就显得有点儿自相矛盾——的确,Stuart(1962)把它表述成“抽样悖论”(Paradox of Sampling),把所谓的“经典推理”看成唯一有效的估计方法。[9]
实际上,由于数据的收集方式可能确实携带有用的信息,贝叶斯推理同样易受抽样方法的影响,就不存在悖论之类的指责。假设,为了估计一个总体中A的比例θ,取容量为1的一个样本A(即一个A);并设,已选元素也具有一些其他特征B。目标是:总体中有多少比例的人口,倾向于投票给某一政党,该样本可能是由有此种倾向的个体组成,并且该个体特别提到是在60岁以上。鉴于该信息的后验分布如下:
该样本可以多种方式进行收集。例如,它可以从全部总体中抽取的一个随机结果,也可以只从包含B的总体里的部分中抽取。如果是后者,那么,P(B)=P(B|θ)=1。如果是前者,P(B)和p(B|θ)相等,仅当B和θ是概率独立的,在这种情况下,这两种抽样方法即可产生同样的贝叶斯结论。但这是一个特例。而作为一个广义的规则,已给样本的归纳力并非独立于选择过程。(Korb,1994)[10]
在我们看来以上直观上是正确的,包含为达到估计θ的目的而收集的随机样本中包含的B的个数。也是B的总体比例的一个尺度。如果后者是或然地取决于θ,那么它也将承载一些关于参数的信息。另一方面,你如果故意把样本限制在B,仅包含那种类型的元素的情形,样本将不能带有总体中关于其频率的任何信息.由此,就得不到关于θ认识的潜在来源。
跟样本是归纳相关的一样,在抽样方法的问题上,贝叶斯和经典方法的立场是一致的。但两者在随机样本的角色定位上看法是有差别的。经典方法的立场是,只有使用随机机制建立起来随机抽样才是有信息价值的;另一方面,贝叶斯归纳方法能更好地进行有计划地、有判断地抽样。
五、因果假设检验中贝叶斯归纳的使用
尤其是在医学和农业实验中使用最广泛的统计方法,是由费舍(Fisher,1947)首创并扎根于经典推理的步骤之中的检验和估计因果假设法。[11]费舍方法的新颖之处在于它规定了一个所谓的“随机化”过程。除了作为“先决条件”的观念所承载的,实验中的随机化处理方式并未起到其预期作用,更何况在医学背景下,这种做法显然是有违医学职业伦理的。这里给出检验因果假设的贝叶斯路径的合理框架。[12]本文认为,这种方法比费舍尔方法(经典统计方法)在直观上更加令人满意。
如假设发现一种新药,它因在结构上与已有的治疗沮丧的药物相似(也可能对该病有疗效),或者假设,该药在涉及小范围的患者的实验性研究中已经出现令人鼓舞的疗效(正如我们先前所说的,没有任何迹象表明,该药品好像有效,该药品或治疗实验的大规模实验是不可判定的,或者经济上或者伦理上。)。测试药品疗效的实验将规范地采用以下形式。实验由两组受试者组成:一组是测试组,将服用药物,而另外一组,控制组则不服用。实践中,实验将比这更为复杂。例如,控制组将服用“安慰剂”;患者不知道他们属于药品组还是安慰剂组。严格实施的实验会确保,甚至医生也不会意识到他所管理的是药品还是安慰剂(也被称为双盲实验,Double Blind)。更多的预防措施也将用来确保,医药专家所考虑到的其他任何可能影响康复的因素在每组中都平等出现,即所有这些因素都在控制之中。
设计一个复杂实验:我们对康复机会上药品的因果反应感兴趣,那么,我们不仅需要知道患者服用药物后如何反应,还需知道当该药物缺失时患者如何反应,并且,比较组中的条件要有意模拟后者的情景。在某些方面,匹配或控制实验的要求也是直观的。临床试验中有选择地控制,不管怎样,的确有其合理性基础。下文给出的是由贝叶斯定理产生的分析。
1.临床试验的贝叶斯分析
贝叶斯方法致力于假设的概率以及鉴于新信息的出现,该概率如何通过贝叶斯定理更新的。让我们看一下当前例子中,这种更新工作是如何进行的。首先,为方便表述我们假定H和H′是任何机会为真的单独假设。在那个事件中,贝叶斯定理使用以下形式:
药物假设也能采用适当的措施来提高P,即用来提高药物假设所称的与康复相关机会的措施(称之为L,M和N)在两组中平等出现。在疾病的病毒毒性,或者是患者的强壮程度(抵抗疾病的免疫力),或者类似的难以测量而医生却能通过长期经验觉察到的考察因素中,我们把构建对比组的工作留给这些医生去完成。如果生成组包含数量不等的更容易受伤患者,那也不足为奇。因为医生应遵循“希波克拉底氏誓言”(Hippocratic Oath),并保证其患者得到最好治疗。如果医生也采纳原实验治疗的结果,他们就会倾向于,而先入为主地根据某些医疗需要把患者分组在各实验组中。实验中也可能存在着喜欢或反对测试治疗的内在偏见,这也就是随机分配的目的之所在。
并非每一个可接受因素都能通过组匹配;也并非一个综合匹配在任何意义上都是必须的或者是称心的。因为,假如一个可能预期因素,其因果影响在假设中得以刻画并假设该假设不大可能发生,如果是这样的话,贝叶斯定理中的全体相关项已经变得极小(因为,一个在假设因果影响的可能预期因素和假定该假设不大可能发生;在该事件中,贝叶斯定理中的整个相关项已经极小)。那么通过使用适当形式的控制进一步减少它的这种优势将相当小。并且,在绝大多数的情况下,这种微弱的优势将由于额外费用的增加以及更详尽实验设计所带来的麻烦抵消。例如,尽管能引入一种控制因素以减少临床人员处理两组有不同均值鞋码的概率,但这种预防措施对药物假设的后验分布的影响几乎可以忽略不计,因为鞋子的尺寸不大可能影响实验的结果。
总之,贝叶斯理论解释了为何临床实验中的实验组要在某些方面匹配和为何不必在所有的方面匹配。这就与断定的常识一致:设计临床实验首先要关注的应当使之不可能,即实验组在趋于影响结果的因素上不同。在两组之间获得这种平衡的设计,尽管我们倾向于把他们看作是合理匹配或控制的,但却被Lindley (1982)冠之以“偶然事件”。
实验中,对治疗对象的随机化分配中,显然把这条规则作为一种更优的平衡实验组的方法是有益的,某种意义上说,它阻止了根据患者患病的轻重情况的分配。而随机化分配并非不可或缺的,它也并非是临床试验构造治疗组过程中唯一、最优的一以贯之的方法。
2.无随机化过程的临床实验
临床试验解决方案中,贝叶斯和经典方法之间的差异有两个方面:首先,一个贝叶斯分析允许结果累加时对其进行持续的评估,允许实验治疗效果或其他方面一旦明朗,就终止实验。相比而言,如果不管该阶段的记录结果,仅仅恪守经典实验原则的要求,那么就无法对突发停止的临床实验做出解释。为使用经典技术,通过对试验结果进行临时分析而专门设计的序列临床试验是无效的。
第二个差异与临床试验中与比较组的组成有关。从贝叶斯主义的观点来看,最基本的要求是各组应当尽量在预测因素的前提下充分匹配。贝叶斯原理所坚持的不受完全随机化要求的约束,却是其对手——经典方法所否定的,例如,关于药品治疗的决策性信息能从使用历史控制组(一定数量已经接受替代治疗或根本没有接受替代治疗的患者)的实验中获得。这种历史控制实验组能够通过医疗记录及其与测试组(有可能是历史控制组)在预测因素条件下充分匹配所提供的信息来构建。
由于历史控制实验的这种“先天性”谬误,经典医药统计学家们已广泛摒弃该方法,同时他们把发生的随机化实验看作“评估新药的唯一途径”(McIntyre,1991)。[13]但这种观点不仅是认识上是站不住脚的。而且在日常医学实践中也是能被驳倒的,医生的部分知识和经验是持久地、非正式融入了对当前的和过去的患者的对比和总结。
甚至一些经典统计学家如Byar等,(1990)[14]也承认,时序对照组在某些情况下更可取,尤其当获悉一个随机化实验在控制组中将给病危患者使用无任何疗效的安慰剂、其他的则给予有价值的实验治疗时。Bvar及其同事解释说,一旦出现“患者的潜在收益将足够做出一个非随机化实验结果的无歧义性解释”的正当预期,标准的实验结构就应当终止。但他们并没有说明,推理的哪一个过程能产生结果的无歧义性解释。在Byar做出“正是随机化步骤才产生了显著性检验”的经典论断之后,经典显著实验就没有进一步拓展了。任何其他经典推理的工具都似乎是不可取的(似乎找不到任何其他有效的经典推理的工具)。更有可能的是,Byar等他们自己接受非规范的贝叶斯解释,因为他们说,历史控制实验是可接受的,只有实验方法才有很强的先验可信性:“实验方法的科学基本原理须充分坚定地致力于预期的正确结论。”
历史控制实验原理的可容许性,不仅是贝叶斯观点有趣的理论意义的一个方面,而且也有重要的现实显著性。首先,该实验对新对象数量的要求不高,体现在把不常发生的医学条件作为研究受众时,这一点尤为重要。并且实验越小,通常费用就越低;其次,历史比较组不向受试者透露无实际疗效的安慰剂,且能达到临床人员所预期的较低层次的对比治疗结果,更强调人文关切,并缓和在参与实验的患者中普遍发现的不情愿情绪。历史控制实验,无论如何都不容易设置。对比组只能借助以前患者的详细医学记录的帮助形成,比日常保存的记录越详实,就越容易获得。
不管怎样,历史控制实验不容易建立。
同经典方法有明显的不同,贝叶斯定理为临床的和类似实验提供了一致的、直观的指导方针。二者之间的第一个显著差异是第二种方法仅认定限制的必要性。
而第一种则解释那种需要以及以合理的方式在必须控制和不必控制因素之间做区分;另外一个差异是,贝叶斯方法没有给治疗的实验对象随机分配共同的硬性规定,本文把这一规定看作是一个重要指标。因为没有找到更合理的理由把随机分配看作不可或缺的,而倒是有更好的理由不这样看待。
估计参数的贝叶斯路径将不同的置信度与不同的值及其取值范围相联系,尽管我们已经看到经典统计学家们所寻求的,在这一点上没有成功。通过单一原理——贝叶斯定理,应用于所有推理问题的贝叶斯定理做估计。因此,统计和决策理论的贝叶斯处理方案是相同的并承载着同样的哲学思想。
贝叶斯估计也同我们的直观信息相吻合,它为直观真实的充分条件和估计量中最大精度的自然偏好作解释。而不为我们所讨论的、建立在误差基础上的“非偏见”和“一致性”的标准找一个合适的位置。贝叶斯方法也避免了经典方法中的不合理的特征,即对结局空间以及对主观停止规则的依赖。
贝叶斯方法中存在着一部分人不接受,但却是我们认为完全实事求是的主观要素。拥有同样信息的不同的科学家,常以各自不同的方式评估理论。牛顿和莱布尼茨对引力理论的迥然不同的阐述;爱因斯坦在其《哥本哈根解释》中的量子论观点与他绝大多数同事的观点背道而驰;多年以来,杰出的天文学家捍卫大爆炸理论,而同样卓越的科学家则以同样的精力为其竞争的“稳态理论”辩护,类似的观点分歧一直出现在科学界,如医药学、生物学和心理学等分支学科中。贝叶斯理论预言:很多这样的分歧将随着通过新证据修正的概率得以解决,但也允许这样的可能性存在,即倾向于支持或反对某些理论的人们坚持的理由有时是怪异的,甚至获得大量相关信息后仍旧如此。你或许认为这种异常行为是“有毛病”,每一种理论都有与之相关的知识体系的单一价值,每个有责任心的科学家都不应让这种私人的、主观的因素影响其信念。这种看法其本身就存在偏见,因为没有人能给出清晰的辩护,更不用说给出完整的证明了。
贝叶斯的思想和方法被轻视和抵制数十年后,他们的价值现在逐步为包括正统的统计学家广泛承认,以至于很多人想把贝叶斯主义(Bayesianism)和频率主义(Frequentistism)置于同一水平上,笔者(2012)在《贝叶斯方法和频率方法比较研究》一文[15]中也对二者的关系进行过简单比较。但以上这并不是我们满意的结论。我们团队当前的研究给出的理由是:前者(贝叶斯主义)是有充分根据的,而后者(频率主义)则不是;并且频率主义的研究方法最终会让位于贝叶斯主义方法。在以《动物饲养中的贝叶斯论战》为题的文章中,Blasco给出一个貌似“公平”的例子(本文并不认可)。他争辩道,现实中没有必要选择“站队”:如果动物饲养员对有关归纳的哲学问题不感兴趣,而只对解决问题的所使用的手段感兴趣,那么,不管是贝叶斯的还是频率派的推理都是有根据的,并且没有必要证明为什么选择这个或那一个学派。现在两者在处理一些复杂案例的例外上都不存在操作困难……选择一派或另一派与否,应与是否一个学派有而另一个没有问题的解决方案、解决问题的难易程度以及科学家使用某种方式表达结果的舒适程度有关。 (Blasco.2001)[16]
但,Blasco所谓的“与归纳相关的哲学问题”应是实用科学家感兴趣的,因为尽管频率和贝叶斯工具得出表面上相似的结果,且在一些实验中,推崇表面相似的实验,但二者在其他实验中也给出关键的不同建议。我们已经证明了频率工具不能解决任何问题。他们标榜的结论(“未知参数的最佳估计是某某”;“某某是一个99%的置信区间”;“h在5%的水平上被拒斥”,等等)并没有任何归纳显著性。诚然,一个人常能“轻易地”得出频率结论,但这并不重要,也不能使其赋以科学的含义。很多科学家也觉得使用频率的结论顺手,而我们认为,这因为他们曲解并且赋予该解释不可能承载的意义,如Lindley(1975)就统计的发展未来问题的讲话中开篇就说,“21世纪是贝叶斯的”。[17]
标签:贝叶斯论文; 贝叶斯定理论文; 贝叶斯估计论文; 先验概率论文; 概率分布论文; 样本容量论文; 概率计算论文; 推理论文; 概率论论文;