当前位置: > 硕士毕业论文 > 37900字硕士毕业论文统计假设检验中显著水平α的选择

37900字硕士毕业论文统计假设检验中显著水平α的选择

论文类型:硕士毕业论文
论文字数:37900字
论点:检验,假设,样本
论文概述:

通过模拟给定样本量下,选择传统的显著性水平α值,随着样本比例的变化,对原假设检验结果出现错误的可能性;在给定样本比例下,选择传统的显著性水平α值,随着样本量的变化,对原假

论文正文:

1导言

1.1论文的背景和意义
在统计检验中,降低错误判断概率的方法是增加样本量。然而,抽样理论告诉我们,样本量不能无限制,否则抽样调查将失去其意义。同时,在实际情况下,增加样本量意味着增加成本、时间等方面的投资,这必然会导致测试成本的增加。在许多情况下,样本量没有增加。在假设检验中,相对较小的显著性水平α值(例如,α=0.01、0.05、0.1等)。)仍然是传统意义上的选择,因此增加了错误判断的机会,并大大降低了我们结果的可信度。此时,如果我们想降低测试中出错的概率,就必须及时调整α值,以获得更好的测试结果。为统计分析进行假设检验提供科学方法和重要参考。

1.2国内外文献综述

1.2.1显著性水平选择综述
近年来,国内外学者对假设检验中与显著性水平α相关的问题做了大量研究,并就如何选择显著性水平α进行了一系列讨论:刘云哲(1987)认为在选择显著性水平时应考虑两类错误。如果由第一类错误引起的损失小于由第二类错误引起的损失,则使第一类错误的概率更高是合理的;然而,第一类错误发生的概率应该高于或低于第二类错误的概率,这只能由两者造成的预期损失之和来确定。在计算不同概率组合下的总损失,然后进行比较分析的情况下,应选择预期总损失最小的概率组或相应的显著性水平作为检验标准。王继勋(1990)提出在测试成本不增加的情况下,计算显著性水平α下的预期损失L(α)=Mα+Nβ,通过求解L(α)的最小值来确定α的值,并用数学方法证明了这一点。为了选择合适的显著性水平α临界值,张亚明和岳德泉(1995)以各检验的期望损失值为目标,在正常人群参数假设检验下分别求解α值,从而最优控制α。徐浪和马丁(2001)分析了一个案例,分别选择了0.01和0.05水平的假设检验,并简单解释说,如果“做假”的成本很高,就会取较大的α。如果“放弃真理”代价很高,那么选择较小的α,容忍较大的β。林乐铭(2003)讨论了这两类误差之间的关系,如何选择显著性水平,通常为0.01、0.05、0.1、0.2、0.5等。可根据可靠性的要求进行测量,同时应选择合适的样本量,使其符合给定的α和β值。辛玉平(2005)认为显著性水平α不尽可能小。在今天由计算机和统计软件进行的假设检验中,必须计算“假设检验的ρ值”。P值可以用来判断原始集合α值下的假设检验是否值得保留。通过实例,显著性水平不应局限于传统意义上的0.01和0.05。刘联华和罗文强(2006)为了讨论假设检验有意义的条件,通过一个例子,分析了在不同的原始假设下可能获得完全相反的统计推断结果的原因,并给出了假设检验有意义的条件。给定α,选择合适的样本量,并尝试使用单侧检验来实现采样成本和类型2误差之间的最佳平衡。刘许晴(2008)讨论了传统的“信心”或“显著性水平”,发现这一传统法律存在一些缺陷。通过对原始样本数据进行正交变换,提出了现有观测数据的期望可靠性、最大可靠性、最小最大可靠性和最大可靠性以及现有观测数据方差的最大可靠性和最小最大可靠性的概念,并通过实例和数据仿真验证了作者的观点。李晶晶和郭文(2010)讨论了这两类误差与样本量之间的关系,并在控制α和β的取值条件后,分别给出了均值检验、方差检验和百分比检验的样本量确定公式。同时,一些国外学者也讨论了假设检验的显著性水平。戈登·道格拉斯·门泽斯、丹尼尔·约翰·齐佐(2008)、莫莉·霍特(2008)、迪米特洛夫、小格林、小里科夫、斯坦切夫(2009)利用计算机模拟技术模拟了一定样本量下假设检验中显著性水平的临界值,并分析了不同显著性水平α下假设检验的结果。约瑟夫·穆奇,符晓薇·贝克(2012)为了选择合适的α值,假设检验的显著性检验误差被最小化。α的真实值是通过设计α和β之间的新关系来确定的。发现α值分别为0.191、0.266和0.323,比传统的0.05检验误差小。

2相关基础知识

2.1显著性水平α意为
显著性水平是统计学中的专有名词,α通常称为显著性水平。在假设检验中,它的意思是当原始假设正确时被拒绝的概率或风险。事实上,这是假设检验中出现“真正放弃”错误的可能性。它的概率通常用α表示。α可以是单尾的或双尾的。它是由人们根据测试的要求决定的。假设检验要求研究者根据实际情况选择α临界值的大小。在传统意义上,α=0.01或0.05,等等。通常被选中。换句话说,当决定接受原始假设时,它的正确概率是99%或95%。

2.2 P值的相关含义
P值检验的思想方法是戈塞特于1908年提出的,已经存在了100多年。p值检验是频率学派处理假设检验的方法之一。p值检验在数理统计中起着重要的作用。我们知道假设检验是根据另一种假设来构建一个拒绝域。拒绝区域的构造通过使用由测试统计的观察值和统计分布的分位数形成的关系来确定。分位数与显著性水平相关。因此,显著性水平(控制犯第一类错误的概率)将影响决策者的判断。这里给出的P值是在原始假设为真的情况下,统一测量的观测值是最小值或最大值的事件的小概率,或者是统一测量的观测值是最小值或最大值的小概率事件, 这个小概率是P,检验的P值可以定义如下:在假设检验问题中,可以用来拒绝原始假设的最小显著性水平称为P值。

3显著性水平与样本量和样本比例的关系.........9
3.1显著性水平α和样本量之间的关系....9
3.2显著性水平α与样本比例的关系.......12
3.3摘要.......18
4α分布表的编制及模型的建立....21
4.1 α分布表的编制.........21
4.1.1模拟参数的设置....21
4.1.2 α分布表模拟....21
4.1.3三维图纸......28
4.2模型建立和分析........29[/比尔/] 4.3案例分析.........32
4.3.1案件........33[/比尔/] 4.3.2结果分析....34
5结论和未来工作....35
5.1结论.........35
5.2本研究和进一步工作的缺点.........35

结论

通过模拟给定的样本量,选择传统的显著性水平α值。随着样本比例的变化,原始假设检验结果出现误差的可能性增大。在给定的样本比例下,选择传统的显著性水平α值。随着样本量的变化,原始假设检验结果出现误差的可能性增大。对上述两种情况进行了分析,结果表明:样本量越大,假设检验结果出现误差的可能性越小,准确度越高;样本比率离0.5越远,即一半,测试结果出错的可能性就越小,离0.5越近,结果出错的可能性就越大,准确性就越差,误判的可能性就越大。通过计算机和统计模拟,模拟一定显著性水平下不同组合的误判程度,并根据模拟结果选择合适的显著性水平α值,建立样本量n、抽样比例pi和显著性水平α值之间的模型,为选择合适的显著性水平α提供参考方法和依据。
(1)本文设定的样本量n不是[100,2000区间内的任何样本值。对于n2000的大样本,同时设置的样本采样率pi在[0.4,0.6]区间内,而不是[0,1]区间内的任何采样率,这需要在将来进一步讨论。
(2)任何样本量n和样本比pi下显著性水平α的选择需要进一步讨论和改进,以便提供更完善和科学的依据。
(3)当给出显著性水平α时,为了保证P值的准确性,可以在进一步的研究中修改P值,以提高P值的准确性,保证原始假设检验的准确性。
(4)本文的研究主要基于正态分布假设,通过统计模拟进行的讨论和研究没有考虑传统显著性水平α在其他分布条件下(如其他分布如T-分布)是否仍然存在,存在误判的可能性。在其他分布的假设下,这也是下一步要研究的问题。

参考
[1]约翰·弗拉斯:统计学和实际http://sblunwen.com/tjzylw/显著性检验:使用随机试验的建议技术[]。中西部教育研究协会年会,2000(10):25-28
[2]西蒙,s,约翰逊,罗瑞亚。多元有序替代物的新测试[。《统计学理论与方法中的交流》,2004(33):227-239
[3]格林-巴利综合报告..实践中的研究:理解意义测试程序评价[。发展教育杂志,2004(3):29-31
[4]情绪硕士格雷比尔·阿。统计学理论导论[·马]。纽约:麦格劳·希尔,1963年,[/[5]迪米特洛夫。引用该论文李维科,李维科,史坦切夫。信息理论与应用,2009(10):404-413。
[6]克拉克·格里摩尔,大卫·马迪根:统计推断和数据挖掘[。美国计算机学会通讯,1996(11):36-41
[7]美国法学硕士,华盛顿.凯尔顿.模拟模型与分析[J]. 3版,纽约麦格劳-希尔,2000
[8]艾米·贝勒。博士..金洋喜。教学代理设计:代理现实主义、性别、种族和教学角色的影响[。国家科学基础基金,2010(8):47-53
[9]刘乐平。张龙。蔡高正。多假设检验及其在计量经济学中的应用[。《统计研究》,2007年,第24页,第4期,
[10]戈登·道格拉斯·门泽斯。丹尼尔·约翰·齐兹佐。只有经济学家依靠理论意义吗?[。社会研究网络讨论论文,2008(8)