心理学研究方法笔记七(肖内西版本)
第七章独立组设计
独立组设计也被称为被试间设计,指每组被试代表自变量所界定的一种条件。
(一)实验研究的逻辑
●研究者在实验中通过操纵一个自变量来观察它对行为的影响,其影响效果通过因变量来评估。
●控制是实验最关键的核心;实验控制通过操纵、保持条件恒定和平衡获得。
●实验控制使研究者能够做出因果推论,即自变量导致了因变量的变化。
●当满足因果推论所需的三个条件时,一个实验就具备了内部效度。这三个条件是共变、时序关系和其他可能原因的排除。
●当发生混淆时,所观察到的共变就存在其他可能的解释,这将降低实验的内部效度。通过保持条件恒定和平衡可排除其他可能的解释。
(二)随机组设计
●随机组设计中有比较组,每一个组只接受自变量一种水平的处理,其他方面都相同。
●随机组设计可使研究者做出自变量对因变量产生影响的因果推论。
●将被试随机分配至各条件下,以形成比较组。其作用是为了在操作自变量的各条件下,平衡或平均被试特征和个体差异。
●随机区组设计可以平衡被试的个体差异和实验操作过程中可能发生的混淆,并使每组人数相等。
这里R1和R2指将被试随机分配到实验条件下(即1和2);X1指自变量的第一个水平(例如,电影的暴力版本),X2是自变量的第二个水平(例如,电影的非暴力版本),有时也可能是不做处理(控制)。然后对每一组被试进行观察(O1)。与单组的前测——后测设计不同,随机组设计是一种好的实验范例。
●随机组设计的缺点:由于不同被试群之间原本存在的差异,将不同的被试群随机分配到自变量的不同条件下会导致潜在的混淆。选择性被试缺失会威胁实验的内部效度,而技术性被试缺失则不会。
●解决方法:随机组设计通过平衡自变量各条件下的额外变量能够提高内部效度。额外变量能否通过平衡或者保持条件恒定得到控制,关系到实验的外部效度和灵敏度。安慰剂控制组用于控制“需求特征”问题,双盲实验既控制需求特征也控制实验者效应。
(三)实验结果的分析与解释
●研究者能否得出自变量影响行为的结论,数据分析和统计在其中起关键作用。
●确定研究结果是否可靠的最好方法是进行重复实验。
●描述结果:用来概括实验结果的两种最常见的描述统计量是平均数和标准差。效应大小显示了自变量和因变量之间关系的强度,而且它们不受样本大小的影响。d是一个常用的效应大小指标,它考察与实验的平均变异相关的两组平均数差异。元分析使用效应大小指标来总结关于相同自变量或因变量的诸多实验结果。
●确认结果所揭示的内容:研究者使用推论统计来确定自变量对因变量是否有显著影响。根据样本数据做出推断的两种方法是虚无假设检验和置信区间。研究者使用虚无假设检验来确定实验的组间平均数差异是否比误差变异导致的差异大。一个统计上显著的结果是指虚无假设为真的可能性很小。研究者通过检查实验中不同样本的置信区间是否有重叠来确定一个自变量是否对行为有影响。
●数据分析会遇到的错误:当研究者使用推论统计时会出现两种类型的错误。当我们称一个结果具有统计学上的显著性且虚无假设为真时,我们会犯I型错误。I型错误就像错误报警————当没有火时说有火。当我们没有足够的证据来拒绝虚无假设,而实际上却不是如此的时候,我们会犯II型错误。
(四)确立实验结果的外部效度
●当一个实验结果能超越特定的实验环境应用到其他个体、场景和条件中时,这个实验结果就具有外部效度。
●在一些研究(如验证理论)中,研究者可能更强调内部效度;但对另一些研究者来说,他们可能会选择抽样或重复的办法来增加外部效度。
●研究者能够通过做现场实验增强他们在现实世界中所做研究的外部效度。
●部分重复是确定实验外部效度的有效方法。
●研究者常常寻求变量间关系的普遍性结论,而非一些特定条件下、操纵下、选择场景和样本等情况下的具体结论。
(五)匹配组设计
●当被试太少,无法采用随机分配时,可以使用匹配组设计以组成比较组。匹配组设计的逻辑很简单,研究者不采用随机分配来形成比较组,而是通过匹配被试使组间达到等同。
●通过因变量任务匹配被试,是组成比较组的最好方法,但是匹配任务都必须和因变量任务相关。
●被试通过匹配任务匹配后,需要被随机分配到不同的自变量条件下。
(六)自然组设计
●自然组设计通过选择(不是操纵)个体差异变量(被试变量)而形成。
●自然组设计是一种相关研究,研究者寻求自然组变量和因变量之间的共变。
●不能根据自然组变量的效应做因果推论,因为群体差异可能存在其他解释。
两者的本质区别在于对实验误差(具体的指被试差异对实验带来的误差)的控制所采用方式的不同。独立组采用随机化的方式控制误差;相关组采用恒定的方式控制误差。具体的表现在对被试的分配方式上,这一点楼上已讲到了。至于这种差异为什么对实验设计有很大影响呢,个人觉得,独立组随机化的误差控制方式对被试数目要求是较大的,而且做起来很难保证真正的随机,这时我们则可以采用相关组的方式控制误差。但相关组同样有缺陷,即相关被试并不好找。两种方法从不同角度控制实验误差,又各有适用特点,正好可以满足不同条件下对误差的控制。所以这一差异对实验设计意义重大
问题二:实验是科学研究要有什么和什么两种类型 答案:模拟实验 对比试验
实验是科学研究中常用的方法,它主要有(模拟实验)和(对比实验)两种类型。
不明追问
问题三:实验的基本特征是什么?科学实验基本可以分成哪几类 实验,即科学实验,英文名称scientific experiment,是人们为实现预定目的,在人工控制条件下,通过干预和控制科研对象而观察和探索科研对象有关规律和机制的一种研究方法。它是人类获得知识、检验知识的一种实践形式。
科学实验之所以受到人们的重视,之所以能比自然观察优越,这是和科学实验本身的特点密切相关的。
一,科学实验的特点
1,纯化条件
科学实验具有纯化观察对象的条件的作用。
自然界的对象和现象是处在错综复杂的普遍联系中的,其内部又包含着各种各样的因素。因此,任何一个具体的对象,都是多祥性的统一。这种情况带来了认识上的困难,因为对象的某些特性或者是被掩盖了起来,或者受到其他因素的干扰,以致对象的某些特性,或者是人们不容易认识清楚,或者是通常情况下根本就不能察觉到。而在科学实验中,人们则可以利用各种实验手段,对研究对象进行各种的人工
变革和控制,使其摆脱各种偶然因素的干扰,这样被研究对象的特性就能以纯粹的本来面目而暴露出来。人们就能获得被研究对象在自然状态下难以被观察到的特性。
例如,肉汤腐败这个常见的现象究竟是什么原因引起的?巴斯德认为煮沸的肉汤后来又变质,这是由于空气中的微生物进入肉汤造成的结果。但是,在自然的条件下,肉汤总要接触空气,而空气中又必然会有无数尘埃,尘埃上则携着微生物。所以在自然条件下,要使空气中的微生物不进入肉汤里是不可能的。于是,巴斯德就求助于实验的纯化作用。他设计了一种曲颈瓶,把肉汤注入瓶内并加热杀菌。由于瓶子是曲颈的,它使外界空气中的尘埃很不容易进入瓶内。结果肉汤并不腐败。这就是通过一定的实验手段,排除了空气中的微生物对肉汤的作用,观察到了肉汤在比较纯粹的状态下是不会腐败的。
2,强化条件
科学实验具有强化观察对象的条件的作用。
在科学实验中,人们可以利用各种实验手段,创造出在地球表面的自然状态下无法出现的或几乎无法出现的特殊条件,如超高温、超高压、超低温、超真空等等。在这种强化了的特殊条件下,人们遇到了许多前所未知的在自然状态中不不能或不易遇到的新现象,使人们发现了许多具有重大意义的新事实。
例如,人们能通过一定实验手段,造成接近绝对零度的超低温,从而使我们能把几乎所有的气体液化。在这种超低温下,人们也能发现某些材料具有特殊优良的导电性能,即具有无电阻、抗磁等超导态特性。
3,可重复性
科学实验具有可重复的性质。
在自然条件下发生的现象,往往是一去不复返的,因此无法对其反复地观察。在科学实验中,人们可以通过一定实验手段使被观察对象重复出现,这样,既有利于人们长期进行观察研究,又有利于人们进行反复比较观察,对以往的实验结果加以核对。
例如,英国化学家普利斯特列在1774 年用聚光镜加热汞的氧化物而分解出一种气体,它比空气的助燃性要强好多倍。普利斯特列把这种气体称之为失燃气体。当普利斯特列把这个消息告诉法国科学家拉瓦锡后,拉瓦锡马上动手重复了这个实验,使他终于发现加热氧化汞而分解出来的能助燃的气体不是别的而是氧气。
正是由于科学实验具有这些特点,因此科学实验越来越广泛地被应用,并且在现代科学中占有越来越重要的地位。在现代科学中,人们需要解决的研究课题日益复杂,日益多样,使得科学实验的形式也不断丰富和多样。
实验的分类
实验分类编辑
人们对利实验类型的分类,还缺少较系统的研究。我们也只是粗略地介绍以下两种分类:
按实验目的
按照实验的目的不同,可以把科学实验分为定性实验、定量实验和结构分析实验。
定性实......>>
问题四:化学实验分类,两种有什么不同??? 5分 前一个侧重制备,后一个侧重技术
问题五:实验设计的基本类型 常用的心理实验设计有几种基本类型,而这些类型常常是被综合使用的。单组设计与对比设计根据是否设置控制组(对照组)划分的两种基本设计类型。①单组设计。在所选被试编组时不设置控制组,其基本模式是前测-处理-后测,通过前后两次测量的差异检验实验处理的效果。统计结果一般采用t检验法。单独使用这种类型的实验设计已不多见。因为在前测与后测中间有许多因素,如成熟、前测对后测的影响、测量工具的变形、情境的改变等,与实验处理的效果相混淆,从而降低实验的内在效度。②对比设计。这是心理实验最基本的设计之一。它把被试分为两组,一组为实验组,施以实验处理(也称处理);另一组为控制组,不加实验处理。为使两组被试尽量同质,便于比较,一般采用随机分派法分组,通过测量两组的差异检验实验处理的效果。其基本模式如Ⅰ。即使随机分派被试,但样本不很大时也很难保证两组在处理前同质,因而两组测量的差异不一定全是处理的结果。为了弥补这一不足,常在处理前先对两组进行测量,即模式Ⅱ。如果前测的结果相近,可直接比较两组的后测,并用t检验法检验其差异,这时的差异即可认为完全是由处理造成的。如果两个前测不同,就要把前测作为共变量,进行独立样本单因素的共变量分析。这种设计的优点是克服了大部分影响内在效度的无关变量。但由于有前测,又增加了前测的反作用效果,使外在效果有所降低。所谓测验的反作用效果是指处理前进行的前测可能增加或减少被试对处理的敏感性。两种基本设计类型根据分组与处理方式划分的两种基本设计类型。①完全随机化设计。又称被试间设计或独立组设计。它起源于抽样理论,即依据概率统计的原则,把被试随机分派到各组,接受各组应进行的处理。由于是随机分派,所以在理论上各组接受处理前各方面是相等的。如果在同样条件下对两个或两个以上组施以相同处理,则各组效果的平均数在统计上应没有显著差异;如果对两个或两个以上组分别施以不同的处理,所得效果平均数的差异可被断定是由于处理的不同而造成的。这种设计的实验结果一般采用独立样本的t检验或方差分析。在对比设计中所列的模式Ⅲ和Ⅳ,都可以说是完全随机化设计,也可以算作对比设计。模式Ⅲ的特点是实验组不进行前测,控制组不进行后测。由于被试是随机分派的,实验组与控制组被看作同质,所以比较控制组的前测与实验组的后测,即可推断处理的效果。这种交叉前后测法虽在理论上能克服前测的不良影响,但较为理想的随机对比设计则是模式Ⅳ。它是把被试随机分为4组,即两个实验组和两个控制组,每两个之中都是一个有前测另一个无前测。模式表中的Y1、Y2、Y3、Y4均为后测的结果。用独立样本2×2方差分析法检验“前测与无前测的差异”、“实验处理与无处理的差异”以及“前测与处理交互作用是否显著”,就能既克服前测存在的反作用,又防止实验组与控制组可能出现不同质的状况。这种设计虽然比较理想,但它的被试有4组,人数多、实验次数也多,因而不够经济。②随机区组设计。又称被试内设计。它先把被试按某些特质分到不同区组,使各区组内的被试更接近同质,而区组间的被试更加不同。然后将各区组内的被试随机分派接受不同的处理,或按不同顺序接受所有的处理。这样,对于一个区组来说是接受所有处理的。这一点与完全随机化设计不同。完全随机化设计中各组只分别接受各自所应该接受的处理。Ⅴ是随机区组设计的基本模式。它与完全随机化设计的不同还表现在把“区组”这一变量也纳入了实验设计。这样,总变异就可以分成“处理间”、“区组间”及“误差”。与完全随机化设计相比,它能把由个别差异造成的变异估计出来。划分区组的依据与要考察的反应变量密切相关,即当同一区组的被试在第1个实验处理中......>>
实验设计的基本类型有三种,分为因素设计、准实验设计和非实验设计。
1、因素设计
根据实验中自变量的数量可以划分为单因素设计和多因素设计。单因素设计简明易行,但由于实际生活中影响心理活动的因素通常为多个,所以当情况比较复杂时,最好使用多因素实验设计。
2、准实验设计
研究者事先认识到某些无关变量会影响实验结果,却又难以在实际妥善控制时,可采用准实验设计。准实验的主要特点是没有采用随机化程序,即被试的选择和编组、处理分配等都不是随机安排的。
3、非实验设计
非实验设计是一种自然描述,用来确定自然存在的临界变量及其相互关系。非实验研究的方法很多,如自然观察法、相关法、访谈法、问卷法、测验法、个案法和传记法等。
扩展资料
实验设计的主要功能是对变量的控制,是在控制条件下有效地操纵或改变自变量,使因变量(即反应变量)的变化得到观察。例如,研究两种教学方法对儿童学业成就的影响时,实验设计者应安排使其他条件尽量相同,如选择家庭和学校环境相似、学业基础相似,年龄相同的两组儿童,只控制使用两种不同的教学方法,然后考查二者对学习结果的影响。
实验设计的优点
1、科学合理地安排实验,从而减少实验次数、缩短实验周期,提高了经济效益。
2、从众多的影响因素中找出影响输出的主要因素。
3、分析影响因素之间交互作用影响的大小。
4、分析实验误差的影响大小,提高实验精度。
5、找出较优的参数组合,并通过对实验结果的分析、比较,找出达到最优化方案进一步实验的方向。
6、对最佳方案的输出值进行预测。
参考资料来源:百度百科--实验设计
广义实验是指:设计来检验一个理论或证实一种假设而进行的一系列操作或活动。
广义实验根据分组与处理方式划分的两种基本设计类型。完全随机化设计。又称被试间设计或独立组设计。它起源于抽样理论,即依据概率统计的原则,把被试随机分派到各组,接受各组应进行的处理。
由于是随机分派,所以在理论上各组接受处理前各方面是相等的。如果在同样条件下对两个或两个以上组施以相同处理,则各组效果的平均数在统计上应没有显著差异。
广义实验单组设计与对比设计:
根据是否设置控制组(对照组)划分的两种基本设计类型。单组设计。在所选被试编组时不设置控制组,其基本模式是前测-处理-后测,通过前后两次测量的差异检验实验处理的效果。统计结果一般采用t检验法。
单独使用这种类型的实验设计已不多见。因为在前测与后测中间有许多因素,如成熟、前测对后测的影响、测量工具的变形、情境的改变等,与实验处理的效果相混淆,从而降低实验的内在效度。
区别:区组随机法为双因素设计,考虑的因素有两个,一个是处理因素,一个是区组因素。分层随机法为单因素设计,仅考虑处理因素。
随机化区组设计,又叫组内设计,相关组设计。是按被试的某些特征进行分组,保持组内同质(组间是否异质视实验性质而定),使每个区组接受所有的实验处理。这样就控制了实验中的个体差异,但是无法解决处理间的污染问题。一般采用平衡法加以平衡处理间的相互影响。如ABBA设计、拉丁方设计等。
与随机化区组设计对应的是完全随机化设计,又叫组间设计、独立组设计。实验中每个被试只接受一个处理,不存在处理间的污染问题,但无法排除个体差异,一般采用匹配法加以控制。
优点
完全随机化试验的局限性在于不能保证不同水平之间的试验条件或环境完全相同,不存在系统性偏误影响。因此,提出了随机化区组设计来检验和消除试验条件或环境差异对试验结果的影响。
区组(Block)是指按照一定规则将试验单元划分成的同质组。通常为环境、条件基本相同,时间、空间相距较近的范围。
随机化区组设计(Randomized Block Design)是指在比较一个因素的K个水平之间差异时,将试验单元随机地配置到m个区组中,每一区组含有K个试验单元,m个区组完成m次重复试验。
根据样本所提供的信息,运用概率的理论,进行分析论证,在一定可靠程度上,对总体分布特征进行估计、推测。
内容包括
1) 假设检验
2) 总体参数估计
目的:根据已知的情况,在一定概率上估计推测未知的情况。
相同被试,在不同时间或场合下,使用同样的测量工具,重复测量相同的某心理特质,所得结果的一致性和稳定性程度。
效度是指测量工具测出它所希望测量的心理特质或行为特征的效果和程度。
难度是指题目的难易程度。
是题目性质与被试群体水平共同作用的结果。
6. 区分度
区分度是指题目对被试特质差异的区分能力。能区分不同能力水平的题目的区分度高。
若所有被试在某个题目上均答错或均答对,则此题不能区分不同特质的被试,即此题目无区分能力。
是所欲研究的某一类对象的 全体 。
从总体中抽取的一部分个体,称为总体的一个样本。
在心理与教育研究中,样本可以是实验中所选取的一组被试的实验结果,或者一个被试的多次结果等。
反映一组数据分布集中趋势的数量。等于所有数据之和,除以数据个数。
median又称中点数,中位数,中值,符号为Md。是常用的集中量数。
中数是按顺序排列的一组数据中居于中间位置的数,即在这组数据中,有一半数据比它大,有一半数据比它小。
mode,又称为范数、密集数,通常数等,常用符号Mo表示。
是指在次数分布中出现次数最多的那个数的数值。
也是一种集中量数,可以用来代表一组数据的集中趋势。
又称两极差,用符号R表示。它是说明数据 离散程度 的最简单的统计量。
把一组数据按从小到大的顺序排列,用最大值减去最小值就是全距。
variance也称 变异数,均方 。作为样本统计量用符号s2表示,作为总体参数用符号sigma2表示。
它是每个数据 离均差平方后的平均数。
方差是度量数据分散程度的一个很重要的统计量。方差是对一组数据中各种变异的总和的测量,具有可加性和可分解性特点。
standard deviation,即方差的平方根,用s或SD表示,若用(sigma)表示,则是指总体的标准差。
方差与标准差是最常用的描述 次数分布离散程度 的差异量数。
coefficient of correlation是两列变量间相关程度的数量指标,或者说是用来表示相关关系强度的指标。作为样本间相互关系程度的统计特征数,常用r表示,作为总体参数一般用ρ表示。
r的取值范围[-1.00,+1.00]
“+/-”号表示双变量数列之间相关的方向,正值表示正相关,负值表示负相关;
相关系数r=+1.00时表示完全正相关,r=-1.00时表示完全负相关,这二者都是完全相关. r=0时表示完全独立,即无任何相关性;
相关系数取值的绝对值大小表示相关的强弱程度。
指在其他研究变量都不变的情况下, 单独一个自变量 引起的因变量变化的效应。
当一个自变量因为其它自变量的水平或安排不同, 共同 对因变量的大小产生的不同影响结果。如果某一自变量对因变量影响大小不受其他自变量水平或安排的影响,那么这两个变量之间不具有交互作用。
指一个因素在另一个因素不同水平上的效应,当一个因素在另一个因素不同水平上产生不同效应的时候,就出现了交互作用。
(独立组设计或被试间设计)组间设计通常把被试分为若干个组,每组分别接受 一种 实验处理。有几种实验处理,被试也就相应的被分为几组。即不同的被试接受自变量不同水平的实验处理。
由于被试是随机取样并随机分组安排到不同的实验处理中,所以它又叫做完全随机设计。
是指每个被试都要接受 所有 自变量水平的实验处理,由于接受每种实验处理后都要进行测量,它又被称为“重复测量设计”。
将被试个体的心理特质发展水平与某一特定群体的心理特质发展水平进行比较,从而确定被试个体心理特质发展水平在这一特定群里中的相对地位的测验。常用于学业成就测验、能力水平测验中。
将一个人在测验上的成绩与某一明确界定的标准进行比较、解释。
指正确辨认真实差异的能力,用1-β为表示。
强调某一方向的检验。查统计表时,按分布的一侧计算显著性水平。
指一组数据的方差可能大于,等于或小于另一组数据的方差的情况。
只强调差异,不强调方向性的检验。
又称变异系数、相对标准差等,它是一种相对差异量,用CV表示,为标准差对平均数的百分比。
常用于:同一团体不同观测值离散程度的比较;对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。
统计样本的那些特征值,又称 特征值 。是从一个样本中计算出来的一些量数,可以描述一组数据的情况。
统计量代表样本的特征,它是一个变量,随着样本的变化而变化。
统计总体的那些特征称。又称总体参数。是描述一个总体情况的统计指标。
参数代表总体的特征,是一个常数。如总体均值、标准差。
标准回归系数,是指消除了因变量y和自变量x1,x2,…xn所取单位的影响之后的回归系数,其绝对值的大小直接反映了xi对y的影响程度。
1) 研究中的自变量水平是随机取样,所选各水平仅是 无限多水平中 的一部分有代表性的样本
2) 统计推论可推广到无限总体中
3) F值的计算有区别,即在不同效应检验时,计算F值得分母项不同。
1) 研究中的自变量总体是有限的几个固定值,所选的实验处理水平,即为处理水平的总体
2) 推论只能涉及有限的总体
3) F值计算一般用误差项的均方为分母,求各主效应的F值,检验其是否差异显著。
指任意两个数据点之间都可以细分出无限多个大小不同的数值。
(不连续数据)在任何两个数据点之间所取的数值的个数是有限的,一般是取整数,两个单位之间不能再划分细小单位。
偏态分布是指频数分布不对称,集中位置偏向一侧,若 集中位置偏向数值小的一侧 ,这种分布曲线的右侧部分偏长左侧部分偏短,称为正偏态分布。
偏态分布是指频数分布不对称,集中位置偏向一侧, 集中位置偏向数值大的一侧 ,这种分布曲线的左侧偏长右侧偏短,称为负偏态分布。
是上下限之间的 中点 数值,以代表各组标志值的一般水平。
组中值并不是各组标志值的平均数,各组标志数的平均数在统计分组后很难计算出来,就常以组中值近似代替。
克龙巴赫alpha系数估计方法是 内部一致性信度 估计方法的一种。可以估计各种计分方式测验的内部一致性信度,是更一般化的测验内部一致性信度估计方法。只要求测验对一批被试测试一次。
是指某一行为是社会一般人所希望、期待、接受的。
标准分数,是以标准差为单位,表示一个原始分数在团体中所处的相对位置的量数。
公式:
没有实际单位,以平均数为参考点(中心),以标准差为单位的一个相对量。均值为0,标准差为1。
由
变量variables就是指心理与教育实验/观察/调查中想要获得的数据。数据获得前用“X”表示,即为一个可以取不同数值的物体的属性或事件,其数值具有不确定性。由于变量在测查之前不能准确地预料会获得什么样的值,在统计学上,把 取值之前不能预料取到什么值的变量称为随机变量 。
标准化样本的平均数
真分数是测量工具实际所测量到的测值,真分数中 不含随机误差分数 ,包括目标真分数(V)和非目标真分数(I),记为T(True score)。目标真分数是欲测心理特质的实际值,非目标真分数是系统误差值(计为I)
T=V+I
从已知的总体中,以一定的样本容量进行随机抽样,保证每个样本是独立的,各个样本都服从同样的分布, 样本统计数的概率分布 称为抽样分布。
抽样分布是统计推断的理论基础。常用的样本分布如样本平均数、方差的分布。
在统计学中不能对H1的真实性直接检验,需要建立与之对立的假设,称作虚无假设,或叫做无差假设,零假设/原假设,记为H0.
参数估计指用局部结果推论总体情况,分为点估计和区间估计。
点估计指在进行参数估计时,用一个特定点值作为总体参数的估计值。如用样本平均数估计总体平均数。
标准误差(英文:Standard Error) 样本平均数 分布的标准差。
标准误差用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。
(决定系数)r2
回归平方和在总平方和中所占的比例。变量间共变程度的指标,等于回归平方和与总平方和之比,即 相关系数的平方 。测定系数越大说明回归平方和对总体平方和的贡献越大,测定系数越大,说明回归效果越好。
在进行任何一项研究时,都需要根据已有的理论和经验事先对研究结果做出一种预想的希望证实的假设,叫科学假设或研究假设,记作H1,在假设检验中,虚无假设H0总是作为直接被检验的假设, 而H1与H0对立,二者择一 ,它的意思是 一旦有充分理由否定虚无假设H0,则H1这个假设被你选择 。
估计总体参数落在某一区间内, 可能犯错误的概率 ,用符号α表示。
显著性水平在假设检验中,还指拒绝虚无假设时可能出现的犯错误的概率水平。
interval estimation根据估计量 以一定可靠程度 推断总体参数所在的区间范围,它是用数轴上的一段距离表示未知参数可能落入的范围,它虽然不具体指出总体参数等于什么,但能指出 未知总体参数落入某一区间的概率有多大 。
指 在某一置信度 时,总体参数所在的区域距离或区域长度。置信区间的上下两端点值称为置信界限。
如:.95置信区间:只总体参数落入该区间之内,估计正确的概率为95%,估计错误的概率为5%
如果一个测验有两个以上复本,同一群被试接受两个复本测验得分的相关系数
也叫置信水平,是指所估计的总体参数落入置信区间的可靠程度,用1-a来表示。
统计学上指多个平均数两两之间的相互比较称为多重比较。
指试验仅有两种不同性质结果的概率分布。
即各个变量都可归为两个不同性质中的一个,两个观测值是对立的,因而二项分布又可说是两个对立事件的概率分布。
(复本测验)是指两个在题目内容、数量、形式、难度、区分度、指导语、时限以及所用的例题、公式等方面都相同或相似的测验。
也就是用不同的题目测量同样的内容,而且其测验结果的平均值和标准差都相同的两个测验。
又称百分位点(percentile),它是指量尺上的一个点,位于按照一定顺序排列的一组数据中,某一百分位置的数值。
单因素方差分析对应的实验设计方法是完全随机设计。
完全随机设计是采用完全随机化的方法将同质的受试对象分配到各处理组,然后观察各组的实验效应。完全随机设计也叫组间设计,被试对象被分成若干组,每组分别接受一种实验处理,有几种实验处理被试也相应的被分为几组,各实验组的被试之间相互独立,因而又叫独立组设计。
单因素方差分析(one-way ANOVA),用于完全随机设计的多个样本均数间的比较,其统计推断是推断各样本所代表的各总体均数是否相等。
完全随机设计不考虑个体差异的影响,仅涉及一个处理因素,但可以有两个或多个水平,所以亦称单因素实验设计。在实验研究中按随机化原则将受试对象随机分配到一个处理因素的多个水平中去,然后观察各组的试验效应在观察研究中按某个研究因素的不同水平分组,比较该因素的效应。
完全随机设计的单因素方差分析是把总变异的离均平方和SS及自由度分别分解为组间和组内两部分,其计算公式。MS组间=离均平方和/组间自由度。MS组内=离均平方和/组内自由度。SS总=SS组间+SS组内。
复合设计:在一个实验中研究者更常采用两个或两个以上自变量的设计。
(一)确定实验设计的指导原则
●研究者运用复合设计研究一个实验中两个或更多自变量的效应。
●在复合设计中,每个自变量都可以通过独立组设计或者重复测量设计而被研究。
(二)描述复合设计中的实验效应
●最简单的复合设计是2×2设计,即包含两个自变量,且每个自变量有两个水平。例如:
a巴兹尼和谢弗采用一个2×2实验设计来研究潜在约会对象的吸引力。
b巴兹尼和谢弗的目的就是研究关系维持(通过处于恋爱中的个体实现)和关系追求(通过目前未处于恋爱中的个体实现)两者中的哪一个能更好地解释对于有吸引力的潜在约会对象的评分。
●在复合设计中,实验条件的数目等于每个自变量的水平数之积。
●增加自变量的水平数或者包含更多的自变量个数可以使复合设计检验力更大,效率更高。
●主效应和交互作用
a在复合设计中,每一自变量的总效应被称为主效应。它表示一个自变量的每一水平在第二个变量水平上平均成绩的差异。例如,恋爱状况主效应等于恋爱状况变量两个水平上的均数之差。
b自变量之间的交互作用是指一个自变量的效应在第二个自变量的某些或全部水平上存在差异。
●描述交互作用
a用图(非平行线)或表(相减法)表示的描述统计可以帮助发现交互作用,但交互作用需要统计推论来确认。
b在线形图中,非平行线表明存在交互作用,而平行线表明不存在交互作用。
c所谓相减法就是把表格中每一行(或每一列)的平均数相减。如果差值不同.那么数据中就可能存在交互作用。
(三)复合设计的数据分析
●在两因素复合设计中,推论统计用于检验每一个自变量的主效应和两个自变量之间的交互作用。
●描述统计对解释推论统计的结果是必要的。
●研究者如何解释一个复合设计的结果取决于数据是否存在显著的交互作用。
a存在交互作用的数据分析:如果复合设计的结果存在一个显著的交互作用,那么交互作用的意义可通过简单主效应分析和平均数两两比较来进一步确认。其中简单主效应是指一个自变量在另一自变量某一个水平上的效应。
b不存在交互作用的数据分析:如果对复合设计结果的分析表明交互作用不显著,那么下一步就是确定主效应是否显著。主效应的来源可通过平均数的两两比较,也可以运用置信区间比较两个平均数。
(四)解释交互作用
●交互作用和理论检验
a有些理论常常预期行为会受到两个成两个以上自变量的交互影响。因此,常常需要用复合设计来检验这样的理论。
b理论检验过程中常会产生一些互相矛盾的发现,交互作用在解决这些矛盾时起了重要的作用。
●交互作用与外部效度
a当一个复合设计中不存在交互作用时,每一自变量的效应可适用于另一白变量的所有水平上,因此,自变量的外部效度提升了。
b通过确定自变量产生效应的条件,交互作用实际上为一个实验的外部效度界定了范围。
●交互作用与天花板效应和地板效应
a当被试成绩在实验的一个或多个条件达到最大值(天花板)或者最小值(地板)时,即使结果出现交互作用也是很难解释的。
b只要一个实验的任一条件上的得分达到最大值,我们就要注意天花板效应。与此相对应,当得分达到最小值(如完成一个测验时正确率为零)时,我们就要注意地板效应。
c研究者在选择因变量时应使其值有足够变化的空间,以避免出现天花板效应和地板效应。
●交互作用和自然组设计
a当研究者想知道为什么自然组之间得分存在差异时,他们会运用复合设计来对自然组变量做出因果推论。
c对于自然组变量来说,做出因果推论需要三个步骤;解释为什么存在组间差异,操纵一个可以演示此推论过程的自变量,检验被操纵自变量和自然组变量之间是否存在交互作用。
(成组,成为相互独立的组,一朋友这么说,嘿嘿,这样理解俺基本同意)
更容易理解还得多看实例:
【例】[摘要]目的:探讨瘦素调控大鼠肝纤维化的作用及ERK信号转导通路机制。方法:40只雄性SD大鼠,随机分为对照组(皮下注射生理盐水、腹腔注射生理盐水)、模型组(皮下注射40%四氯化碳蓖麻油溶液、腹腔注射生理盐水)、低剂量瘦素组(皮下注射40%四氯化碳蓖麻油溶液、腹腔注射2ng/kg瘦素)、高剂量瘦素组(皮下注射40%四氯化碳蓖麻油溶液、腹腔注射20ng/kg瘦素),每组各10只大鼠。
这里的40只大鼠,俺们把它随机分成4个组,并给予不同处理,这就典型的4个独立组设计了。
(好象说的废话,跟没讲一样,那就先把下面的讲清了,独立组概念也就自明)
配对/重复测量组
如果,俺们把这40只大鼠,先做A试验,1周后再做B试验。这时,俺们把它们看成是两个时期/试验组。1周前,这40只称为A组,1周后称为B组。这AB两组就是配对组了。
啊哈,开始见到配对这个词鸟。
配对,要严格配成对。每只大鼠,前面的自己配后面的自己,当然就是严格配对。
可别告诉我前面的例子是每组10只,也是“配对”。错!那是配伍。哪怕配的公母、体重、日龄都一致。统计学中的配对是要无比严格的,自己的前后配当然是,人的左右眼配,有时是有时也不是(例如测左右眼的视力),以后慢慢解释。
这里给亲们总结一下:一般的分组,多是独立组,当然,独立组也要尽量把它们的特性匹配起来(例如俺们用随机分组或者按层分组)。
除非特别匹配的,例如某一群样本参加前后两个试验,再例如从一群人的左右手抽血化验某种指标(左右手组成的组太匹配了,它们将要化验的某种指标都可能是相互关联的),这也可看成是配对组。
有些很难弄清的,就尽量看成是独立组吧。