统计学调研方法:实验设计
实验设计
通过实验来获取所需数据是收集自然现象和科学研究数据的直接来源。
为提高科研成果质量,应根据实验的目的,结合统计学的要求,针对实验的全过程,认真考虑实验设计问题。一个周密而完善的实验设计,能合理地安排各种实验因素,严格地控制实验误差,从而用较少的人力、物力和时间,最大限度地获得丰富而可靠的资料。科学合理的实验设计是实验过程的依据,是实验数据处理、保证实验质量的前提。反之,如果实验设计存在缺点,就可能造成不应有的浪费,且足以减损研究结果的价值。
1.实验设计的原则
实验设计有属于专业方面的,有属于统计方面的。从统计方面说,主要应当考虑随机化、对照、重复等问题,这就是所谓实验设计的三原则。
(1)随机原则。即运用“随机数字表”实现随机化运用“随机排列表”实现随机化运用计算机产生“伪随机数”实现随机化。尽量运用统计学知识来设计自己的实验,减少外在因素和人为因素的干扰。
(2)对照原则。设立空白对照组只有通过对照的设立我们才能清楚地看出实验因素在当中所起的作用。当某些处理本身夹杂着重要的非处理因素时,还需设立仅含该非处理因素的实验组为实验对照组,也可以设立历史或中外对照组或多种对照形式并存。
(3)重复原则。重复原则就是在相同实验条件下必须做多次独立重复实验。一般认为重复5次以上的实验才具有较高的可信度。
2.实验设计的基本内容
(1)拟定相互比较的处理。处理,指的是在实验研究中欲施加给受试对象的某些因素。
(2)确定实验对象及数量。这里指的是实验所用的动物或活体组织标本等。在实验设计中,要根据实验观察的目的与内容,明确规定采用什么样的实验对象,实验对象中的每个实验单位必须具备的条件与要求,以保证受试对象的一致性。
(3)确定将各实验单位分配到各种处理中去的原则。这主要是随机分配或随机化问题。
(4)拟定观察项目和登记表。要根据研究目的和任务,选择对说明实验结论最有意义,并具有一定特异性、灵敏性、客观性的观察项目。必要的项目不可遗漏,数据资料应当完整无缺无关紧要的项目就不必设立,以免耗费人力、物力,拖延整个实验的时间。
(5)拟定对资料整理分析的预案。这就是对将获得的数据资料准备如何进行整理,要计算哪些统计指标,用什么统计分析方法,事先必须有个初步的设想。
同一个样本,重复三次。此时样本量=1
取多个样本,进行多次实验。此时样本量=3
1. 最理想的设计是兼顾技术重复和生物重复,但是由于资金的限制,只选生物重复也可,如RNA-seq。
2. 在研究一个个体时选择技术重复,在研究一个组时选择生物重复。
有效样本量=样本量/ 1+(样本量-1)*相关系数
如:两个样本相关系数=0.7 有效样本量=2/ 1+(2-1)*0.7=1.18
试验设计最简单的就用二因素五水平的随机区组设计,随机模型。测出数据后,用相应的方差分析进行数据分析就行。
统计学的英文statistics最早源于现代拉丁文statisticum collegium(国会)以及意大利文statista(国民或政治家)。德文Statistik,最早是由Gottfried Achenwall于1749年使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。
统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说:它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴。
分别有单一变量原则 ;对照性原则;等量原则;科学性原则。
试验设计,也称为实验设计。,经济地、科学地安排试验的一项技术。试验设计自20世纪20年代问世至今,其发展大致经历了三个阶段:即早期的单因素和多因素方差分析,传统的正交试验法和近代的调优设计法。
其在工业生产和工程设计中能发挥重要的作用,主要有:提高产量;减少质量的波动,提高产品质量水准;大大缩短新产品试验周期;.降低成本;.试验设计延长产品寿命。
试验设计是统计学中数理统计的一个分支。
从20世纪20年代费希尔(R.A.Fisher)在农业生产中使用试验设计方法以来,试验设计方法已经得到广泛的发展,统计学家们发现了很多非常有效的试验设计技术。
20世纪50年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化,在方法解说方面深入浅出为试验设计的更广泛使用作出了众所周知的贡献。
扩展资料
一个实验的设计,即对实验的一种安排,需要考虑实验所要解决的问题类型、对结论赋予何种程度的普遍性、希望以多大功效作检验、试验单元的齐性、每次试验的耗资耗时等方面,选取适当的因子和相应的水平,从而给出实验实施的具体程序和数据分析的框架。
所谓试验的统计设计,就是设计试验的过程,使得收集的数据适合于用统计方法分析,得出有效的和客观的结论。如果想从数据作出有意义的结论,用统计方法作试验设计是必要的。当问题涉及到受试验误差影响的数据时,只有统计方法才是客观的分析方法。
参考资料来源:百度百科-试验设计
(二)随机原则(randomization):指在实验对象的抽样、分组、治疗顺序和结果测量等方面每个对象都有同等的概率。
(三)重复原则(replication):是指实验要有足够的样本,在同样的实验条件下要重复观察足够的次数,即在实验设计中需估计样本含量。
所谓实验设计就是指设计实验的合理程序,使得收集得到的数据符合统计分析方法的要求,以便得出有效的客观的结论。它主要适用于自然科学研究和工程技术领域的统计数据搜集。
实验设计要遵循的三个基本原则:
(1)重复性原则:即允许在相同条件下重复多次实验。好处是:其一可以获得更加精确的有效估计量;其二,可以获得实验误差的估计量。这些都是提高估计精度或缩小误差范围所需要的。
(2)随机化原则:是指在实验设计中,对实验对象的分配和实验次序都是随机安排的。是实验设计的重要原则。
(3)区组化原则:即利用类型分组技术,对实验对象按有关标志顺序排除,然后依次将各单位随机地分配到各处理组,使各处理组组内标志值的差异相对扩大,而处理组组间的差异相对缩小,这种实验设计安排称为随机区组设计。
2.大量观察
大量观察法是统计学所特有的方法。所谓大量观察法,是指对所研究的事物的全部或足够数量进行观察的方法。统计描述
统计描述是指对由实验或调查而得到的数据进行登记、审核、整理、归类、计算出各种能反映总体数量特征的综合指标,并加以分析,从中抽出有用的信息,用表格或图像把它表示出来。是统计研究的基础。它通过对分散无序的原始资料的整理归纳,运用分组法和综合指标法得到现象总体的数量特征,揭露客观事物内在数量规律性,达到认识的目的。