.
第一章 绪论
一、名词解释
1、总体:根据研究目的确定的研究对象的全体称为总体。 2、个体:总体中的一个研究单位称为个体。 3、样本:总体的一部分称为样本。
4、样本含量:样本中所包含的个体数目称为样本含量(容量)或大小。
5、随机样本:从总体中随机抽取的样本称为随机样本,而随机抽取是指总体中的每一个个体都有同等的机会被抽取组成样本。 6、参数:由总体计算的特征数叫参数。 7、统计量:由样本计算的特征数叫统计量。
8、随机误差:也叫抽样误差,是由于许多无法控制的内在和外在的偶然因素所造成,带有偶然性质,影响试验的精确性。
9、系统误差:也叫片面误差,是由于一些能控制但未加控制的因素造成的,其影响试验的准确性。
10、准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与真值接近的程度。
11、精确性:也叫精确度,指调查或试验研究中同一试验指标或性状的重复观测值彼此接近的程度。
二、简答题
1、什么是生物统计?它在畜牧、水产科学研究中有何作用? 答:(1)生物统计是数理统计的原理和方法在生物科学研究中的应用,是一门应用数学。 (2)生物统计在畜牧、水产科学研究中的作用主要体现在两个方面:一是提供试验或调查设计的方法,二是提供整理、分析资料的方法。
2、统计分析的两个特点是什么?
答:统计分析的两个特点是:①通过样本来推断总体。②有很大的可靠性但也有一定的错误率。
3、如何提高试验的准确性与精确性?
答:在调查或试验中应严格按照调查或试验计划进行,准确地进行观察记载,力求避免认为差错,特别要注意试验条件的一致性,即除所研究的各个处理外,供试畜禽的初始条件如品种、性别、年龄、健康状况、饲养条件、管理措施等尽量控制一致,并通过合理的调查或试验设计,努力提高试验的准确性和精确性。
4、如何控制、降低随机误差,避免系统误差?
答:随机误差是由于一些无法控制的偶然因素造成的,难以消除,只能尽量控制和降低;主要是试验动物的初始条件、饲养条件、管理措施等在试验中要力求一致,尽量降低差异。系统误差是由于一些可以控制但未加控制的因素造成的,一般只要试验工作做得精细是可以消除的。避免系统误差的主要措施有:尽量保证试验动物初始条件的一致(年龄、初始重、性别、健康状况等),尽量控制饲料种类、品质、数量、饲养条件等,测量仪器要准确,标准试剂要校正,要避免观测、记载、抄录、计算中的错误。
'.
.
第二章 资料的整理
一、名词解释
1、数量性状资料:数量性状是指能够以量测或记数的方式表示其特征的象状,观察测定数量性状而获得的数据称为数量性状资料。
2、质量性状资料:质量性状是指能观察到而不能直接测量的性状,观察质量性状而获得的资料称为质量性状资料。
3、半定量(等级)资料:是指将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得到的资料。
4、计数资料:指用计数方式获得的数量性状资料。
5、计量资料:指用量测手段得到的数量性状资料,即用度、量、衡等计量工具直接测定的数量性状资料。 6、全距(极差):是资料中最大值与最小值之差。
7、组中值:分组后每一组的中点值称为组中值,是该组的代表值。
二、简答题
1、资料可以分为哪几类?它们有何区别与联系?
答:资料一般可以分为数量性状资料、质量性状资料、半定量资料三大类,其中数量性状资料又包括计量资料和计数资料。区别:数量性状资料是能够以量测或计数的方式获得的资料,质量性状资料是只能观察而不能直接测量的资料,半定量资料既有计数资料的特点又有程度或量的不同。联系:三种不同类型的资料有时可根据研究目的和统计方法的要求将一种类型资料转化成另一种类型的资料。
2、为什么要对资料进行整理?对于计量资料,整理的基本步骤怎样? 答:(1)由调查或试验收集来的原始资料往往是零乱的,无规律可循。只有通过统计整理,才能发现其内部的联系和规律性,从而揭示事物的本质。资料整理是进行统计分析的基础。 (2)计量资料整理的基本步骤包括:①求全距,全距即为资料中最大值与最小值之差。②确定组数,一般根据样本含量及资料的变动范围大小确定组数。③确定组距,通常根据等距离分组的原则,组距等于全距除以组数。④确定组限和组中值,各组的最大值为组上限,最小值为组下限;每一组的中点值称为组中值。⑤归组划线计数,作次数分布表。
3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好? 答:在对计量资料进行整理时,第一组的组中值以接近或等于资料中的最小值可以避免第一组中观察值过多的情况,同时也确保资料中最小值不会遗漏。
4、统计表与统计图有何用途?常用统计图有哪些?常用统计表有哪些?列统计表、绘统计图时,应注意什么? 答:(1)统计表用表格形式来表示数量关系;统计图用几何图形来表示数量关 系。用统计表和统计图可以把研究对象的特征、内部构成、相互关系等简明、形象地表达出来,便于比较分析。
(2)常用的统计图有长条图、圆图、线图、直方图和折线图等。 (3)常用的统计表有简单表和复合表两大类。
(4)列统计表的注意事项:①标题要简明扼要、准确地说明表的内容,有时须注明时
'.
.
间、地点。②标目分横标目和纵标目两项,横标目列在表的左侧,用以表示被说明事物的主要标志;纵标目列在表的上端,说明横标目各统计指标内容,并注明计算单位。③数字一律用阿拉伯数字,数字小数点对齐,小数位数一致,无数字的用“—”表示,数字是“0”的须写“0”。④表的上下两条边线略粗,纵、横标目间及合计用细线分开,表的左右边线可以省去,表的左上角一般不用斜线。
(5)绘统计图的注意事项:①标题简明扼要并列于图的下方。②纵、横两轴应有刻度,注明单位。③横轴由左至右,纵轴由上而下,数值由小到大;图形长宽比例约为5:4或6:5。④图中需用不同颜色或线条表示不同事物时应有图例说明。
第三章 平均数、标准差与变异系数
一、名词解释
1、算术平均数:是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数。 2、无偏估计:当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计。
3、几何均数:n个观测值相乘之积开n次方所得的方根称为几何均数,记为G。
4、中位数:将资料内所有观测值从小到大依次排列,位于中间的那个观测值称为中位数,记为Md。
5、众数:资料中出现次数最多的那个观测值或次数最多一组的组中值称为众数,记为Mo。 6、调和平均数:资料中各观测值倒数的算术平均数的倒数称为调和平均数,记为H。 7、标准差:统计学上把样本方差S2的平方根叫做样本标准差,记做S。 8、方差:统计量Σ(x - )2/(n - 1)称为均方,又称样本方差,记为S2。 9、离均差平方和(平方和):各个观测值与平均数的离差(x - )称为离均差,各个离均差平方再求和即为离均差平方和,简称平方和,记为SS。
10、变异系数:标准差与平均数的比值称为变异系数,是衡量资料中各观测值变异程度的另一个统计量,记做C.V。
二、简答题
1、生物统计中常用的平均数有几种?各在什么情况下应用?
答:生物统计中常用的平均数有算术平均数、几何平均数、调和平均数、中位数和众数。算术平均数较常用,简称平均数,当资料呈正态分布时可用算术平均数描述其中心位置。几何均数主要应用于畜牧、水产业的动态分析,畜禽疾病及药物效价的统计分析,如畜禽、水产养殖的增长率,抗体的滴度,药物的效价,畜禽疾病的潜伏期等。调和均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。当所获得的数据资料呈偏态分布时中位数的代表性优于算术平均数。众数也适用于资料呈偏态分布的情况。
2、算术平均数有哪些基本性质?
答:算术平均数的两个基本性质是:①离均差之和等于零。 ②离均差平方和最小。
3、标准差有哪些特性?
答:标准差的特性主要表现在四个方面:
①标准差的大小受资料中每个观测值的影响,若观测值间变异大求得的标准差也大,反
'.
.
之则小。
②在计算标准差时,在各观测值加上或减去一个常数,其数值不变。 ③当每个观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或1/a倍。 ④在资料服从正态分布的条件下,资料中约有68.26%的观测值在平均数左右1倍标准差 ( ±S)范围内;约有95.43%的观测值在平均数左右2倍标准差 ( ±2S)范围内;约有99.73%的观测值在平均数左右3倍标准差 ( ±3S)范围内。
4、为什么变异系数要与平均数、标准差配合使用?
答:变异系数是标准差与平均数的比值,是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,若度量单位与平均数相同,可以直接利用标准差来比较;若单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而要用变异系数。变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。
第四章 常用概率分布
一、名词解释
1、必然现象:某类现象是可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果总是确定的,这类现象称为必然现象。
2、随机现象:某类现象事前不可预言其结果的,即在保持条件不变的情况下,重复进行试验,其结果未必相同,这类现象称为随机现象。
3、随机试验:一个试验若满足下述三个特性则称为随机试验,简称试验:①试验可以在相同条件下多次重复进行。②每次试验的可能结果不止一个,并且事先知道会有哪些可能的结果。③每次试验总是恰好出现这些可能结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪个结果。
4、随机事件:随机试验的每一种可能结果,在一定条件下可能发生,也可能不发生,称为随机事件,简称事件。
5、概率的统计定义:在相同条件下进行n次重复试验,若随机事件A发生的次数为m,那么m/n称为随机事件A的频率;当试验重复数n逐渐增大时,随机事件A的频率越来越稳定地接近某一数值P,那么就把P称为随机事件A的概率。这样定义的概率称为统计概率,也叫后验概率。
6、小概率原理:若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概率事件;在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,简称小概率原理。
7、随机变量:作一次试验,其结果有多种可能,每一种可能结果都可以用一个数来表示,把这些数作为变量x的取值范围,则试验结果可用随机变量x来表示。
8、离散型随机变量:如果表示试验结果的变量x,其可能取值至多为可数个,且以各种确定的概率取这些不同的值,则称x为离散型随机变量。
9、连续型随机变量:如果表示试验结果的变量x,其可能取值为某范围内的任何数值,且x在其取值范围内的任一区间中取值时,其概率是确定的,则称x为连续型随机变量。 9、标准正态分布:μ = 0,δ2 = 1 的正态分布称为标准正态分布。 10、标准正态变量(标准正态离差):任何一个服从正态分布N(μ,δ2)的随机变量x,都可以通过标准化变换:u = (x –μ)/δ,将其变换为服从标准正态分布的随机变量u,u称为标准正态变量。
'.
.
11、双侧概率(两尾概率):随机变量x落在平均数μ加减不同倍数标准差δ区间之外的概率称为双侧概率。
12、单侧概率(一尾概率):随即变量x小于μ-kδ或大于μ+kδ的概率称为单侧概率。 13、贝努利试验:对于n次独立的试验,如果每次试验结果出现且只出现对立事件A与A之一,在每次试验中出现A的概率是常数p(0
14、返置抽样:由总体随即抽样时,每次抽出一个个体后,这个个体还返置回原总体,则称为返置抽样。 15、不返置抽样:由总体随即抽样时,每次抽出的个体不返置回原总体,则称为不返置抽样。 16标准误:即平均数抽样总体的标准差,其大小反映样本平均数 的抽样误差的大小,即精确性的高低。
17、样本平均数的抽样总体:样本平均数也是一个随机变量,其概率分布叫做样本平均数的抽样分布,由样本平均数 构成的总体称为样本平均数的抽样总体。 18、中心极限定理:若随机变量x服从正态分布N(μ,δ2),x1,x2,……,xn是由总体得来的随机样本,则统计量 = Σx/n的概率分布也是正态分布,且有μ = μ,δ =δ/ n ,即 服从正态分布N(μ,δ2/n);若随机变量服从平均数是μ,方差是δ2的分布(不是正态分布),x1,x2,……,xn是由总体得来的随机样本,则统计量 = Σx/n的概率分布,当n相当大时逼近正态分布N(μ,δ2/n)。
二、简答题
1、事件的概率具有那些基本性质?
答:事件的概率一般具有以下三个基本性质: ①对于任何事件A,有0≤ P(A) ≤1 ②必然事件的概率为1,即P(Ω)=1 ③不可能事件的概率为0,即P(Ф)=0
2、离散型随机变量概率分布与连续型随机变量概率分布有何区别?
答:离散型随机变量概率分布常用分布列来表示,其具有Pi ≥0和ΣPi = 1两个基本性质。连续型随机变量的概率分布不能用分布列来表示,其可能取的值是不可数的,一般用随机变量x在某个区间内取值的概率P(a ≤x )
3、标准误与标准差有何联系与区别?
答:样本标准差与样本标准误是既有联系又有区别的两个统计量,二者的联系是:样本标准误等于样本标准差除以根号下样本含量。二者的区别在于:样本标准差是反映样本中各观测值x1,x2,……,xn变异程度大小的一个指标,它的大小说明了 对该样本代表性的强弱。样本标准误是样本平均数 1, 2,…… k的标准差,它是 抽样误差的估计值,其大小说明了样本间变异程度的大小及 精确性的高低。
4、样本平均数抽样总体与原始总体的两个参数间有何联系? 答:①样本平均数抽样总体的平均数等于原始总体的平均数。
②样本平均数抽样总体的标准差等于与原始总体的标准差除以根号下样本含量。
5、t分布与标准正态分布有何区别与联系?
答:t分布与标准正态分布曲线均以纵轴为对称轴,左右对称。与标准正态分布曲线相比t分布曲线顶部略低,两尾部稍高而平;df越小这种趋势越明显。df越大,t分布越趋近于标
'.