很少的群就可以提供有关总体特征的信息。如果实际情况不是这样,整群抽样的误差会很大,效果也就很差。 4.什么是重复抽样和不重复抽样?
从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止。这样的抽样方法称为重复抽样。
一个元素被抽中后不再放回总体,然后再从所剩下的元素中抽取第二个元素,直到抽取n个元素为止,这样的抽样方法称为不重复抽样。 5.什么是抽样分布?
重复选取容量为n的样本时,由每一个样本算出的统计量数值的相对频数分布或概率分布.称为样本统计量的抽样分布 6.样本统计量的分布与总体分布的关系是什么? 答:样本统计量包括样本均值、样本比率、样本方差。
(1)样本均值总体分布的关系:①无论是重复还是不重复抽样,样本均值的数学期望始终等于总体均值;②在重复抽样条件下,样本均值的方差为总体方差的1/n;在不重复抽样条件下,样本均值的方差为1/n
(2)样本比率与总体分布的关系:①样本比率p的数学期望等于总体比率π;
②在重复条件下;在不重复条件下,用修正系数加以修正
(3)样本方差与总体分布的关系:对于来自正态总体的简单随机样本,则比值的抽样分布服从自由度为(n-1)的x2分布。
7.样本均值抽样分布的两个主要特征值是什么?它们与总体参数有什么关系?
答:样本均值的期望值和样本均值的方差是两个主要特征。 (1)样本均值的数学期望,它等于总体均值。
22?22?(2)样本均值的方差 ?XXnn在重复抽样条件下,样本均值的方差为总体方差的1/n, 在不重复抽样条件下,样本均值的方差需要用修正系数去修正 ??8、Zα/2的含义是什么? 答:估计误差。
22XX?22?NN??nn?????n?NN??11??第六章 1.理解原假设与备择假设的含义。
原假设通常是研究者想收集证据予以反对的假设;而备择假设通常是研究者想收集证据予以支持的假设。
2.什么是检验统计量?什么是标准化检验统计量?
根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。
3.第1类错误和第Ⅱ类错误分别是指什么?它们发生的概率大小之间存在怎样的关系?
答:第I类错误指当原假设为真时拒绝原假设,所犯的错误,又称弃真错误,其概率为α。第II类错误指当原假设为假时没有拒绝原假设所犯的错误,又称取伪错误,其概率为α。在样本量不变的情况下,要减小α就会使β增大,而要增大α 就会使β减小。
4.什么是显著性水平?它对于假设检验决策的意义是什么?
答:假设检验中犯第一类错误的概率被称为显著性水平。显著性水平通常是人们事先给出的一个值,用于检验结果的可靠性度量,但确定了显著性水平等于控制了犯第一错误的概率,但犯第二类错误的概率却是不确定的,因此作出“拒绝原假设”的结论,其可靠性是确定的,但作出“不拒绝原假设”的结论,其可靠性是难以控制的。
5.什么是P值?利用P值决策的准则是什么?
答:p值是在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率。
准则是:如果P值<α,拒绝H0(原假设),如果P值>α,不拒绝H0 6.比较单侧检验和双侧检验的区别。
7、分别列出大样本情形下总体均值左侧检验、右侧检验及双侧检验的拒绝域。(课本上有表格)
9、分别列出小样本情形下总体均值左侧检验、右侧检验及双侧检验的拒绝域。(课本上有表格)
8、小样本情形下的总体均值检验应该构造什么检验统计量?应用前提是什么?
⑴在小样本情形下,检验统计量的选择与总体是否服从正态分布、总体方差是否已知有密切联系。其应用前提是总体服从正态分布;⑵当总体方差已知时,选择Z统计量进行检验;⑶当总体方差未知时,选择t统计量进行检验。 10、总结假设检验的一般步骤。
①陈述原假设H0和备择假设H1;②从所研究的总体中抽了一个随机样本;③确定一个适当的检验统计量,并利用样本数据算出来具体数值;④确定一个适当的显著性水平a,并计算出其临界值,指定拒绝域;⑤将统计量的值与临界值进行比较,并做出决策:若统计量的值落在拒绝域内,拒绝原假设H0,否则不拒绝原假设H0。
第七章 1、解释相关关系的含义,说明相关关系的特点。 答:变量间存在的不确定的数量关系,称为相关关系。
特点是:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个。 2、简述相关系数的取值及其意义。
相关系数是对变量之间关系密切程度的度量。对两个变量之间线性相关关系的度量称为简单相关系数。它的取值范围在-1与1之间。若0 (2)使用t检验的方法,根据公式计算检验的统计量得出t~t(n-2) (3) 根据置信度a,查表,确定接受区域和拒绝区域 (4)检验t在哪个区域:若t在拒绝域,则拒绝H0;若t在接受域,则不拒绝H0 (5)如果求出两变量之间的线性相关系数,并且证明了两者有显著相关性,则 4、解释回归模型、回归方程、估计的回归方程的含义。 答:回归模型:描述因变量如何依赖于自变量和误差项的方程。 回归方程:回归方程是对变量之间统计关系进行定量描述的一种数学表达式。指具有相关的随机变量和固定变量之间关系的方程。主要有回归直线方程。 估计的回归方程:利用最小二乘法,根据样本数据求出的回归方程的估计。 5、简述参数最小二乘估计的基本原理。 未知量的最可能值是使各项实际观测值和计算值之间差的平方乘以其精确度的数值以后的和为最小 6解释总平方和、回归平方和、残差平方和和的含义,并说明它们之间的关系。142页 7简述判定系数的含义和作用。 答:判定系数指回归平方和占总平方和的比例。 作用:测度回归直线对观测数据的拟合程度,反映了在因变量y的总变差中由x与y之间的线性关系所解释的比例。 8.在回归分析中,F检验和t检验各有什么作用? F检验(线性关系检验)是检验自变量x和因变量y之间的线性关系是否显著,或者说,它们之间能否用一个线性模型y=β1+β2x+ε来表示。 t检验(回归系数检验)是要检验自变量对因变量的影响是否显著。 9.简述线性关系检验和回归系数检验的具体步骤。146—147页 10.什么是置信区间和预测区间估计?二者有什么区别? 第八章 1、简述时间序列的各构成要素。 时间序列的构成要素分为4种,即趋势(T)、季节性或季节变动(S)、周期性或循环滚动(C)、随机性或不规则波动(I)。 ①趋势是时间序列在长时期内呈现出来的某种持续向上或持续下降的变动,也称长期趋势。 ②季节性也称季节变动,它是时间序列在一年内重复出现的周期性波动。 ③周期性也称循环波动,它是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡变动。 ④时间序列除去趋势、周期性和季节性之后的偶然性波动,称为随机性,也称不规则波动。 2、利用增长率分析时间序列时应注意哪些问题? 首先,当时间序列中的观察值出现0时,不宜计算增长率比定某企业连续五年的利润额分别为5、2、0、—3、2万元,对这一序列计算增率要么不符合数学公理,要么无法解释其实际意义。在这种情况下,适宜用绝对数进行分析。其次,在有些情况下,不能单纯就增长率论增长率,要注意增长率与绝平水平的结合分析。 3、简述平稳序列和非平稳序列的含义。 答:①平稳序列是基本不存在趋势的序列。这类序列中的各观察值基本上在某个固定的水平 上波动,虽然在不同时间段波动的程度不同,但并不存在某种规律,其波动可以看成是随机的。 ②非平稳序列是包含趋势、季节性或周期性的序列,它可能只含有其中的一种成分,也可能是几种成分的组合。因此,非平稳序列又可以分为有趋势的序列,有趋势和季节性的序列,几种成分混合而成的复合型序列。 4、简述指数平滑法的基本含义。