1.抽样误差是抽样调查中无法避免的误差。 ( ) 2.抽样误差的产生是由于破坏了随机原则所造成的。 ( ) 3.在其他条件相同的情况下,重复抽样条件下的抽样平均误差总是大于不重复抽样 条件下的抽样平均误差。 ( )
4.用简单随机抽样(重复抽样)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大到原来的4倍。 ( ) 5.当总体单位数很大但分布不均匀时,不宜采用抽样调查方法。 ( ) 6.遵循随机原则抽样,可以使样本与总体同分布,进而提高样本的代表性。
( )
7.抽样调查所遵循的基本原则是可靠性原则。 ( ) 8.样本指标是一个客观存在的常数。 ( )
9.全面调查只有登记性误差而没有代表性误差,抽样调查只有代表性误差而没有登记性误差。 ( ) 10.所有可能的样本平均数等于总体平均数。 ( ) 11.抽样极限误差总是大于抽样平均误差。 ( ) 12.抽样调查的着眼点就在于对样本数量特征的认识。 ( )
13.某企业在调查本厂的产品质量时,有意把管理较差的某车间的产品不算在内。这种做法必将导致系统性偏差。 ( )
14.极限误差就是最大的抽样误差,因此,总体指标必然落在样本指标和极限误差共同构成的区间之内。 ( )
15.抽样极限误差反映的是抽样指标与总体指标之间的抽样误差的可能范围,实际上每次抽样极限误差可能大于、小于或等于抽样平均误差。 ( )
16.在总体各单位标志值大小悬殊的情况下,运用类型抽样比简单随机抽样可以得到比较准确的结果。 ( )
17.抽样平均误差同样本单位数的多少成正比,而与总体变异程度的大小无关。
( )
18.抽样推断中不可避免会产生抽样误差,但人们可以通过调整总体方差的大小来控制抽样误差的大小。 ( ) 19.在抽样推断中,样本和总体一样都是确定的、唯一的。 ( )
20.在其他条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样的估计精确度。
41
( )
(四)填空题
1.抽样调查是按照 从总体中抽取一部分单位进行观测,并根据这部分单位的资料推断 的一种方法。
2.抽样调查的组织方式主要有 、等距抽样、 和整群抽样等四种。 3.在抽样推断中,按照随机原则从总体中抽取出来的那一部分单位叫做 。 4.简单随机抽样在抽取样本单位时有 和 两种不同的抽样方法。 5.对被研究标志变动较大的总体进行抽样推断时,宜采用 组织方式调查。 6.置信区间的大小表达了区间估计的 。
7.总体指标与抽样指标相比较,前者是一个确定值,后者是 。 8. 是抽样调查中不可避免的误差。
9.抽样推断中的概率保证程度表达了区间估计的 。 10.抽样平均误差是全部样本指标的 。
11.在抽样调查中,使总体的每个单位都有相同的被抽中可能性的原则,称为__________ 。
12.总体指标的区间估计必须具备 、误差范围和 三个基本要素。
13.简单重复抽样情况下,如果其他条件保持不变,仅将误差范围缩小一半,则抽样单位数目必须 ;若将误差范围扩大一倍,则抽样单位数为原来的 。 14. 反映了样本指标与总体指标之间的抽样误差的可能范围。 15. 反映了样本指标与总体指标之间的平均误差程度。 16.参数估计有两种形式:一是 ,二是 。
17.点估计是直接用 估计总体指标的推断方法。点估计不考虑 及 。
18.区间估计是在一定的 下,用以 值为中心的一个区间范围估计总体指标数值的推断方法。
(五)简答题
1.什么是随机性原则?在抽样调查中为什么要坚持随机性原则? 2.什么是抽样推断?抽样推断有哪几个方面的特点? 3.什么是抽样误差?影响抽样误差的因素有哪些?
42
4.抽样估计的优良标准是什么? 5.影响必要样本容量的因素有哪些?
(六)计算应用题
1.某灯泡厂对10000个产品进行使用寿命检验,随机抽取2%样本进行测试,所得资料如下表。
使用时间 (小时) 900以下 900-950 950-1000 1000-1050 抽样检查电灯泡数(个) 2 4 11 71 使用时间 (小时) 1050-1100 1100-1150 1150-1200 1200以上 合计 抽样检查电灯泡数(个) 84 18 7 3 200 按照质量规定,电灯泡使用寿命在1000小时以上者为合格品,按以上资料计算抽样平均误差。
2.某灯具生产厂家生产一种60W的灯泡,假设其寿命为随机变量X,服从正态分布
N(?,1296)。现在从该厂生产的60W的灯泡中随机地抽取了27个产品进行测试,直到灯
泡烧坏,测得它们的平均寿命为1478小时。请计算该厂60W灯泡的平均寿命的置信水平为95%的置信区间。
3.可口可乐公司生产的雪碧,瓶上标明净容量是500ml,在市场上随机抽取了25瓶,测
得到其平均容量为499.5ml,标准差为2.63ml。试求该公司生产的这种瓶装饮料的平均容量的置信水平为99%的置信区间(假定饮料的容量服从正态分布N(?,?2))。
4.为研究某内陆湖的湖水的含盐量,随机地从该湖的32个取样点采了32个湖水样本,测得它们的含钠量(单位:ppm)分别为:
13.0 18.5 16.4 14.8 19.4 17.3 23.2 24.9 20.8 19.3 18.8 23.1 15.2 19.9 19.1 18.1 25.1 16.8 20.4 17.4 25.2 23.1 15.3 19.4 16.0 21.7 15.2 21.3 21.5 16.8 15.6 17.6
假设湖水中钠的含量为随机变量X,服从正态分布N(?,?2),试求湖水钠的平均含量?的95%置信区间。
5.某公司有职工3000人,从中随机抽取100人调查其工资收入情况。调查结果表明,职工的月平均工资为3350元,标准差为403元,月收入在5000元及以上职工8人。试以95.45%的置信水平推断该公司职工月平均工资所在的范围和月收入在5000元及以上职工在全部职工中所占的比重。
43
6.某批发站欲估算零售商贩的平均每次进货额,根据历史资料进货额的标准差为1000元,假定到批发站进货的商贩有2000人,若要求置信水平为99.73%,容许误差不超过250元,应该抽取多大的样本?
7. 某社区想通过抽样调查了解居民参加体育活动的比率,如果把容许误差范围设定在5%,问如果以95%的置信度进行参数估计,需要多大的样本?
第五章 相关与回归分析
练习题:
(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内)
1.现象之间相互关系的类型有( )。
①函数关系和因果关系 ②相关关系和函数关系 ③相关关系和因果关系 ④回归关系和因果关系 2.进行相关分析,要求相关的两个变量( )。 ①都是随机的 ②都不是随机的 ③一个是随机的,一个不是随机的 ④随机或不随机都可以
3.当价格不变时销售额与销售量之间存在着( )。
①相关关系 ②因果关系 ③函数关系 ④比较关系
4.当自变量按一定数量变化时,因变量也大致按照一个固定的量变化,这时两个变量之间存在着( )。
①线性相关关系 ②曲线相关关系 ③负相关关系 ④正相关关系
5.当变量X值增加时,变量y值随之下降,X和y两个变量之间存在着( )。 ①正相关关系 ②负相关关系 ③曲线相关关系 ④直线相关关系
6.当居民的收入减少时,居民的储蓄存款也会相应减少,二者之间的关系是( )。 ①负相关关系 ②曲线相关关系 ③零相关关系 ④正相关关系 7.Pearson相关系数( )。
①只适用于直线相关 ②只适用于曲线相关
44
③既可用于直线相关,也可用于曲线相关 ④既不适用于直线相关,也不适用于曲线相关 8.线性相关系数反映了( )。 ①两个变量线性关系的密切程度 ②两个变量线性关系的拟合程度 ③两个变量变动的一致性程度 ④自变量变动对因变量变动的解释程度 9.相关系数r的取值范围是( )。
①0?r?1 ②?1?r?1 ③?1?r?0 ④0?r 10.现象之间相互依存关系的程度越低,则相关系数( )。 ①越接近于0 ②越接近于-1 ③越接近于1 ④越接近于0.5
11.当所有观察值都落在回归直线上,则X与y之间的相关系数( )。 ①r=0 ②-1 12.如果变量X和变量y之间的相关系数为-0.85,这说明两变量之间是( )。①高度相关关系 ②完全相关关系 ③低度相关关系 ④完全不相关 13.在回归直线中,若b<0,则X与y之间的相关系数( )。 ①r=0 ②r=1 ③0 ①现象之间完全无关 ②相关程度较小 ③现象之间完全相关 ④无直线相关关系 15.已知变量X与y之间的关系,如图所示,下面哪个数字最可能是其相关系数(①-1.01 ②-0.23 ③-0.91 ④-0.32 y x 45 。 )