《抽样技术》练习题及标准答案 下载本文

查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法,如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误差。

在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以

控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。

三 简答题(习题二)

1 概率抽样与非概率抽样的区别

答:概率抽样是指在抽取样本单元时,每个总体单元有一个非零的入样概率,并且样本单

元的抽取应遵循一定的随机化程序。

2 普查与抽样调查的区别

答:普查是对总体的所有单元进行调查;抽样调查仅对总体中的部分单元进行调查。 3何谓抽样效率,如何评价设计效果?

答:两个抽样方案的抽样方差之比为抽样效率。当某个估计量的方差比另一估计量的方差

小时,则称方差小的估计量效率比较高,因方差的大小与样本容量有直接的关系,因此比较时通常以样本量相同时的方差进行比较。

4 何谓三种性质的分布?它们之间的关系怎样?

答:三种分布是指总体分布、样本分布、抽样分布。总体分布是指总体的标志值的分布;

样本分布是指容量为n的样本标志值的分布;抽样分布则是指样本估计量的分布,它是一个变量,据中心极限定理:当n增大时估计量的分布趋向于正态分布,可用大样本理论对其进行区间估计。

5 简述抽样估计的原理。

?)??,而且已知道在大样本的情况下??趋向于正态分布,只要答:如果样本的估计量E(??),就可以根据正态分布原理对?进行区间估计。 ?的抽样标准误差S(?知道?习题三

五 简答题

1 何谓分层抽样?简述分层抽样的意义?

答:分层抽样是在概率抽样的前提下,按某种标志将总体划分为若干层,然后按随机原则对每

层都进行抽样。分层抽样的效率高于简单随机抽样,能够推算子总体。

2 试举一例说明分层抽样的抽样效率比简单随机的抽样要好。

答:简单简单随机抽样可能得到一个差的样本,如一个总体进行简单随机抽样,N=6,其标志

值为1,2,3,4,5,6,当 眉2时其均值的变动范围在(1.5—5.5);若1,2,3为一组,4,5,6为一组进行分层抽样进行则均值的范围在(2.5,4.5),则分层抽样的精度提高。

3分层抽样的分层的原则及其意义。

答:在总体分层后:总体方差=层内方差+层间方差。据方差分析原理,在分层抽样的条件下,

26

抽样误差仅与层内方差有关,和层间方差无关,因此从其组织形式上看所谓的分层抽样是先将总体分层,然后在每层中抽取样本,遵循扩大层间方差,缩小层内方差的原则对总体进行分层,就可以提高估计的精度。

4 简述分层抽样的局限性。

答:分层抽样一般说来比简单随机抽样的精度要高,但若层的划分或样本量的分配不合理时,

可能会使分层随机抽样的精度比简单随机抽样要差。

5 简述分层抽样中总样本量的分配方法。

答:当样本量一定时考虑样本量的分配问题,主要有 三种分配方法按层要进行分配:1、比例

分配;2、最优分配;3、内曼分配。

6 怎样分层能提高精度?

答:考虑分层标志的选择及合理的确定层数。一般来说,增加层数能够提高估计的精度,同时考

虑增加层数提高的精度和费用之间的平衡,即增加层数而降低量在精度上是否合算。

习题四

三 简答题

1 简述比率估计提高抽样效率的条件。

答:(1)有相应的准确的辅助可以利用;(2)推断的变量与辅助变量之间存在着相关关系;(3)要

求的样本量较大

2 简述比率估计的应用条件。

答:(1)比估计是有偏估计,要求的样本量较大;(2)研究变量与辅助变量之间有较好的相关关系。 3 从等概率抽样与不等概率的区别来分析进行简单抽样的有效性。

答:当总体单元的差异不大时进行简单随机抽样,即等概率抽样是有效的,但若总体单元之间

的差异较大时,要用不等概率抽样。

4 简述不等概率抽样的主要优点。

答:提高估计的精度,减少抽样误差,以说明单元规模大小的辅助变量来确定每个单元的入样

概率;改善估计量。

5 试举一个利用区域可以直接进行抽样的例子。

答:特点:区域本身就是抽样单元,如调查某师团的总收入或总支出,以连队或团为抽样单元。 6.分析PPS抽样与?PS的抽样效率。

答:PPS抽样重复抽样,?PS产是不重复抽样,因此从抽样效率上分析,前者的效率低于后者。 7.回归估计、比估计与简单估计间的区别;

答:回归估计一般优于比估计和简单估计。当回归系数等于总体比率(即总体回归直线通过原点) 时,回归估计量与比估计量的效果相同;当调查变量与辅助变量间的相关系数ρ等于0时,回归

估计与简单估计效果相同。 8.辅助变量的选择原则;

答:选择与调查变量Y之间有密切相关程度的变量X作为辅助变量。 9.回归系数的选择与确定。

答:1)β的不同取值当然会影响V(Ylr)的值,β取得合理,V(Ylr)就小,否则就大,事实

上β为一特定常数时,Ylr是无偏的,可取到最优值,B=

???SxySx2,V达到最小值。

2)β为样本回归系数,此时回归估计量Ylr不是无偏的。

27

?

习题五

五、简答题

1 简述整群抽样的分群原则。

答:扩大群内方差,缩小群间方差,以提高整群抽样的抽样效率。 2 您如何认识影响整群抽样抽样误差的主要因素是群间方差?

答:在整群抽样时,总体方差分为群内方差和群间方差两部分,在总体各群间进行随机抽

样,使得抽样由群间方差的大小来决定,对被抽中的群进行全面调查所以不存在抽样误差即群内方差不影响抽样误差。

3 整群抽样时,采用无偏估计的方法与比率估计的方法来估计总体总量有何不同?

答:(1)采用比率估计的方法时,是以群的规模作为辅助变量;(2)采用无偏估计的方法,是

采用简单估计的方法进行的,因为没有用到辅助信息,使得无偏估计的方法估计精度不高。

4 简述整群抽样的优点。

答:(1)样本集中,可以降低收集样本的费用;(2)抽取样本的效率比简单随机抽样高;(3)抽样框的编制得以简化。

5 整群抽样时,比率估计的方法估计总体总量与比估计量中的辅助变量有什么不同?

答:(1)比率估计的方法估计总体总量时,辅助变量是总体单元的规模大小Mi;(2)比估计

量中的辅助变量是Xi,

6 简述使用整群抽样的原因。

答:(1)省时、省力、平均单元的调查费用较少;(2) 样本集中,可以降低收集样本的费用;

(3)抽取样本的效率比简单随机抽样高;(4) 抽样框的编制得以简化。

7.整群抽样与分层抽样的区别; 分组须满足的条件

组间 组内

分层抽样 1. 无重复无遗漏; 2. 各层单元数Nh已知

整群抽样 1. 同左;

2. 各群单元数Mi确知

分组目的

组间

组内

层间全面调查(各层都抽取样本) 群间抽调查(只抽部分群) 层内抽样调查(每层只抽部分单元) 群内全面调查

将标志值或指标值差异较大的单元划归为同一群,

将标志值或指标值相近的总体单元划

以扩大“总体抽样单元”,

归为同一层,以“缩小总体”。

抽样时以扩大后的“单元” 为单位。

尽可能缩小群间差异(因

尽可能扩大层间差异(因抽样误差同

抽样误差只与群间差异有

层间差异无关)

关)

尽可能扩大群内差异(因

尽可能缩小层内差异(因抽样误差只

抽样误差同群内差异无

与层内差异有关)

关)

28

8.整群抽样群大小的计量方法;

答:1)常用尺度,群规模Mi,最常用;2)一般尺度,找辅助变量;3)最优尺度,即各变量值之和,该尺度理论上可以,但实际上不可实施 9. 整群抽样的设计效应。 答:设计效应用deff表示:

1?f??1,?c?0??S2?1?(M?1)?c?V(Y)??nM?1?(M?1)?c??1,?c?0 整群抽样的deff=

1?f2Vsrs(y)??1,??0Sc?nM习题六

三 简答题

1 简述系统抽样的主要优点。

答:(1)简便易行,容易确定样本单元;(2)样本单元在总体中分布较简单随机抽样均匀;(3)

采用有关标志排队可提高估计的精度。

2系统抽样的局限性有哪些?

答:(1)如果单元的排列存在周期性的变化,而抽样者对此缺乏了解或缺乏的经验,抽取出

的样本的代表性可能很差:(2)系统抽样的方差估计较为复杂。

3 对于周期性波动的总体上在组织系统抽样的时候应注意什么问题?

答:应克服周期性波动对总体趋势的影响,如采用交叉子样本的方法,可以改变影响。 4 对线性趋势的总体进行系统抽样时应该如何组织?

答:由于样本的确定失去了随机性,会对抽样带来不利的影响,对线性趋势总体的抽样方

法可以进行如下改进:(1)采用中心位置抽样法;(2)对称系统抽样法以提高精度。

5 试举一个总体单元按无关标志排列进行直线等距抽样的例子。

答:一个简单随机抽样的例子总体100人,样本量为10时。如调查总体的人均收入在编制抽样框时,按总体单元的先后顺序登记。

6 简要分析影响系统抽样误差的因素。

答:(1)总体的特征,不同类型的总体在估计总体方差时,有不同的模型;(2)同其它方差一

样影响:抽样比、样本容量、系统样本方差。

补充:(以下只给出答题要点)

1.误差主要包括哪两类?引起的原因分别是什么?

答:抽样调查中的误差有两类,一类称为抽样误差,另一类为非抽样误差。

抽样误差是由于用样本数据对总体特征进行估计所引起的代表性误差。由于每次只是抽取一个样本,而这个样本中包含哪些单元是随机的。不同的样本由于包含的单元不同,得到的估计值自然不同。各个估计值与总体特征之间不可避免的存在差距,由此产生了抽样误差。

非抽样误差的来源比较复杂,主要由有抽样框未能不重不漏的包含所有抽样单元导致的抽样框误差,调查测量不准确引致的测量误差,此外还有无回答误差、粗大误差等。非抽样误差不仅在抽样调查中,在全面调查中也是存在的。减小非抽样误差的方法主要是严格调查程序、规范调查步骤、加强人员的培训和管理,合理地设计问题和答卷,改进测量方法和工具。 2.请列举出样本量在各层的三种分配方法,并说明各种方法的主要思想。

答:比例分配,一般最优分配和奈曼分配。

29

比例分配的思想:每层的样本量nh都与层的大小Nh成比例。特点是估计量具有简单的形式。

一般最优分配的思想:对于给定的费用,使估计量的方差V(yst)达到最小,或者对于给定的估计量方差V,使得总费用达到最小。

奈曼分配的思想:各层的单位抽样费用相等时的最优分配。 3.试述抽样调查的整体思路;

答:抽样调查就是从研究现象总体中按随机原则抽取部分单元组成样本,并根据样本调

查结果对相应地总体参数做出具有一定概率保证的估计推断。 一个完整的抽样调查过程包括抽样阶段、调查阶段和估计推断阶段。

30