乙市场平均价格x??xf?f?5.3?1.325(元)(3分) 4说明:两个市场销售单价是相同的,销售总量也是相同的,影响两个市场平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同。甲市场销售价格较高的乙产品最多,而乙市场销售价格最低的甲产品最多,因而使得甲市场的平均价格高于乙市场。这就是权数在平均数形成中所起的权衡轻重的作用(4分)。 2.解:根据题意:提出假设:H0:u?50,H1:u?50 检验统计量t?x?u050.2?50??0.9733
S/n0.65/10由=,查表临界值t?/2?t0.025?2.2622
由于t= 3.解:b?n?xy??x?yn?x2???x?2?10?6275?473?122?0.195(4分) 210?24959?473a?y?bx?12.2?0.915?47.3?2.9765(4分) yc?a?bx?12.9756?0.195x 当x?5时y?a?bx?2.9756?0.195?5?3.95元(2分) 题库四答案 一、选择题(每题2分,共20分) 二、多项选择题(每题2分,共10分) 2. CDE 三、填空题(每空2分,共20分) 1. 2. 3. 4. 5. 定性数据、定量数据 定类尺度、定序尺度、定距尺度、定比尺度 各组权数相等 矩估计法、极大似然估计法 -1,1 四、简答题(每题5分,共20分) 1. 答:(1)众数:不受极端值影响,具有不惟一性,数据分布偏斜程度较大时应用(1分)。 (2)中位数:不受极端值影响,数据分布偏斜程度较大时应用(2分)。 (3)平均数:易受极端值影响,数学性质优良,数据对称分布或接近对称分布时应用(2分)。 2.答:随机原则,就是排除主观意愿的干扰,使总体的每个单位都有一定的概率被抽选为样本单位,每个总体单位能否入样是随机的(2分)。 遵循随机原则抽样,能有效避免主观选样带来的倾向性误差,使得样本资料能够用于 估计和推断总体的数量特征,而且使这种估计和推断得以建立在概率论和数理统计的科学理论上,可以计算和控制抽样误差,能够说明估计结果的可靠程度(3分)。 3.答:以标准差系数为例。标准差系数是标准差与均值的比较,是一个无量纲的相对数,用于反映与比较数据的离散程度。(2分) 因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数。(3分) 4、答:拒绝原假设的最小的显着性水平,被称为观察到的显着性水平(2分)。 p值检验:若p??,不能拒绝H0;若p,拒绝H0(3分) 五、计算题(每题10分,共30分) xf?1.解:均值:xB?fiiiB22?5?5?15?3?25B16(件) (5分) 10i标准差:sB?(x?x)f?f?1iiB490B7.38(件)(5分) 10?12.解:根据题意:提出假设:H0:u?4,H1:u?4 检验统计量Z?x?u04.5?4??2(5分) ?/n1/16由=,查表临界值Z??Z0.05?1.645 由于Z=2>Z?=,所以应拒绝H0而接受H1,即西安市家庭每天看电视的时间确有显着提高。(5分) 3.解:b?n?xy??x?yn?x???x?22?5.2(4分) a?y?bx?20.4(4分) yc?a?bx?20.4?5.2x 当x?5时y?a?bx?20.4?5.2?8?62分(2分) 题库五答案 一、选择题(每题2分,共20分) 二、多项选择题(每题2分,共10分) 2. AB 5.AB 三、填空题(每空2分,共20分) 1. 2. 3. 4. 5. 统计工作、统计数据、统计学 变量水平、权数 各组权数相等 所有单位、全面调查 无线性相关、完全负相关 四、简答题(每题5分,共20分) 1. 答:有关数据均值的计算。当数据呈较严重偏态分布时,用平均数则代表性很差(2分)。正确使用的原则: (1)众数:不受极端值影响,具有不惟一性,数据分布偏斜程度较大时应用(1分)。 (2)中位数:不受极端值影响,数据分布偏斜程度较大时应用(1分)。 (3)平均数:易受极端值影响,数学性质优良,数据对称分布或接近对称分布时应用(1分)。 2.答:随机原则,就是排除主观意愿的干扰,使总体的每个单位都有一定的概率被抽选为样本单位,每个总体单位能否入样是随机的(1分)。 遵循随机原则抽样,能有效避免主观选样带来的倾向性误差,使得样本资料能够用于估计和推断总体的数量特征,而且使这种估计和推断得以建立在概率论和数理统计的科学理论上,可以计算和控制抽样误差,能够说明估计结果的可靠程度(3分)。 3.答:标准差系数是标准差与均值的比较,是一个无量纲的相对数,用于反映与比较数据的离散程度。(2分) 因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数。(3分) 4、答:SST----总离差平方和,反映全部数据总的误差程度;SSE-----误差项离差平方和,反映随机误差的大小;SSA-----水平项离差平方和,反映随机误差和系统误差的大小;(3分) 三者之间的关系:SST=SSA+SSE。(2分) 五、计算题(每题10分,共30分) 1.解:x??xf1083??10.83(百元/人)(4分) f100?2s?(xi?x)?= (百元/人) (4分) ?f?1v?s?% (2分) x 2.解:n?49是大样本, 已知:x?12.6,S?2.8 ??0.0455 则有: Z??Z0.022752S22.8?2 平均误差=??0.4 (3分) n7极限误差??Z?2S2?2?0.4?0.8 (3分) nS2?x?? (4分) n据公式 x?Z?2代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,)元。 3.解:计算估计的回归方程: ?1??n?xy??x?y5?42430?290?7213060== (4分) ?2225400n?x?(?x)5?17900?290?y?0??n??1??xn? – ×58= (4分) ?估计的回归方程为:y=+x (2分) 题库六答案 一、选择题(每题2分,共20分) 二、多项选择题(每题2分,共10分) 2. ABCD 5.AB 三、填空题(每空2分,共20分) 1. 2. 3. 4. 5. 全面调查、非全面调查 正态曲线、平顶曲线、尖顶曲线 各组权数相等 越大,越小 右偏、左偏 四、简答题(每题5分,共20分) 1. 答:(1)是一门搜集、整理和分析统计数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。(3分) (2)统计学与统计数据有密不可分的关系。统计学是由一套收集和处理统计数据的方法所组成,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究。统计数据不用统计方法去分析也仅仅是一堆数据而已,无法得出任何有益的结论。(2分) 2.答:任意两个总体平均数的代表性比较,应当用标准差系数。标准差系数是标准差与均值的比较,是一个无量纲的相对数,用于反映与比较数据的离散程度。(2分) 因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数。(3分) 3.答:影响因素包括:总体各单位的差异程度(即标准差的大小),总体各单位的差异程度越大,抽样误差越大(2分);样本单位数的多少,样本单位数越大,抽样误差越小(1分);抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小(1分);抽样组织方式:简单随机抽样的误差最大(1分)。 4、答:拒绝原假设的最小的显着性水平,被称为观察到的显着性水平(2分)。 p值检验:若p??,不能拒绝H0;若p,拒绝H0(3分) 五、计算题(每题10分,共30分) 1.解:x??xf1083??10.83(百元/人)(4分) 100?f2s?(xi?x)?= (百元/人) (4分) f?1?v?s?% (2分) x ?x?sn?0.07310=,(3分) 2.解:解:抽样平均误差已知F (z)=%,z=2, ???x?z?2?0.0073?0.0146 (3分) 区间的下限是:X??=米) 区间的上限是:X??=+=(米) 故可以%的概率保证这些初中生的身高在米- 米之间。(4分) 3.解:计算估计的回归方程: ???2 n?xy??x??y?9?803.02?472?13.54?0.02739?28158?(472)n?x?(?x),(4分) 22213.54472???1?y??2x??0.0273??0.072799 (4分) Y=+ (2分)