1
相关分析与回归分析的联系和区别
联系
相关分析和回归分析是互为补充的,密切联系的。相关分析需要回归分析来表明现象数量关系的具体形式,而回归分析则应该建立在相关分析的基础上。依靠相关分析表现现象的数量变化具有密切相关,进行回归分析求其相应的具体形式才有意义。
区别
(1)相关分析中的两个变量是对等关系,而在回归分析中的两个变量中一个是自变量,另一个是因变量。
(2)相关分析中的两个变量都是随机的变量,而在回归分析中只有因变量是随机的,而把自变量当着研究时可以控制的量,即在给定不同自变量数值的条件下,观察对应的因变量数值变化情况,所以自变量不是随机变量。
(3)相关关系只能用相关系数来表示,而且相关系数只有一个。而回归分析是采用回归方程式来反映,若两个变量相互依存,则可得几个回归方程式。
(4)利用回归方程式,可以进行预测。可以通过一个自变量的值,来推算因变量的估计值,当然不能利用这个方程,给定因变量值来推算自变量值。
2 统计研究对象的特征
数量性 总体性 具体性
3统计总体特征 :
同质性
统计总体就是根据一定的目的和要求所确定的研究事物的全体,它是由客观存在的、具有某种相同性质的许多单位组成的集体。 差异性
随着统计研究的目的和任务的不同,构成统计总体的总体单位也不尽相同 大量性
大量性是指总体中包括的总体单位有足够多的数量.总体是由许多个体在某一相同性质基础上结合起来的整体,个别或很少几个单位不能构成总体.总体的大量性,可使个别单位某些偶然因素的影响——表现在数量上的偏高、偏低的差异——相互抵消,从而显示出总体的本质和规律性.
4 调查方案包括几方面内容
(一)确定调查目的
(二)确定调查对象和调查单位 (三)确定调查项目
(四)设计调查表或调查问卷 (五)确定调查时间
(六)确定调查的组织实施计划
5
例2:对某市居民独立拥有橱卫设施情况进行调查,随机抽取900居民户,其中675户居民拥有独立的橱卫设施。要求抽样极限误差范围不超过2.73%,试对该市居民独立拥有橱卫设施的比重进行区间估计。
第一步,根据样本资料,计算样本成数和标准差,并计算抽样平均误差。 675p??75% 900 ?p?p(1?p)?0.75?0.25?0.43
?.43 ?p?p?0900?1.4%n
第二步,根据给定的极限抽样误差,计算总体成数的上、下限。 下限?p?Δp?75%?2.73%?72.27%
上限?p?Δp?75%?2.73%?77.73%
第三步,计算概率度,并查表得到置信度。 ?p2.73%t???1.96
?p1.4%
当t?1.96,查正态分布表得到F(1.96)?0.95
我们可以有95%的概率保证程度,估计该市居民户拥有独立橱卫设施的比重在72.27%—77.73%之间。
例3:某外贸公司出口一种茶叶,规定每包规格不低于150克,现在用不重复抽样的方法抽取其中1%进行检验。测得结果如下表。要求以99.73%的概率估计这批茶叶平均每包的重量范围。以便确定平均重量是否达到规格要求。 ? 某外贸公司出口茶叶抽样资料 (x?x)2f每包重量(克) 包数f 组中值x xf 148—149 149—150 150—151 151—152 合 计
10 20 50 20 100 148.5 149.5 150.5 151.5 —— 1485 2990 7525 3030 15030 32.4 12.8 2.00 28.8 76.00 第一步,根据样本资料计算样本平均数和标准差,并推算抽样平均误差。
2
?n0.872 ?x?1??1?1%?0.0867(克)N n100
第二步,根据给定的置信度F(t)=0.9973,查正态分布表得到概率度t=3。 第三步,根据概率度和抽样平均误差计算抽样极限误差,并估计总体平均数的上、下限,判断其是否达到规格要求。 ?x?t??x?3?0.0868?0.26(克) 下限?x??x?150.3?0.26?150.04(克)
上限?x??x?150.3?0.26?150.56(克)
可以用99.73%的概率,保证该批茶叶平均每包重量在150.04克—150.56克之间,表明这批茶叶平均每包重量达到了规格要求。
例4:仍用例3的资料,要求用同样的概率保证程度,估计这批茶叶包装合格率范围。
第一步,根据样本资料计算样本合格率和标准差,并推算抽样平均误差。
n70 p?1??0.7n100
?p?p?1?p??0.7?0.3?0.458
?pn0.458?1?1%??0.0456??1??p Nn100
第二步,根据给定的置信度F(t)=0.9973,查正态分布表得到概率度t=3。 第三步,根据概率度和抽样平均误差计算抽样极限误差,并估计总体合格率的上、下限。 ?p?t??p?3?0.0456?0.137
下限?p??p?0.7?0.137?0.563
上限?x??x?0.7?0.137?0.837
可以用99.73%的概率,保证该批茶叶包装的合格率在56.3%—83.7%之间。
x?f15030?x???150.(克)3f100??x?x??f76?????0.872(克)f100?6
联立(1)、(2)两式得b?n?xy??x?yn?x2???x?2Lxyn??2Lxx?x??2?x?nx?y??xy?