11752 管理数量方法与分析

11752 管理数量方法与分析 黑体字 串讲讲义 第一章 数据分析的基础 一、数据集中趋势的度量: ●平均数: 全体数据的和

数据的个数x1?x2???xn1nx???xi,其中数据为xi,i?1,2,?n

nni?1(组中值?频数)的和②分组数据的加权平均数?

频数的和①n个数据的算术平均数=

yiviv1y1?v2y2???vmymi?y???1mv1?v2???vm?vii?1m,

其中m为组数,yi为第i组的组中值,vi为第i组频数。

优点:平均数容易理解,计算;它不偏不倚地对待每一个数据;是数据集的“重心”

缺点:对极端值十分敏感。

【例题】如果一组数据分别为10,20,30和x,若平均数是30,那么x应为 A.30 B.50 C.60 D.80 【答案】选择C

10?20?30?x?30?x?604【解析】考察的知识点为平均数的计算方法。

【例题】某企业辅助工占80%,月平均工资为500元,技术工占20%,月平均工资为700元,该企业全部职工的月平均工资为【 】

A.520元 B.540元 C.550元 D.600元 【答案】选择B

【解析】考察的知识点为加权平均数的计算方法。500?80%?700?20%?540 ●中位数:将数据按从小到大顺序排列,处在中间位置上的一个数或最中间两个数的平均数。 若n为奇数,则位于正中间的那个数据就是中位数,即xn?1 就是中位数。

2xn?xn若n为偶数,则中位数为

22?12就是中位数。

优点:中位数对极端值不像平均数那么敏感 缺点:没有充分地利用数据所有信息 【例题】八位学生五月份的伙食费分别为(单位:元) 360 400 290 310 450 410 240 420则这8位学生五月份伙食费中位数为 【 】 A.360 B.380 C.400 D.420 【答案】B

【解析】共有偶数个数,按从小到大排列后,第4位数360与第5位数400求平均为380 ●众数:数据中出现次数最多的数。

优点:它数据也有意义;它能够告诉我们最普遍、最流行的款式、尺寸、色彩等产品特征。

缺点:一组数据可能没反映了数据中最常见的数值,不仅对数量型数据(数值)有意义,对分类型有众数,也可能众数不唯一。 【例题】对于一列数据来说,其众数( ) A.一定存在 【答案】B

【例题】数列2、3、3、4、1、5、3、2、4、3、6的众数是__________。 ●平均数,中位数和众数的大小关系: 频率直方图是单峰对称:平均数=中位数=众数 频率直方图是左偏分布:众数<中位数<平均数 频率直方图是右偏分布:平均数<中位数<众数

众 数:频率分布直方图中最高矩形的底边中点的横坐标 。

B.可能不存在

C.是唯一的

D.是不唯一的

平均数:频率分布直方图各个小矩形的面积乘底边中点的横坐标之和。

中位数:把频率分布直方图分成两个面积相等部分的平行于Y轴的直线横坐标。 四、数据离散趋势的度量: ●极差R=max-min。 优点:容易计算

缺点:容易受极端值的影响 ●四分位极差=Q3-Q1。

第2四分位点Q2=全体数据的中位数;

第1四分位点Q1=数据中所有≤Q2的那些数据的中位数; 第3四分位点Q3=数据中所有≥Q2的那些数据的中位数。 优点:四分位极差不像极差R那样容易受极端值的影响 缺点:没有充分地利用数据所有信息

●方差:反映数据离开平均数远近的偏离程度。

1n1222n个数据的方差:???(xi?x)?(?xi)?(x)

ni?1n21m1222分组数据的方差:???vi(yi?y)??(yivi)?y

ni?1n其中m, y, v同上, n是数据的个数,y是分组数据的加权平均数。

2i

i

●标准差: ???2 (方差的算术平方根,与原来数据的单位相同)

●变异系数:v??x(%) (反映数据相对于其平均数的分散程度)

两组数据的平均数不同或两组数据的单位不同时用。 【例题】为了调查常富县2002年人均收入状况,从该县随机抽取100人进行调查,得到年人均收入的数据如下(单位:万元): 人数 年人均收入 0-0.5以下 36 根据上述分组数据,回答下面的问题: 0.5-1.0以下 23 画出收入分布的直方图,并说明分布的形状(5分) 1.0-1.5以下 21 计算该样本的年人均收入及标准差(6分) 1.5-2.0以下 10 收入最高的20%的人年均收入在多少以上?(3分) 【答案】1. 2.0-2.5以下 5 2.5-3.0以下 3 人数 3.0-3.5以下 2 频数 40 20 0 0.5 1 1.5 2 2.5 3 3.5 年人均收入 2. 由直方图,可见随着年人均收入的增加,人数在逐渐下降。 m年人均收入 人数 组中值 ?yivi0-0.5以下 36 0.25 i?1 年人均收入y?m 0.5-1.0以下 23 0.75 ?vi1.0-1.5以下 21 1.25 i?11.5-2.0以下 10 1.75 2.0-2.5以下 5 2.25 2.5-3.0以下 3 2.75 3.0-3.5以下 2 3.25 ?0.25?36?0.75?23?1.25?21?1.75?10?2.25?5?2.75?3?3.25?2100 =0.96

221m122 方差???vi(yi?y)??(yivi)?y=0.5559

ni?1n 标准差x?z??2n=0.75

3. 收入最高的20%的人年均收入在1.5万元以上

【解析】本题考察的知识点为第一章的基本知识: 直方图的画法,分组数据的均值和方差的求法。

【例题】在一次知识竞赛中,参赛同学的平均得分是80分,方差是16,则得分的变异系数是( ) A.0.05

B.0.2

C.5

D.20

【答案】A. 【解析】根据变异系数公式:v??x,得出4/80=0.05

四、相关分析: ●相关关系:变量之间存在不确定的数量关系 1.线性相关:变量的关系近似线性函数;

不完全正线性相关 不完全线性相关

不完全负线性相关

完全正线性相关

完全线性相关

完全负线性相关 1.非线性相关:变量的关系近似非线性函数; 完全非线性相关

不完全非线性相关

3.不相关:变量之间没有任何规律。

●简单相关系数:(x1,y1),?,(xn,yn)是总体(X,Y)的n对观察值

r??(xi?x)(yi?y) 或

?(x2i?x)??(yi?y)2r?n?xiyi??xi?yi记?Lxyn?x2?(?x222ii)?n?yi?(?yi)Lxx?L

yy r反映两个变量之间线性相关的密切程度,|r|≤1。

r=-1 完全负相关 r=1 完全正相关 -1≤r<0 负相关 00.8 高度线性相关 17.若变量Y与变量X有关系式Y=3X+2,则Y与X的相关系数等于( ) A.一1 B.0 C.1 D.3

10.当所有观察点都落在回归直线y=a+bx上,则x与y之间的相关系数为( A.r=0

B.r2

=1

C.-1

第二章 概率与概率分布 (二)、重难点串讲 一、随机试验与随机事件: ●随机试验: 1.可以在相同的条件下重复进行;

2.试验的结果不止一个,但所有可能的结果在试验之前都知道; 3.每次试验之前,不知道这次试验出现哪个结果。 ●样本空间Ω:

1.随机试验中每个可能的结果,称为一个基本事件(或样本点); 2.基本事件的全体所组成的集合称为样本空间(是必然事件);

3.若干个样本点组成的集合(即样本空间的子集),称为随机事件(简称事件);事件A发生?A中一个样本点出现; 4.不含任何样本点的事件是不可能事件?。 ●样本空间的表示方法:列举法, 描述法。 二、事件的关系和运算 ●事件的运算 )

1.并A∪B:A发生或B发生(或A,B至少有一个发生)的事件,常记作A+B。 2.交A∩B:A,B同时发生的事件,常记作AB。 3.差A-B:A发生,但B不发生的事件。

互斥事件:事件A,B中若有一个发生,另一个一定不发生(即AB=?),则称 事件A,B

互斥,否则称A,B相容。

对立事件:若事件A,B互斥,且A∪B是样本空间(即AB=?,A+B=Ω),则称 事件A,B

对立(或互逆)。 A的对立事件记作A,A表示A不发生 (A

A=?, A+

A=Ω)。

例:A、B、C三个事件中,只有一个发生可以表示成:

ABC?ABC?ABC 一个常用的等式:A-B=A-AB=AB

●运算律: 交换律:A∪B=B∪A, AB=BA;

结合律:(A+B)∪C=A∪(B∪C), (AB)C=A(BC);

分配律:(A+B)C=AC+BC, (AB)∪C=(A∪C)(B∪C); 对偶律:A?B?AB,AB?A?B。

【例题】A与B为互斥事件,则AB为( )

A.AB B.B C.A

D.A+B

【答案】C

【解析】可画事件图或根据A =AB+AB,又AB=?推出A =AB 【例题】设A、B为两个事件,则A-B表示( ) A.“A发生且B不发生”

B.“A、B都不发生” C.“A、B都发生”

D.“A不发生或者B发生”

【答案】A 三、概率的定义: ●事件A发生的频率的稳定值称为A的概率,记作 P(A)(0≤P(A)≤1)。 ●概率的性质:0≤P (A)≤1, P(?)=0, P(Ω)=1。

【例题】设A、B为两个事件,P(A)=0.5,P(A-B)=0.2,则P(AB)为( ) A.0.2

B.0.3

C.0.7 D.0.8 【答案】B 四、古典概型: ●古典概型:若随机试验的样本空间只含有限个样本点,且每个样本点发生的可能性相同,

则P(A)=

A所含样本点个数样本点总数。

●排列:从n个不同元素中任取r个,按照一定的顺序排成一列, 称为从n个不同元素中任

取r个的一个排列。

所有排列的个数, 称为从n个不同元素中任取r个的排列数,记作Prn。

Prn?n!r!?n?(n?1)(n?2)?(n?r?1) ●组合:从n个不同元素中任取r个,不管怎样的顺序合成一组, 称为从n个不同元素中任

取r个的一个组合。

所有组合的个数, 称为从n个不同元素中任取r个的组合数,记作Crn。

Crn!n?(n?1)(n?2)?(n?rn?r!(n?r)!??1)(n?r)!

显然 P11nn?Cn?n, Cn?1。

【例题】袋中有红、黄、蓝球各一个,每一次从袋中任取一球,看过颜色后再放回袋中,共取球三次,颜色全相同的概率为( ) A.1/9 B.1/3 C.5/9 D.8/9

【答案】选择A

【解析】古典概型。共336种掷法;和为4,共3种可能。故答案为3/36. 五、概率公式: 1.互逆概率:对任意事件A, P(

A)=1- P(A);

2.加法公式:P(A+B)=P(A)+P(B)-P(AB) 可以推广到有限个事件的并的情形,如:

P(A+B+C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC) A、B互斥,则AB??,P(AB)?0

则P(A?B)?P(A)?P(B)?P(AB)?0.8

3.减法公式:P (A-B)=P(A)-P(AB)

特别地, 当A?B时, P(A-B)=P(A)-P(B); 4.条件概率公式:P(A|B)=

P(AB) (P(B)>0)

P(B)5.乘法公式:P(AB)=P(A)P(B|A),P(A)≠0;

6.全概公式:设事件A1, A2,?, An两两互斥, A1+?+An=Ω,且P(A1)>0, ?, P(An)>0, 则 对任意事件B,有 P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+?+P(An)P(B|An); 7.贝叶斯公式:条件同上,则对任意事件B (P(B)>0),有

P(AiB)?P(Ai)P(B|Ai)P(AiB)??i?1?i?1P(A|B)=, i=1,2,?,n, P(B)P(B)P(B)i

nn(分母中的 P(B) 用全概公式求)。

【例题】北方大学统计系06级3班共有60名同学,至少有2名同学生日相同的概率为(一年按 365天计算)( )

60!A.

3656060P365 B.

365606060P365P365 C. D.1?365!36560

【答案】D

【解析】(互逆概率公式)可设A={所有同学生日均不相同}, 则利用古典概型概率计算方法: 60P365 P{至少有2名同学生日相同}=1-P(A)=1?

3656011【例题】如果事件A的概率为P(A)?,事件B的概率为P(B)?,下列陈述中一定正确的是

4411A.P(A?B)?B.P(A?B)?2 2 11D.P(A?B)?C.P(A?B)?4 2

【答案】B

【解析】利用概率的加法公式因为P(A?

B)?P(A)?P(B)?P(AB)?1?P(AB), 2P(AB)?0,故 P(A?B)?1,选B。

2【例题】如果事件A发生的概率P(A)?0.6,事件B发生的概率P(B)?0.4,并且已知B?A,则P(A|B)?( )

0.6 B. 0.4 C. 1 D. 0 【答案】C 【解析】B?A,所以AB=B,利用条件概率公式,P(A|B)?P(AB)?P(B)?1

P(B)P(B)【例题】天地公司下属3家工厂生产同一种产品,3家公司的次品率分别为0.01,0.02,0.015,而3家工厂的日产量分别为2000,1000,2000,则

天地公司该产品的总次品率是( )

A. 0.015 B. 0.014 C. 0.01 D. 0.02 【答案】B

【解析】全概率公式。

设3家公司分别为i={任取一产品为第i家公司产品},i=1,2,3 B={产品为次品}

则P(B)=P(A1)P(B|A1)+P(A2)P(B|A2) +P(A3)P(B|A3)

A? 六、事件的独立性

●若A,B两事件中不论哪一个事件发生与否并不影响另一个事件发生的概率,则称两个事件相互独立。P(AB)=P(A)P(B) 若A,B独立,则P(A|B)=P(A),P(B|A)=P(B) 性质:若A与B独立,则200010002000?0.01??0.02??0.015?0.014500050005000

A与B、A与B、A与B也独立。

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4