实 验 报 告
课程名称 数学建模 年级 12级 日期 5.19 姓 名 叶美芳 学号 *******1235 班级 数学*班 实验名称 回归分析 一.实验目的及要求: 1. 掌握回归分析的基本理论
2. 会运用回归分析相关理论进行编程和解决实际问题 二.实验内容: 1.背景:
由于有氧锻炼中,人体的耗氧能力是衡量人身体健康状况的重要指标,而耗氧能力(人体单位重量单位时间内最大的耗氧量)在日常生活中难以直接测量,故本文建立相关数学模型,采用机理分析和回归分析以及数据拟合相结合的办法,以期望使普通大众能够方便快键地对自身身体状况有更为直接的了解,也能更加合理科学地锻炼。
2.题目:
习题7:在有氧锻炼中人的耗氧能力y (mL/(min·kg))是衡量身体状况的重要指标,它可能与以下因素有关:年龄x1,体重x2(kg),1500m跑的时间x3(min),静止时心跳速度x4(次/min),跑步后心速x5(次/min),对24名40至57岁的志愿者进行了测试,结果如下表1.1(节选),试建立耗氧能力y与诸因素的之间的回归模型。 表1.1 序号 Y X1 X2 X3 X4 X5
1 44.6 44 89.5 6.82 62 178
2 45.3 40 75.1 6.04 62 185
3 54.3 44 85.8 5.19 45 156
4 59.6 42 68.2 4.9 40 166
… … … … … … …
21 39.4 57 73.4 7.58 58 174
22 46.1 54 79.4 6.7 62 156
23 45.4 52 76.3 5.78 48 164
24 54.7 50 70.9 5.35 48 146
(1) 若中x1~x5只许选择1个变量,最好的模型是什么? (2) 若中x1~x5只许选择2个变量,最好的模型是什么?
(3) 若不限制变量的个数,最好的模型是什么?
(4) 对最终模型观察残查,有无异常点,若有,剔除后如何?
3.做法 :
本题不同小问需要建立不同模型,由于专业知识所限,并且提供的数据较少,难以做出精确符合现实情况的模型,因此这里用最简单的线性回归法进行拟和模型基本形式如下:
y?β0?β1x1?...?βmxm?Σβjkxjxk?ξ1?j,k?m事实上,中的项(高次项和交互项)对于本题目来讲意义不大,因为所给定的5个自变量和因变量之间关系比较模糊,几个变量彼此之间的联系也很难说清,因此用自变量的一次线性拟和就足以适应本题的要求。但作为练习,还是将每种回归方法都使用到了,可以用于参考。具体采用的各个模型将在下面单独说明,这里不再重复。
4.程序
由于本题需要建立多组模型,并且要在不断的调试中发现最合理的,很多命令都要在这个过程中不断使用,这里仅仅给出使用的最基本的命令。
数据
clear
A=[…]; %数据矩阵,略 n=24;
y=A(2,:); %提取各个数据
x1=A(3,:);x2=A(4,:);x3=A(5,:);x4=A(6,:);x5=A(7,:); 绘制散点图(大致判断影响情况) for i=1:5
subplot(2,3,i),plot(A(i+2,:),y,'+'),grid pause end pause
单参数回归(第一问)
X=[ones(n,1),x4']; %这里检验的是自变量x4,实际操作时要分别检验x1~x5 [b,bint,r,rint,s]=regress(y',X); %回归分析程序(а=0.05)
b,bint,s, %输出回归系数估计值、置信区间、以及统计量 rcoplot(r,rint) %残差图
Polytool(x3',y',2) %检验一元多项式回归的结果,输出交互式画面
双参数回归(第二问):用逐步回归法找出最合理的两个变量 X5=[x1',x2',x3',x4',x5'];
stepwise(X5,y'); %利用输出的交互式画面,可以选出最佳的两个变量 XX=[x3',x1']; %当得到了最佳的两个变量后(这里假设是x3\\x1) rstool(XX,y','linear') %检验二元情况下的交互项和高次项
全部参数回归(第三问):
X5=[x1',x2',x3',x4',x5']; %仍然用逐步回归法找出最合理的组合方式
stepwise(X5,y')
第五问要求对残差进行分析,并且剔除异常点,可以在该问得到最终模型后,采用regress得到的残差值和置信区间并根据其绘制残差图,然后再进行剔除操作重新检验。
5.运行结果及分析
散点图