您的当前位置:首页正文

回归方程和独立性检验知识点

2022-02-01 来源:意榕旅游网


回归方程和独立性检验知识点

(总3页)

-CAL-FENGHAI.-(YICAI)-Company One1

-CAL-本页仅作为文档封面,使用请直接删除

回归分析和独立性检验

一、回归分析

ˆxaˆbˆ (x叫做解释变量,y叫做预报变量) 1、回归直线方程 yˆ其中b(xi1nnix)(yiy)=

ixyii1nninxy (由最小二乘法得出,考试时给出此公式中的一nx2(xi1x)2xi12i个)

ˆx ( 此式说明:回归直线过样本的中心点(x,y) ,也就是平均值点。 ) ˆyba2、几条结论:

(1)回归直线过样本的中心点(x,y)。

(2)b>0时,y与x正相关,散点图呈上升趋势;b<0时,y与x负相关,散点图呈下降趋

势。

(3)斜率b的含义(举例):

如果回归方程为y=+2, 说明x增加1个单位时,y平均增加个单位; 如果回归方程为y=-+2,说明x增加1个单位时,y平均减少个单位。 (4)相关系数r表示变量的相关程度。 范围:r1,即 1r1

,相关性越强。r0时,y与x正相关;r0时,y与x负相关。 r越大..

1] (5)相关指数R2表示模型的拟合效果。 范围:R2[0,,拟合效果越好,(这时:残差平方和越小,残差点在带状区域内的分布比较R2越大..

均匀,

带状区域宽度越窄,拟合精度越高)。

R2表示解释变量x对于预报变量y变化的贡献率。

例如:R20.64,表明“x解释了64%的y变化”,或者说“y的差异有64%是由x引起的”。

(6)线性回归模型 ybxae, 其中e叫做随机误差。(y是由x和e共同确定的。)

2

二、独立性检验

1、原理:假设性检验(类似反证法原理)。

一般情况下:假设分类变量X和Y之间没有关系,通过计算K2值,然后查表对照相应的概率P,

发现这种假设正确的概率P很小,从而推翻假设,最后得出X和Y之间有关系的可能性为(1-P),

n(adbc)22也就是“X和Y有关系”。(表中的k就是K2的观测K(ab)(cd)(ac)(bd)值,即kK2) 2、22列联表: y2 y1 x1 x2 a c 总计 (考试给出)

部分对照表(考试时会给出用到的一部分数据):

P kK2 b d ab cd nabcd 总计 ac bd 3、范围:K2(0,); 性质:K2越大,说明变量间越有关系。 ....三、典型例题

例1、右表中是生产某种产品x(吨)与相应消耗的煤y(吨)记录数据: (1)画出数据的散点图; (2)求线性回归直线方程; (3)估计生产7吨产品时,消耗的煤约为多少吨?

解:(1)散点图如右。从图中可以看出x与y正相关。 (2)(提示:把原数据表抄一遍,并且增加2行和1列, 计算出后面需要用到的数据) ˆxaˆbˆ 设回归直线方程为 yx x y 2ix 3 y 4 5 6 3 4 642510-29 3 16 25 36 4 5 6 3 4 12 20 27 x86 2ix4.5 y3.5 ˆ66.544.53.5=, b8644.52-6ˆx3.50.74.50.35 ˆyb a-10-8xiyi xyii66.5 所以,回归方程为:y0.7x0.35

3

(3)当x7时,y0.770.355.25 所以,估计生产7吨产品时,消耗的煤约为..吨。

例2、为了考察某药物预防疾病的效果,现对105

人进行试验调查,得到22列联表。试判断:服用药物和患病之间是否有关系?

解:n105,a10,b45,c20,d30

K2105(10304520)

555030752 服用药 未服用药 总计 患病 10 20 30 未患病 45 30 75 总计 55 50 105 > (提示:运算时尽量先约分化简,再计算) 所以,有1-=%的把握认为服用药物和患病之间有关系。

4

因篇幅问题不能全部显示,请点此查看更多更全内容