回归直线方程公式详解,回归直线方程公式回归直线方程公式的详解定义与基本原理简单线性回归旨在找到一个线性关系来描述两个变量之间的相关性:一个独立变量(通常记作 (x))和一个可能的依赖变量(通常记作 (y))。通过这个线性关系,我们可以预测或估计缺失的数值,这种做法称为插值。最小二乘回归线(LSRL)该方法基于最..
13297143156 立即咨询发布时间:2025-02-10 热度:91
回归直线方程公式详解,回归直线方程公式
简单线性回归旨在找到一个线性关系来描述两个变量之间的相关性:一个独立变量(通常记作 (x))和一个可能的依赖变量(通常记作 (y))。通过这个线性关系,我们可以预测或估计缺失的数值,这种做法称为插值。
该方法基于最小二乘法的思想,即最小化所有数据点到拟合直线的垂直距离之和。考虑以下尝试绘制最佳拟合线的例子:
图1 和 图2 看起来都是合理的选择,但实际上 图3 是最准确的,因为它使用的是最小二乘回归线进行计算。
回归线的方程为:
[ \hat{y} = a + bx ]
其中:
(\hat{y}) 表示 (y) 的预测值,
(a) 称为截距,表示回归线与 (y) 轴相交的位置,
(b) 表示斜率,预测 (x) 每单位变化时 (y) 的变化量。
参数 (a) 和 (b) 可以按如下方式计算:
斜率 (b):
[ b = \frac{S_{xy}}{S_{xx}} = \frac{\sum(x_i-\bar{x})(y_i-\bar{y})}{\sum(x_i-\bar{x})^2} = \frac{\sum(xy) - \frac{\sum{x} \sum{y}}{n}}{\sum(x^2) - \frac{(\sum{x})^2}{n}} ]
截距 (a):
[ a = \bar{y} - b\bar{x} ]
其中:
(\bar{x} = \frac{\sum{x}}{n}) 表示 (x) 的平均值,
(\bar{y} = \frac{\sum{y}}{n}) 表示 (y) 的平均值。
假设化学物质的质量 (y) (克)与其反应时间 (x) (秒)之间存在线性关系,具体数据如下表所示:
时间, (x) (秒) | 5 | 7 | 12 | 16 | 20 |
---|---|---|---|---|---|
质量, (y) (克) | 40 | 120 | 180 | 210 | 240 |
我们需要找出回归线的方程。
首先计算 (x) 和 (y) 的平均值:
[ \bar{x} = \frac{\sum{x}}{n} = \frac{5 + 7 + 12 + 16 + 20}{5} = 12 ]
[ \bar{y} = \frac{\sum{y}}{n} = \frac{40 + 120 + 180 + 210 + 240}{5} = 158 ]
然后利用下列表格计算所需值:
(x_i) | (y_i) | (x_i - \bar{x}) | (y_i - \bar{y}) | ((x_i - \bar{x})(y_i - \bar{y})) | ((x_i - \bar{x})^2) |
---|---|---|---|---|---|
5 | 40 | -7 | -118 | 826 | 49 |
7 | 120 | -5 | -38 | 190 | 25 |
12 | 180 | 0 | 22 | 0 | 0 |
16 | 210 | 4 | 52 | 208 | 16 |
20 | 240 | 8 | 82 | 656 | 64 |
总计 | 1880 | 154 |
现在可以计算 (b):
[ b = \frac{S_{xy}}{S_{xx}} = \frac{1880}{154} = 12.208 ]
接着计算 (a):
[ a = \bar{y} - b\bar{x} = 158 - 12.208 \times 12 = 11.506 ]
因此,回归线的方程为:
[ \hat{y} = 11.506 + 12.208x ]
为了了解学生一年内的反应技能提升情况,八名学生在年初和年末各参加了一次测试,得分如下表所示:
学生 | Liam | Felicity | Adian | Mel | Leroy | Vic | Lawrie | Louise |
---|---|---|---|---|---|---|---|---|
第一次测试, (x) | 56 | 75 | 61 | 61 | 67 | 72 | 62 | 61 |
第二次测试, (y) | 21 | 39 | 34 | 21 | 32 | 24 | 29 | 24 |
已知:
[ \sum{x} = 515, \quad \sum{y} = 224, \quad \sum{x^2} = 33441, \quad \sum{y^2} = 6576, \quad \sum{xy} = 14590 ]
我们需要找出回归线的方程。
我们已经知道最小二乘回归线的方程为:
[ \hat{y} = a + bx ]
给定一些总和值,我们将使用以下公式计算 (b):
[ b = \frac{S_{xy}}{S_{xx}} = \frac{\sum(xy) - \frac{\sum{x} \sum{y}}{n}}{\sum(x^2) - \frac{(\sum{x})^2}{n}} ]
代入已知值得:
[ b = \frac{14590 - \frac{515 \times 224}{8}}{33441 - \frac{515^2}{8}} = 0.590 ]
接下来计算 (a) 需要先求出 (x) 和 (y) 的平均值:
[ \bar{x} = \frac{\sum{x}}{n} = \frac{515}{8} = 64.375 ]
[ \bar{y} = \frac{\sum{y}}{n} = \frac{224}{8} = 28 ]
[ a = \bar{y} - b\bar{x} = 28 - (0.590 \times 64.375) = -10.016 ]
所以回归线的方程为:
[ \hat{y} = -10.016 + 0.590x ]
简单线性回归线 (\hat{y} = a + bx) 可以这样理解:
(\hat{y}) 是 (y) 的预测值,
(a) 是截距,表示回归线与 (y) 轴相交的位置,
(b) 表示 (x) 每单位变化时 (y) 的变化量。
我们还可以使用回归线方程来寻找缺失数据的大致值,但这在数据范围之外进行估计是不可靠的。
使用之前关于化学物质质量随时间增加的数据,我们得出回归线方程为 (\hat{y} = 11.506 + 12.208x)。这表明时间每增加 1 分钟,化学物质的质量增加 12.208 克。当时间为零时(即 (x) 为零),初始质量为 11.506 克。
问题 :十秒后化学物质的质量是多少?
解答 :将时间 (x = 10) 代入方程计算 (\hat{y}):
[ \hat{y} = 11.506 + 12.208 \times 10 = 133.586 ]
这意味着实验进行了 10 秒后,化学物质的质量为 133.586 克。可以通过散点图检查此值是否合理。
问题 :五秒内化学物质的质量增加了多少?
解答 :由于每分钟质量增加 12.208 克,因此五秒内质量增加量为:
[ 12.208 \times \frac{5}{60} \approx 1.017 \text{ 克} ]
问题 :化学物质质量增加 50 克需要多长时间?
解答 :因为每分钟质量增加 12.208 克,所以增加 50 克所需的时间为:
[ \frac{50}{12.208} \approx 4.095 \text{ 分钟} ]
通过以上详细解析,希望你对回归直线方程有了全面的理解,并能熟练应用于实际问题中。如有更多问题,欢迎继续探讨!
回归直线方程公式详解,回归直线方程公式回归直线方程公式的详解定义与基本原理简单线性回归旨在找到一个线性关系来描述两个变量之间的相关性:一个独立变量(通常记作 (x))和一个可能的依赖变量(通常记作 (y))。通过这个线性关系,我们可以预测或估计缺失的数值,这种做法称为插值。最小二乘回归线(LSRL)该方法基于最...