逐步回归分析实例

逐步回归分析在自变量很多时,其中有的因素可能对应变量的影响不是很大,而且x之间可能不完全相互独立的,可能有种种互作关系。在这种情况下可用逐步回归分析,进行x因子的筛选,这样建立的多元回归模型预测效果会

逐步回归分析 x 在自变量很多时,其中有的因素可能对应变量的影响不是很大,而且之间可能不完 x 全相互独立的,可能有种种互作关系。在这种情况下可用逐步回归分析,进行因子的筛 选,这样建立的多元回归模型预测效果会更较好。 yx 逐步回归分析,首先要建立因变量与自变量之间的总回归方程,再对总的方程及 每—个自变量进行假设检验。当总的方程不显著时,表明该多元回归方程线性关系不成立; y 而当某—个自变量对影响不显著时,应该把它剔除,重新建立不包含该因子的多元回归 方程。筛选出有显著影响的因子作为自变量,并建立“最优”回归方程。 回归方程包含的自变量越多,回归平方和越大,剩余的平方和越小,剩余均方也随之 较小,预测值的误差也愈小,模拟的效果愈好。但是方程中的变量过多,预报工作量就会 越大,其中有些相关性不显著的预报因子会影响预测的效果。因此在多元回归模型中,选择 适宜的变量数目尤为重要。 逐步回归在病虫预报中的应用实例: 以陕西省长武地区1984~1995年的烟蚜传毒病情资料、相关虫情和气象资料为例(数 据见),建立蚜传病毒病情指数的逐步回归模型,说明逐步回归分析的具体步骤。 DATA6.xls 影响蚜传病毒病情指数的虫情因子和气象因子一共有21个,通过逐步回归,从中选出对病 情指数影响显著的因子,从而建立相应的模型。对1984~1995年的病情指数进行回检,然后 对1996~1998年的病情进行预报,再检验预报的效果。 变量说明如下: x11 :5月份均温 y :历年病情指数 x12 :5月份降水量 x1 :前年冬季油菜越冬时的蚜量(头/株) x13 :6月份均温 x2 :前年冬季极端气温 x14 :6月份降水量 x3 :5月份最高气温 x15 :第一次蚜迁高峰期百株烟草 x4 :5月份最低气温 有翅蚜量

腾讯文库逐步回归分析实例