matlab逐步回归图形分析法,用MATLAB做逐步回归.pptx
1、逐步回归法,班级:研1614,学生:秦培歌,认为社会学家犯罪和收入低,与失业和人口规模有关,20个城市的犯罪率(每10万人的犯罪人数)和年收入在5000美元以下的家庭的百分比1,失业率2和人口总数3 (千人)。 在(1)13中最多只择不开2个变量时,最好的模型是什么? (2)包含三个参数的模型比上面的模型好吗? 决定最终模型。 分析:为了获得更直观的认识,可以创建犯罪率y和年收入在5000美元
1、逐步回归法,班级:研1614,学生:秦培歌,认为社会学家犯罪和收入低,与失业和人口规模有关,20个城市的犯罪率(每10万人的犯罪人数)和年收入在5000美元以下的家庭的百分比1,失业率2和人口总数3 (千人)。 在(1)13中最多只择不开2个变量时,最好的模型是什么? (2)包含三个参数的模型比上面的模型好吗? 决定最终模型。 分析:为了获得更直观的认识,可以创建犯罪率y和年收入在5000美元以下的家庭的百分比1,失业率2和人口总数3 (千人)之间的关系的散布图,根据大概的分布估算各要素造成的影响的大小,用逐步回归法决定应该选择哪个参数作为模型clc; 清除全部; y=11.213.440.7。
2、5.324.812.720.935.78.79.614.526.915.718.128.925.821.725.7。 百分之十犯罪率(人/十万人) x1=16.520.526.316.516.220.221.317.214.318.123.119.124.624.922.420.216.9。 %低收入家庭的百分比x2=6. 26.49.35.37.35.96.47.64.96.46.45.66.68.58.78.68.66.46.77。 %失业率x3=5876436356921248643196415317497895762793741625854716921595353。 %总人口(千人) 。
3、figure(1)、plot(x1,y,* ); 图形(2)、打印(x 2、y、* ); 图形(3)、打印(x 3、y、* ); X1=x1、x2、x3; stepwise(X1,y )制定了以下计程仪计划:运行结果和结论:犯罪率和低收入散布图、犯罪率和失业率散布图、犯罪率和人口总数散布图、低收入和失业率为自变量、低收入和人口总数为自变量、失业率和人口总数为自变量,从上图所示的相关性角度选择自变量以低收入和失业率为自变量时的RMSE=4.64848以低收入和人口总数为自变量时的RMSE=5.62245以失业率和人口总数为自变量时的RMSE=5.04083以低收入和失业率为自变量,RMSE最小,。
4、因此选择两个变量作为自变量的会最合适然后得到的三者的关系为:y=-34.0725 1.22393 .对以三个参数为云同步的模型进行分析,发现如果我们把这三个参数作为云同步的自变量,则为=4.58978,比以低收入和失业率两者为参数时小一点因此,我们依然选择了低收入和失业率两个变量作为最终模型,得出了结论: y=-34.0725 1.22393 .以上用stepwise ()命令逐次完成回归,求出了最佳方程模型。 最后,用多元回归计程仪柱求出的线性方程显着性,即相关系数法测定其适合度。建立程序如下:y=11.213.440.75.324.812.720.935.78.714.526.915.73。
5、6.218.928.925.821.725.7。 ab、状态、y、ylr=注册2 (x,y )表=状态1、pj=状态2、可运行:ab=-34.0725。 table=色散源偏差平方和自由度色散f比f显微性x 1100.25971100.25974.63994.4513显微性x2179.51991 179.51998.30798.3997显微回归1.4879e 003 2 743.9297 34.4278 3。 5915高度显萧残留佗367.3426 17 21.6084 6.1121总和1.8552e 003 19 Pj=0.4016 0.5374, 方差分析表和相关性检验:假设0 : 0=1=2=0通过校正计算得到: SST=1.8552 SSE=367.3426 SSR=1.4879 e 003方差分析表表示由于f,回归方程水平较高,根据以上方差分析表:【分相相关系数】R=0.8955 R 通过【估计残留误差标准误差】S=4.6485校正计算获得的回归标准误差表明回归直线到样本数据点的适合度很高。
更多推荐


所有评论(0)