数学建模实训之统计方法作业

来源:互联网 发布:千牛有mac版吗 编辑:程序博客网 时间:2024/06/07 03:00

2014年数学建模实训作业

1 数据简介

记录了31个省份的指标, 包括省市名称(shmc), 综合指数(zhzs), 社会结构(shjg), 经济与技术发展(jjfz), 人口素质(rksz), 生活质量(shzl), 法制与治安六项指标(fzza),

2 回归分析

  • 以 综合指数(zhzs) 为响应变量, 以其余变量为解释变量,进行回归分析
  • 观察综合指数和其他变量之间的关系
  • 采用逐步回归法,剔除无关的解释变量,其中有两个变量包括常数项都可以 剔除

3 完成如下回归分析的结果

  • 逐步回归方法得经验方程为 zhzs=                      
  • 对模型的有效性进行分析
    • F统计量的值        
    • p值为        
    • 误差方差的估计        
    • 模型是否有效 (通过p值进行判定)

4 主成分分析作业

  • 对除"省市名称" 和 "综合指数" 外的全部变量进行主成分分析,(基于相关系数矩阵)
  • 挑选第一主成分并按照第一主成分的大小, 对31个省市进行排序,给出排 序结果

5 聚类分析作业

  • 采用 “省市名称” 和 “综合指数”之外的其余变量,对31个省份进行聚类分析, 分为3–5类,并 绘制聚类谱系图
  • 聚类之前对变量进行标准化处理,距离采用平方欧式距离
  • 聚类方法(类间距离定义方法)可以采用:
    • 单连接(最短距离法)
    • 全连接(最长距离法)
    • 重心法
    • wald方法等

6 思考题–选做

  1. 可以采用主成分分析得出前两个主成分,直接进行聚类分析,不再进行标 准化变换
  2. 可以对几个变量进行聚类分析,考察哪些变量关系密切

7 作业的相关要求

  1. 要求对软件输出结果进行分析,

    找出需要的估计量,如系数估计,t统计量的值,p-值,是否显著等结论, 对直接复制软件输出结果,不给出任何分析的作业酌情扣分

  2. 要求制作word文档(挑出作业要求的结果),office 版本不限
  3. 作业上交到邮箱 mailto:yzlv@hdu.edu.cn
  4. 附件文档命名方法 学号姓名.doc,
    • 例如: 1007310张三.doc
    • Word文档中签注学号和姓名
    • doc文档直接作为邮件附件发送(请不要压缩,也不要上传到网盘发链接给 我)

8 数据

"省份""综合指数""社会结构""经济技术发展""人口素质""生活质量""法制与治安""北京"93.210094.7108.497.455.5"上海"92.395.192.711295.457.5"天津"87.993.488.7989062.7"浙江"80.989.485.178.586.658"广东"79.290.486.965.986.559.4"江苏"77.882.174.881.275.974.6"辽宁"76.385.865.793.168.169.6"福建"72.483.471.767.77660.4"山东"71.770.86775.770.277.2"黑龙江"70.178.155.782.167.671"吉林"67.981.151.885.856.868.1"湖北"65.973.548.779.95679"陕西"65.971.548.281.951.785.8"河北"6560.152.475.666.476.6"山西"64.173.2417357.387.8"海南"64.171.646.261.854.5100"重庆"6469.741.976.263.277.9"内蒙古"63.273.542.278.250.281.4"湖南"60.960.540.373.956.484.4"青海"59.973.843.763.94780.1"四川"59.360.743.571.950.678.5"宁夏"58.273.545.967.146.761.6"新疆"64.771.257.275.157.364.6"安徽"56.761.341.263.552.572.6"云南"56.759.449.859.848.172.3"甘肃"56.66636.666.245.879.4"广西"56.163.837.164.456.166.6"江西"54.766.433.361.645.677.5"河南"54.551.642.163.35566.9"贵州"51.161.931.5564175.6"西藏"50.959.750.156.729.962.4



0 0
原创粉丝点击