欢迎来到得力文库 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
得力文库 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    统计分析实验报告(共15页).doc

    • 资源ID:14016005       资源大小:393KB        全文页数:15页
    • 资源格式: DOC        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计分析实验报告(共15页).doc

    精选优质文档-倾情为你奉上 统计分析综合实验报告学院: 专业:姓名: 学号:统计分析综合实验考题一 样本数据特征分析:要求收集国家统计局2011年全国人口普查与2000年全国人口普查相关数据,进行二者的比较,然后写出有说明解释的数据统计分析报告,具体要求如下:1报告必须包含所收集的公开数据表,至少包括总人口,流动人口,城乡、性别、年龄、民族构成,教育程度,家庭户人口八大指标;2报告中必须有针对某些指标的条形图,饼图,直方图,茎叶图以及累计频率条形图;(注:不同图形针对不同的指标)3采用适当方式检验二次调查得到的人口年龄比例以及教育程度这两个指标是否有显著不同,写明检验过程及结论。4报告文字通顺,通过数据说明问题,重点突出。二线性回归模型分析: 自选某个实际问题通过建立线性回归模型进行研究,要求:1. 自行搜集问题所需的相关数据并且建立线性回归模型;2. 通过SPSS软件进行回归系数的计算和模型检验;3. 如果回归模型通过检验,对回归系数以及模型的意义进行解释并且作出散点图一、样本数据特征分析2010年全国人口普查与2000年全国人口普查相关数据分析报告 2000年与2011年全国人口普查各项指标原始数据 单位(人)年份2000年2011年总人口数家庭户人口数流动人口数城乡构成农村居民人口数城镇居民人口数性别构成男性人口数女性人口数年龄构成0-14周岁人口数15-59周岁人口数60周岁及以上人口数民族构成汉族人口数少数民族人口数教育程度大学(大专及以上)文化程度人口数高中(含中专)文化程度人口数初中文化程度人口数小学文化程度人口数文盲(15岁及以上不识字)人口数(一)总人口2011年第六次全国人口普查数据显示,总人口数为,比2000年的第五次人口普查的人次,总人口数增加人,增长5.84%,平均年增长率为0.57%。2000年和2011年两次人口普查各省份人口数据如下:地区2000年人口普查2011年人口普查北京市 天津市 河北省 山西省 内蒙古自治区 辽宁省 吉林省 黑龙江省 上海市 江苏省 浙江省 安徽省 福建省 江西省 山东省 河南省 湖北省 湖南省 广东省 广西壮族自治区 海南省 重庆市 四川省 贵州省 云南省 西藏自治区 陕西省 甘肃省 青海省 宁夏回族自治区 新疆维吾尔自治区 全国合计做茎叶图分析:表1-1:案例处理摘要年份案例有效缺失合计N百分比N百分比N百分比人口数量2000年31100.0%00.0%31100.0%2011年31100.0%00.0%31100.0%表1-2描述年份统计量标准误人口数量2000年均值.35.750均值的 95% 置信区间下限.50上限.215% 修整均值.50中值.00方差5744.400标准差.691极小值极大值范围四分位距偏度.503.421峰度-.652.8212011年均值.65.104均值的 95% 置信区间下限.64上限.655% 修整均值.67中值.00方差7588.500标准差.059极小值极大值范围四分位距偏度.625.421峰度-.332.821茎叶图箱形图:(二)流动人口2011年人口普查数据中,居住地与户口登记地所在的乡镇街道不一致且离开户口登记地半年以上的人口为人,同2000年第五次全国人口普查相比,居住地与户口登记地所在的乡镇街道不一致且离开户口登记地半年以上的人口增加人,增长81.03%。(三)城乡构成2011年人口普查显示居住在城镇的人口为人,占49.68%;居住在乡村的人口为人,占50.32%。2000年农村居民人口数为人,占63.08%;城镇居民则有人,占36.92%。同2000年第五次全国人口普查相比,城镇人口增加人,乡村人口减少人,城镇人口比重上升13.46个百分点。通过下面的条形图可以清楚的看到2000年2011年十年间,农村居民减少而城镇居民增加。 (四)性别构成2000年第五次人口普查男性人口为人占51.53%;女性人口为人,占48.47%。2011年第六次人口普查显示男性人口为人,占51.27%;女性人口为人,占48.73%。通过下面的饼图可以放大百分比上些微的变化(两个年份左边较小的部分均为女性人口数),总人口性别比(以女性为100,男性对女性的比例)由2000年第五次全国人口普查的106.74下降为105.20。(五)年龄构成2000年人口普查:0-14岁人口为人,占22.90%;15-59岁人口为人,占66.64%;60岁及以上人口为 人,占10.46%。2011年人口普查:0-14岁人口为人,占16.60%;15-59岁人口为人,占70.14%;60岁及以上人口为人,占13.26%。同2000年第五次全国人口普查相比,0-14岁人口的比重下降6.29个百分点,15-59岁人口的比重上升3.36个百分点,60岁及以上人口的比重上升2.93个百分点,65岁及以上人口的比重上升1.91个百分点。为了进一步分析各年龄段,根据联合国卫生组织的新划分标准将年龄进一步细分,用直方图进行分析。原始数据整理如下: 两次人口普查年龄数据 单位(人)年龄段2000年2011年少儿(014岁)青年(1544岁)中年(4559岁)年轻老年人(6074岁)老年人(7589岁)长寿老人(90岁及以上)利用SPSS软件将六个年龄段分别赋值,1=“少年”,2=“青年”,3=“中年”,4=“年轻老年人”,5=“老年人”,6=“长寿老人”。然后将描述统计量以1300万为一单位分为个体数据,通过直方图显示其分布频数。通过直方图的分布可以得出,两次统计结果显示了相似的正态分布。青年人口数量占有绝对较高的比例。具体看到各个年龄段的人口变化(为了方便陈述,以数值代指各年龄段),年龄段1有较明显的人口数量减少,年龄段2、3、4、5在其原有基础上缓慢增长,年龄段3取代年龄段1变为人口数第二的年龄段。由于年龄段6人口数始终较少,在处理数据过程中其特征无法被放大,2000年年龄段6的频数为0.242,2011年增长到0.496,其增长比例是最为显著的,说明随着社会经济的发展高龄老年人数量逐渐增多。(六)民族构成2000年普查,汉族人口为人,占91.53%;少数民族人口为人,占8.47%。2011年普查,汉族人口为人,占91.51%;各少数民族人口为人,占8.49%。同2000年第五次全国人口普查相比,汉族人口增加人,增长5.74%;各少数民族人口增加人,增长6.92%。(七)教育程度2000年人口普查时,具有大学(大专及以上)文化程度的人口为人;具有高中(含中专)文化程度的人口为人;具有初中文化程度的人口为人;具有小学文化程度的人口为人,文盲人口(15岁及以上不识字的人)为人。2011年,具有大学(大专及以上)文化程度的人口为人;具有高中(含中专)文化程度的人口为人;具有初中文化程度的人口为人;具有小学文化程度的人口为人,文盲人口(15岁及以上不识字的人)为人。同2000年第五次全国人口普查相比,每10万人中具有大学文化程度的由3611人上升为8930人;具有高中文化程度的由11146人上升为14032人;具有初中文化程度的由33961人上升为38788人;具有小学文化程度的由35701人下降为26779人。 用累计频率条形图对教育程度进行进一步分析,类似于年龄构成的数据处理方法,以1000万为单位对各个文化段的人口数进行调整,得出具体的个体值,再利用SPSS软件分别作出两次普查教育程度的累计频率条形图。 从上图可以看到大学(大专及以上)文化程度的人口占比特别低。累计高中以上文化程度为20%不到,累计初中以上文化程度为50%多,累计小学以上文化程度为90%左右。通过简单的相减可以得出结论,占比最大的文化段应该在小学文化程度。另外注意到小学文化程度过后的文盲,占比约有10%。根据2011年人口普查的数据,首先,大学(大专文化及以上)程度人口有显著增长,接近翻倍。其他文化程度(除文盲)也都有所增长,其中累计高中以上文化程度频率约为25%,累计初中以上文化程度频率约65%,累计小学以上文化程度频率约95%。同样可以直观的了解到,占比最大的文化段由小学文化程度移至初中文化程度。最后看到文盲所占比重,相比较十年前,削减了近二分之一。总的来说,对比两次普查,可以很肯定的说十年间我国教育事业取得了较为显著的成绩,国民受教育水平有较大提升。(八)家庭户人口2000年人口普查家庭户人口数共有人,有家庭户,平均每个家庭3.44人。2011年增长到人,平均每个家庭户的人口为3.10人,比2000年减少0.34人。(九)对两次普查人口年龄比例这一指标是否有显著不同的检验。采用配对样本T检验,表1-3和表1-4给出了各自的的均值、标准差、均值标准误差以及两次数据的相关系数,可以看出前后两次统计并没有发生显著的变化。根据表1-5配对样本T检验的最后结果(p0.588>0.05)显示:第六次人口普查和第五次人口普查在人口年龄比例这一指标上没有显著差异。表1-3:两次人口普查三个年龄段(014岁,1559岁,60岁及以上)的描述统计量成对样本统计量均值N标准差均值的标准误对 1第五次人口普查.333.532.779第六次人口普查.673.867.175表1-4:两次人口普查三个年龄段(014岁,1559岁,60岁及以上)数据的相关系数成对样本相关系数N相关系数Sig.对 1第五次人口普查 & 第六次人口普查3.987.102表1-5:配对样本T检验结果成对样本检验成对差分tdfSig. (双侧)均值标准差均值的标准误差分95%置信区间下限上限对 1第五次人口普查 第六次人口普查-.33.55.13-.4.7-.6392.588(十)对两次普查人口教育程度这一指标是否有显著不同的检验。采用配对样本T检验,表1-6和表1-7给出了各自的的均值、标准差、均值标准误差以及两次数据的相关系数,可以看出前后两次统计并没有发生显著的变化。根据表1-8配对样本T检验的最后结果(p0.555>0.05)显示:第六次人口普查和第五次人口普查在教育程度这一指标上没有显著差异。两次人口普查教育程度的描述统计量表1-6:成对样本统计量均值N标准差均值的标准误对 1第五次人口普查.805.130.888第六次人口普查.005.939.040表1-7:成对样本相关系数N相关系数Sig.对 1第五次人口普查 & 第六次人口普查5.920.027表1-8:配对样本T检验结果成对样本检验成对差分tdfSig. (双侧)均值标准差均值的标准误差分95%置信区间下限上限对 1第五次人口普查 第六次人口普查-.20.27.19-.1.69-.6444.555二、一元线性回归分析北京市1995-2015年城镇居民消费性支出与可支配收入的关系1. 问题背景:随着中国经济的高速持续增长,人们生活水平日益提高,作为我国经济文化中心,且经济发展水平位居前列的首都北京,其城镇居民消费水平在这中国经济崛起的二十多年里亦是有着翻天覆地的变化。希望研究北京市城镇居民消费性支出与可支配收入的变化趋势及相关关系,发现其之间的数量关系规律,对居民收入增加,提高居民生活水平的具有重要意义。根据19952015年北京市城镇居民消费性支出与可支配收入的统计数据,建立一元线性回归模型,对其进行回归分析。2. 原始数据:北京市19952015年城镇居民人均可支配收入与消费性支出 单位:元年份可支配收入消费支出1995586850201996688657301997781365321998847269711999918374992000103508494200111578892320021246410286200313883111242004156381220020051765313244200619978148252007219891533020082472516460200926738178932010290731993420113290321984201236469240462013403212627520144391028009201552859366423. 数据分析建立模型:yi=+xi (yi是消费支出,xi是可支配收入)(1)消费支出可支配收入相关系数表2-1相关性可支配收入消费支出可支配收入Pearson 相关性1.997*显著性(双侧).000N2121消费支出Pearson 相关性.997*1显著性(双侧).000N2121*. 在 .01 水平(双侧)上显著相关。从表中可得到两变量之间的皮尔逊相关系数为0.997,双尾检验概率p值尾0.000<0.05,故变量之间显著相关。(2)回归模型检验消费支出与可支配收入的散点图从图上可以直观地看出这两个变量之间存在线性相关关系。消费支出可支配收入相关系数表表2-2模型汇总模型RR 方调整 R 方标准 估计的误差1.997a.994.993686.971a. 预测变量: (常量), 消费支出。结果表明相关系数r=0.997,判定系数R方为0.994,调整 R方为0.993,回归估计的标准差S=686.971,说明样本回归方程的代表性强。表2-3(方差分析表)Anovaa模型平方和df均方FSig.1回归.1491.1493022.658.000b残差.13719.481总计.28620a. 因变量: 可支配收入b. 预测变量: (常量), 消费支出。结果表明:统计量F=3022.658,显著性概率值P<0.001。说明自变量x与y之间确有线性回归关系。表2-4 (回归系数分析表)系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准 误差试用版下限上限1(常量)1792.014284.9556.289.0001195.5982388.431消费支出.623.011.99754.979.000.600.647a. 因变量: 可支配收入从表格中可以看出估计值及其检验结果,0=1792.014, 1=0.623, 1的检验统计量t=54.979,显著性概率值P<0.05,说明1与0有显著性差别,该回归方程有意义。变量的回归系数为0.623,即可支配收入每增加1元,消费支出就增加0.623元。回归方程为y=1792.014+0.623x。4. 分析结论及应用价值通过上面的回归分析,并结合原始数据,可以得出结论:一直以来,北京市城镇居民的消费支出与人均可支配收入是存在正向内在联系的,人均可支配收入与消费性支出存在较强的线性回归关系,通过可决系数R方检验和显著性检验,得出其之间的回归模型方程为:y=1793.014+0.623x,由此可见,城镇居民人均可支配收入是消费性支出的关键所在,因此,可以通过提高城镇居民收入,调整支配格局来改观城镇居民人均消费性支出,从而刺激内需,促进消费,以此带动经济的发展。专心-专注-专业

    注意事项

    本文(统计分析实验报告(共15页).doc)为本站会员(飞****2)主动上传,得力文库 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知得力文库 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于得利文库 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

    © 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

    黑龙江省互联网违法和不良信息举报
    举报电话:0468-3380021 邮箱:hgswwxb@163.com  

    收起
    展开