Page 123 - 高中 信息技术 选择性必修3 数据管理分析
P. 123

 4.4 数据的可视化表达







                         执行结果如图4-27所示。



















                                             广东教育出版社
                                                      图4-27  测试项目得分箱形图


                         从图4-27的执行结果可以直观地得出以下信息:
                         (1)各项目测试中,长跑的平均成绩比较高,而男、女生体能(男生引体向上,女
                    生1分钟仰卧起坐)的平均成绩比较低。

                         (2)肺活量、坐位体前屈、标准分、总分成绩分布比较集中,因为箱子比较短。而
                    50米跑和男、女生体能成绩比较分散。
                         (3)从各个箱形图的中位数和上下四位数的间距也可以看出,肺活量的评分、测试

                    各项得分总和(标准分和总分)成绩分布比较对称。50米跑和男、女生体能成绩分布不
                    平衡,其中50米跑项目,大部分学生分布在80~95分;男、女生体能,大部分学生分布在
                    50~70分。

                         (4)在各项目对应的箱形图中都出现了异常点,各项目按权重计算后得到的标准分
                    和总分的异常点较多。总分中既有分数异常高的学生,也有分数异常低的学生。



                      4 . 4 . 2     数据可视化实例1——回归分析




                         “回归最初”是遗传学中的一个名词,是由英国生物学家兼统计学家高尔顿首先提出

                    来的。他在研究人类的身高时,发现高个子回归于人口的平均身高,而矮个子则从另一个
                    角度回归于人口的平均身高。回归分析是研究自变量与因变量之间关系形式的分析方法,
                    它主要是通过建立因变量Y与影响它的自变量X (i=1,2,3,…)之间的回归模型,来预测因
                                                                     i
                    变量Y的发展趋势。
                         1.回归分析的步骤
                         回归分析基于对数据的观测,建立变量间适当的依赖关系,以分析数据内在规律。回
                    归分析是应用极其广泛的数据分析方法之一,多用于预报、控制问题。回归分析的基本步

                    骤如图4-28所示。





                                                                                                                    115115







          5Z343.indd   115                                                                                          2019/4/1   10:06:06
   118   119   120   121   122   123   124   125   126   127   128