Page 123 - 高中 信息技术 选择性必修3 数据管理分析
P. 123
4.4 数据的可视化表达
执行结果如图4-27所示。
广东教育出版社
图4-27 测试项目得分箱形图
从图4-27的执行结果可以直观地得出以下信息:
(1)各项目测试中,长跑的平均成绩比较高,而男、女生体能(男生引体向上,女
生1分钟仰卧起坐)的平均成绩比较低。
(2)肺活量、坐位体前屈、标准分、总分成绩分布比较集中,因为箱子比较短。而
50米跑和男、女生体能成绩比较分散。
(3)从各个箱形图的中位数和上下四位数的间距也可以看出,肺活量的评分、测试
各项得分总和(标准分和总分)成绩分布比较对称。50米跑和男、女生体能成绩分布不
平衡,其中50米跑项目,大部分学生分布在80~95分;男、女生体能,大部分学生分布在
50~70分。
(4)在各项目对应的箱形图中都出现了异常点,各项目按权重计算后得到的标准分
和总分的异常点较多。总分中既有分数异常高的学生,也有分数异常低的学生。
4 . 4 . 2 数据可视化实例1——回归分析
“回归最初”是遗传学中的一个名词,是由英国生物学家兼统计学家高尔顿首先提出
来的。他在研究人类的身高时,发现高个子回归于人口的平均身高,而矮个子则从另一个
角度回归于人口的平均身高。回归分析是研究自变量与因变量之间关系形式的分析方法,
它主要是通过建立因变量Y与影响它的自变量X (i=1,2,3,…)之间的回归模型,来预测因
i
变量Y的发展趋势。
1.回归分析的步骤
回归分析基于对数据的观测,建立变量间适当的依赖关系,以分析数据内在规律。回
归分析是应用极其广泛的数据分析方法之一,多用于预报、控制问题。回归分析的基本步
骤如图4-28所示。
115115
5Z343.indd 115 2019/4/1 10:06:06