Page 126 - 高中 信息技术 必修1 数据与计算
P. 126
第五章 数据处理和可视化表达
运用贝叶斯定理对事物进行分类,是一种非常有效的思维方法,是贝叶斯决策理论方
法的基本思想。例如,假设有一个数据集,由两类组成,且已知每个样本的分类,数据分
布如图5-11所示。用p (x, y)表示数据点(x, y)属于红色一类的概率,用p (x, y)表示数据点(x, y)
1
2
属于蓝色一类的概率。
广东教育出版社
图5-11 数据分布
那么如何判断对于一个新的点C(x, y)属于红色还是蓝色类别呢?通常人们会按以下步
骤解答这个问题:
(1)求新的点C(x, y)属于红色一类的概率p (x, y)。
1
(2)求新的点C(x, y)属于蓝色一类的概率p (x, y)。
2
(3)选择概率高的一类作为新点C(x, y)的分类。即如果p (x, y)>p (x, y),则C(x, y)为红色
1
2
一类;如果p (x, y)<p (x, y),则C(x, y)为蓝色一类。
1
2
同样,若有多个分类,而要求新点属于哪一类,只需求出新点在所有类别中概率最大
的一类。这就是贝叶斯决策理论的核心思想,即选择具有最高概率的决策。
项目实施
各小组根据项目选题及拟订的项目方案,结合本节所学知识,完成相应的数据分析。
1. 采用适当的方法完成相应项目选题的数据分析工作。
2. 总结和归纳数据分析的方法和步骤。
5.4 数据的可视化表达
在大数据时代,复杂繁多且不同类型的数据大量涌来,往往超出了人们的处理能力,
人类的大脑也难以从堆积如山的数据中快速发现核心问题,而数据可视化可以把枯燥乏味
118 118
9 ֻᅣ JOEE