Page 126 - 高中 信息技术 必修1 数据与计算
P. 126

第五章  数据处理和可视化表达







                           运用贝叶斯定理对事物进行分类,是一种非常有效的思维方法,是贝叶斯决策理论方
                      法的基本思想。例如,假设有一个数据集,由两类组成,且已知每个样本的分类,数据分
                      布如图5-11所示。用p (x,  y)表示数据点(x,  y)属于红色一类的概率,用p (x,  y)表示数据点(x,  y)
                                             1
                                                                                              2
                      属于蓝色一类的概率。












                                             广东教育出版社









                                                             图5-11  数据分布
                           那么如何判断对于一个新的点C(x,  y)属于红色还是蓝色类别呢?通常人们会按以下步

                      骤解答这个问题:
                           (1)求新的点C(x,  y)属于红色一类的概率p (x,  y)。
                                                                       1
                           (2)求新的点C(x,  y)属于蓝色一类的概率p (x,  y)。
                                                                       2
                           (3)选择概率高的一类作为新点C(x,  y)的分类。即如果p (x,  y)>p (x,  y),则C(x,  y)为红色
                                                                                     1
                                                                                             2
                      一类;如果p (x,  y)<p (x,  y),则C(x,  y)为蓝色一类。
                                   1
                                           2
                           同样,若有多个分类,而要求新点属于哪一类,只需求出新点在所有类别中概率最大
                      的一类。这就是贝叶斯决策理论的核心思想,即选择具有最高概率的决策。



                               项目实施



                           各小组根据项目选题及拟订的项目方案,结合本节所学知识,完成相应的数据分析。

                           1.  采用适当的方法完成相应项目选题的数据分析工作。
                           2.  总结和归纳数据分析的方法和步骤。



                          5.4              数据的可视化表达









                           在大数据时代,复杂繁多且不同类型的数据大量涌来,往往超出了人们的处理能力,
                      人类的大脑也难以从堆积如山的数据中快速发现核心问题,而数据可视化可以把枯燥乏味

             118 118







            9      ֻ໴ᅣ JOEE
   121   122   123   124   125   126   127   128   129   130   131