Page 72 - 高中 信息技术 选择性必修4 人工智能初步
P. 72

第三章  机器学习与人工智能的核心算法







                      组。在互联网应用上,聚类分析常被用来进行文档归类以修复信息。在电子商务领域,聚
                      类分析在网站建设的数据挖掘中产生了重要作用,通过聚类具有相似浏览行为的客户和分析
                      客户的共同特征,可以更好地帮助电子商务的商家了解自己的客户,从而向客户提供更合适

                      的服务。



                        3 . 3 . 1   系统聚类算法





                               探究活动
                                             广东教育出版社

                           调 查

                           围绕以下问题,展开调查,分小组进行汇报。
                           (1)调查在日常生活中的哪些情境下,可以使用聚类分析的思维解决问题。

                           (2)通过网络搜索和文献查找的方式,了解聚类算法的基本原理,搜集聚类算法在
                      人工智能领域的典型应用案例。



                           聚类是最常用的数据分析技术之一。与其相关的各种算法的提出、发展和演化,使得
                      聚类算法家族“人丁兴旺”。聚类算法很难简单地进行分类,因为这些类别可能相互重
                      叠,有的算法甚至具有几种类别的特点。一般而言,主要的基本聚类算法可以划分为如下

                      几类:
                           1.  划分方法
                           大部分划分方法(Partitioning Methods)通过度量数据之间的距离进行聚类。该方法根

                      据需要划分的簇数k,先创建一个初始划分,然后采用迭代计算,把对象从一个簇移动到
                      另一个簇来改进划分。好的划分准则是:同一个簇中的对象尽可能相互“接近”或相似,
                      不同簇中的对象尽可能“远离”或不同。为了达到全局最优,基于划分的聚类可能需要穷
                      举所有的划分,计算量极大。实际上,大多数划分方法的实现都采用了启发式方法,如

                      K-Means和K-Medoids算法,渐进地提高聚类质量,逼近局部最优解。这些启发式聚类方
                      法很适合发现中小型数据库中的球状簇。若要发现复杂形状的簇和对超大型数据集进行聚
                      类,就需要进一步扩展划分方法。

                           2.  层次方法
                           根据层次分解的形式不同,层次方法(Hierarchical Methods)又可以分为凝聚层次聚
                      类和分裂层次聚类。

                           (1)凝聚层次聚类:又叫自底向上方法。一开始将每个对象作为同一类,然后与其相
                      近的对象或类合并,直到所有小的类别合并成一个类,或者收敛,即满足终止条件为止。
                           (2)分裂层次聚类:又叫自顶向下方法,一开始将所有对象置于一个簇中,在迭代

                      的每一步中,类会被分裂成更小的类,直到最终每个对象在一个单独的类中,或者收敛,
                      即满足终止条件为止。
              64  64







          21Y3228.indd   64                                                                                        2019/10/10   14:23:55
   67   68   69   70   71   72   73   74   75   76   77